You are on page 1of 159

Sveuilite u Zagrebu

Filozofski fakultet
Ivana Luia 3
Zagreb

Koraljka Golub

PREDMETNO PRETRAIVANJE U KNJININIM


KATALOZIMA S WEB-SUELJEM

MAGISTARSKI RAD

Zagreb, 2003.

Najsrdanije zahvaljujem svojoj voditeljici, profesorici dr. sc. Jadranki Lasi-Lazi,


na svoj pomoi.
Takoer zahvaljujem profesorici dr. sc. Danieli ivkovi na pruenoj podrci.
Posebno zahvaljujem profesorici dr. sc. Tatjani Aparac-Jelui na svim sugestijama
i savjetima.

U Zagrebu, lipnja 2003.

Koraljka Golub

Uvod
U dananje doba globalnog informacijskog povezivanja javno dostupni online
knjinini katalozi imaju kljunu ulogu. Korisnicima s pristupom na Internet
omoguuju stalan pristup informacijama o grai koju knjinica posjeduje, kao i
odreenim jedinicama mjesno ili daljinski dostupne elektronike grae. Istraivanja
pokazuju da, kako bi ovim informacijama i grai pristupili, korisnici online
knjininih kataloga najee obavljaju predmetna pretraivanja, kojima otkrivaju i
pronalaze jedinice grae na odreenu temu. Meutim, ova vrsta pretraivanja
ujedno je i najmanje uspjena.
Korisnici esto na upit vezan uz pretraivanje po predmetu dobiju previe ili
premalo relevantnih rezultata i ne trude se preoblikovati upit i ponoviti
pretraivanje. Stoga se ovim radom namjeravaju problematizirati dosadanja sporna
pitanja i postojei odgovori na njih u obliku predloenih rjeenja, te kritiki
promotriti obiljeja predmetnog pretraivanja kataloga s web-sueljem sveuilinih
knjinica Velike Britanije u usporedbi s hrvatskima. U Hrvatskoj se mali broj
strunjaka bavi pretraivanjem, a posebice predmetnim pretraivanjem1 pa se ovim
radom ele podastrijeti odreena rjeenja te potaknuti daljnja istraivanja.
Budui da su izrasli iz kataloga na listiima, online katalozi zadrali su vie
ili manje osnovna svojstava tradicionalnih kataloga, istodobno ne uvaavajui
prednosti raunalnog povezivanja i hipertekstualnog medija. Knjinini katalozi s
web-sueljem imaju velik potencijal za pruanje brojnih mogunosti, od samog
sadraja kataloga (bibliografski zapisi, daljinski dostupna graa, potpuni tekstovi i
dr.) do oblikovanja korisniki pristupanih suelja (prozori, sliice, povlani
izbornici i dr.) te stoga mogu utjecati na rjeavanje nekih od problema na koje
korisnici nailaze pri predmetnom pretraivanju. Katalozi s web-sueljem ubrajaju se
u tzv. treu generaciju online knjininih kataloga u ija obiljeja spadaju
mogunost raznolikih pretraivanja, datoteke predmetnih preglednih katalonih
jedinica, tezaurusi, mogunosti prebiranja (browsing), automatskog kraenja i
ispravljanja pogreaka u pisanju, oblikovanje upita prirodnim jezikom bez potrebe
za koritenjem sloene sintakse, podravanje vee interakcije s korisnikom i
osiguravanje pomoi pri prevoenju pojmova iz upita na rjenik koriten u katalogu,

Usp. Slavi, A.; Turkulin, B. Predgovor. // Vjesnik bibliotekara Hrvatske, 1-4, 44(2001). Str. XX.

preoblikovanje upita pri neuspjenom pretraivanju i ispis rezultata prema slinosti s


upitom ili prema relevantnosti. Meutim, istraivanja pokazuju da su zapravo rijetki
WebPAC-i online katalozi tree generacije u pravom smislu te rijei, sa svim
njihovim obiljejima, ve da se od prole dvije generacije razlikuju jedino po tome
to im se moe pristupiti s Mree.
Predmetno pretraivanje sintagma je koja se u kontekstu ovoga rada odnosi
na naine na koje se podacima o jedinicama grae u katalogu moe pristupiti na
temelju njihovih sadrajnih obiljeja. Temelji se na terminologiji kakvu rabi M.
Mikai (1990) govorei o predmetnoj obradi, iako se u hrvatskom jeziku rabe i
druge sintagme vezane uz sadraj jedinica grae2. Kljune sastavnice ovoga procesa
u raunalnom okruenju su pristupnice (access points) poput klasifikacijskih
oznaka, predmetnih odrednica, deskriptora i rijei iz naslova. Takve pristupnice koje
omoguavaju pronalaenje jedinica grae na temelju njihova sadraja nazivaju se
predmetnim pristupnicama (subject access points).
Sintagma knjinini katalozi s web-sueljem hrvatska je inaica dviju
engleskih sintagmi, web-based online public access catalog i web online public
access catalog, koje se odnose na knjinine kataloge kojima se pristupa putem
Mree (World Wide Web). U literaturi se umjesto ovih sintagmi rabe i akronimi
Web OPAC, Web-OPAC i WebPAC, a, kao to istie A. Barbari (2002, str. 1),
WebPAC je najprimjereniji jer Web- podrazumijeva online pristup koji predstavlja
slovo O u akronimu Web OPAC, pa je O suvino. U engleskoj se literaturi
zapravo najee nailazi na skraene sintagme online library catalog, web-based
catalog, web catalog. Sintagma online knjinini katalog u ovome e se radu
koristiti kao nadreeni pojam za online kataloge, bilo da se radi o web-suelju ili
ne.3

Ispitivanjem sadraja bavi se vie disciplina, naroito tekstologija i teorija informacija. U tim je
disciplinama uveden naziv analiza sadraja, (content analysis), ili analiza teksta, to znai dublju i
svestraniju analizu smisla teksta. Zato je bolje da u bibliotekarskoj struci pored uopenog naziva
sadrajna obradba dokumenta vie upotrebljavamo naziv predmetna obradba dokumenta ili
predmetna obradba teksta, (subject analysis) (Mikai 1990, str. 25). Ovaj se navod odnosi na
pojmovni sadraj dokumenta, odraen u stvarnim knjininim katalozima. Stvarni katalog vii je
rodni pojam za struni katalog i predmetni katalog.
3
Online Public Access Catalogue (online katalog s javnim pristupom). Katalog knjinice ili
informacijskog centra korisnicima dostupan online putem, koji veinom prua niz dodatnih usluga
poput informacije o statusu dostupnosti grae, online rezervacija, i knjininih novosti. S nestankom
kataloga na listiima, nestala je potreba da se naglaava online s javnim pristupom pa se danas o
ovoj vrsti kataloga jednostavno govori samo kao o katalozima. (Online Public Access Catalogue.
// Harrod's librarians' glossary and reference book, 2000)

U veem dijelu rada o predmetnom se pretraivanju govori u kontekstu


online knjininih kataloga openito, i to iz tri razloga. Prvo, o predmetnom
pretraivanju u online katalozima puno se istraivalo i pisalo prije nastanka
WebPAC-a. Osim toga, veina naela koja su se pokazala korisnima za funkcije
predmetnog pretraivanja prvih online kataloga mogu se primijeniti i na WebPAC-e.
Trei razlog odnosi se na to da se WebPAC-i u funkcijama predmetnog
pretraivanja od prethodne dvije generacije razlikuju samo po tome to im se moe
pristupiti s Mree.
Prvo poglavlje osvrnut e se na predmetno pretraivanje kao zadau
knjininog kataloga i na pretpostavke za predmetno pretraivanje u bazi podataka
raunalnog kataloga.
Razvojem predmetnog pretraivanja u online katalozima i prednostima u
odnosu na tradicionalne kataloge bavit e se drugo poglavlje.
Idue poglavlje osvrnut e se na problematiku predmetnog pretraivanja, na
dosadanje pristupe i rjeenja postojeih pitanja.
Budui da se korisniki sustavi trebaju temeljiti na potrebama i ponaanju
svojih korisnika, u etvrtom e se poglavlju prikazati kako se korisnici slue
predmetnim pretraivanjem u online knjininim katalozima, koji su problemi s
kojima se susreu te koja su njihova oekivanja.
U petom poglavlju opisat e se razliite vrste predmetnih pristupnica i
predstaviti obiljeja prirodnih i kontroliranih jezika za oznaivanje i pretraivanje te
utjecaj tih obiljeja na predmetno pretraivanje. Predstavit e se i tehnike
pretraivanja iz podruja informacijskog pretraivanja (information retrieval4), koje
se nedostatno primjenjuju u predmetnom pretraivanju WebPAC-a.
esto poglavlje obrauje interakciju korisnika s katalogom s naglaskom na
sintaksu postavljanja upita, to obuhvaa razne operatore, oblike kraenja,
oblikovanje upita, prebiranje i rangiranje rezultata.
U iduem poglavlju prikazat e se pitanja vezana uz oblikovanje suelja
online knjininog kataloga za predmetno pretraivanje, u koja se ubrajaju pitanja
dizajna, pristupanosti suelja, osiguravanja pomoi i uputa te viejezinosti.
4

Information retrieval (informacijsko pretraivanje). Traenje i pronalaenje informacija u


raunalnom spremitu, prve metode obuhvaale su klasificiranje i katalogiziranje i pretraivanje baza
podataka raznim mehanikim tehnikama. Elektronike metode danas su zamijenile ove sustave pa se
suvremeno pretraivanje temelji na traenju u bazama podataka s potpunim tekstom, bibliografskim
bazama podataka i dostavi dokumenata putem mree. (Information retrieval. // Harrod's librarians'
glossary and reference book, 2000)

Osmo poglavlje izdvojit e specifinosti predmetnog pretraivanja vezane uz


WebPAC-e.
Predmetno pretraivanje vrlo je vano znanstvenom i nastavnom osoblju te
studentima, koji provode istraivanja na odreenu temu. Zbog toga je istraivanje u
okviru ovoga rada usmjereno prvenstveno na sveuiline knjinice, a opisano je u
devetom poglavlju. Na temelju istraivanja i evaluacije dosadanjih pristupa izdvojit
e se elementi i metodologija oblikovanja predmetnog pretraivanja primjerenog
korisnicima WebPAC-a u hrvatskoj akademskoj zajednici.

1. Osnovne pretpostavke predmetnog pretraivanja u


online knjininim katalozima

1.1. Predmetno pretraivanje kao zadaa knjininog kataloga


Predmetno pretraivanje kao zadau knjininog kataloga navodi jo 1876. godine
C. Cutter u svojim Pravilima za ukrteni katalog i to u sljedee dvije zadae: 1.
omoguiti pronalaenje knjige za koju korisnik poznaje autora, naslov ili predmet
(subject), te 2. pokazati to knjinica od odreenog autora, o odreenom predmetu i
odreenoj vrsti literature posjeduje (Cutter 1948, str. 12).
Budui da korisnici ne moraju uvijek znati ime autora ili naslov jedinice
grae5 koju trae, potrebno je osigurati mogunost pronalaenja grae i po sadraju.
Stvarni knjinini katalozi na listiima pruaju informacije o grai iz odreenog
strunog podruja (struni katalozi) te o odreenom predmetu (predmetni katalozi6).
Postoje i ukrteni ili rjeniki katalozi (dictionary catalog), koje je u amerike
knjinice uveo C. Cutter, a sastoje se od abecednog i predmetnog niza. U
elektronikom okruenju svi ovi katalozi, ukljuujui, dakako, i formalne i mjesne
kataloge, srastaju u jedinstveni katalog pa se pretraivanje moe obavljati po svim
elementima, odnosno poljima katalonog zapisa (po autoru, naslovu, predmetu,
signaturi itd.).
Mnoga istraivanja pokazuju da predmetno pretraivanje u online katalozima
dominira ostalim vrstama pretraivanja. Veina dananje literature o koritenju
online kataloga temelji se na studiji amerikoga Savjeta za knjinine izvore
(Council on Library Resources CLR) iz ranih 1980-ih, u kojima je sudjelovalo
vie od 12.000 online korisnika iz dvadeset i devet knjinica sa sedamnaest razliitih
online kataloga (Lombardo, Condic 2000; Olson, Boll 2001, str. 2). To je
istraivanje pokazalo da najvie korisnika pretrauje po predmetnim pristupnicama,
i to najvie po kljunim rijeima. D. Slone (2000, str. 757), nakon to je prouila
rezultate istraivanja raznih autora, istie da su pretraivanja po autoru i naslovu
5

Termin jedinica grae koristit e se iskljuivo u kontekstu knjininih kataloga, dok e se sinonim
dokument rabiti kada se govori openito o informacijskim sustavima za pretraivanje, ukljuujui
knjinine kataloge.
6
Kao to je napomenuto u Uvodu, sintagma predmetno pretraivanje odnosi se na sve vrste
pristupnica koje oznauju sadraj, a nije ograniena na pristupnice predmetnog kataloga.

najea meu korisnicima kataloga na listiima i prvih online knjininih kataloga,


a da korisnici provode vie predmetnog pretraivanja u online katalozima nego u
katalozima na listiima. Na osnovi tih rezultata mogue je zakljuivati o tome da je
predmetno pretraivanje nadasve korisno i poeljno.
Godine 1997. IFLA7-inom studijom Funkcionalni zadaci bibliografskih
zapisa (Functional Requirements for Bibliographic Records FRBR) zadae se
kataloga nastoje prilagoditi raunalnom okruenju. Pritom, katalog se vie ne
promatra kao niz bibliografskih zapisa, ve kao mrea povezanih informacija. Kako
bi se informacije sadrane u katalonim zapisima prilagodile potrebama njihovih
korisnika, oblikovan je model bibliografske baze entitet-odnos i odreene su tri
skupine entiteta. Prva skupina obuhvaa djelo (work), izraz (expression),
manifestaciju (manifestation) i pojedinani primjerak (item), tj. podatke koji su
tradicionalno dio bibliografskog zapisa; druga skupina sastoji se od osoba i
korporativnih tijela odgovornih za intelektualni i umjetniki sadraj, proizvodnju,
diseminaciju ili vlasnitvo entiteta iz prve skupine (tzv. bibliografski entiteti); a
treu skupinu (tzv. predmetni entiteti) sainjavaju elementi koji se odnose na
sadrajnu obradu: pojam (concept), predmet (object), dogaaj (event) i mjesto
(place). Svi ovi elementi proizali su iz Meunarodnih standarda za bibliografski
opis (International standard bibliographic description ISBD), Prirunika za
UNIMARC (UNIMARC manual), Smjernica za izradu preglednih katalonih
jedinica i uputnica (Guidelines for authority and reference entries GARE) i
Smjernica za izradu predmetnih preglednih katalonih jedinica i uputnica
(Guidelines for subject authority and reference entries GSARE). (Buzina 2000;
Functional requirements for bibliographic records 1998; Kati 2001; Riesthuis,
Zumer 2002).
Valja istaknuti da i entiteti iz prve i druge skupine mogu biti predmet djela.
Jedan od problema pretraivanja jest taj to esto nije lako napraviti jasnu razliku
izmeu formalne i sadrajne obrade jer korisnik moe koristiti iste pristupnice za
traenje poznate mu manifestacije i manifestacije o odreenoj temi. Poznati je
primjer ime osobe kao kljuna rije, kojim se pretraivanjem dobivaju i
manifestacije djela kojima je ta osoba autor i manifestacije djela o toj osobi
(Riesthuis, Zumer 2002, str. 170).
7

Meunarodno udruenje knjininih drutava i ustanova (International Federation of Library


Assocations and Institutions IFLA).

Prema studiji FRBR, pretraivanje se ne ograniava samo na autora, naslov i


na predmet. Bibliografske baze podataka trebale bi osigurati pristup po svim
obiljejima vanim za pronalaenje, dakle po svim obiljejima bibliografskih
entiteta djela, izraza, manifestacija i pojedinanih primjeraka, uz pristup datotekama
preglednih katalonih jedinica i uputnica te datotekama predmetnih preglednih
katalonih jedinica i uputnica. Ove datoteke trebale bi omoguiti korisniku da
pronae ispravan oblik pristupnica posebno pri problematinim sluajevima poput
klasifikacijskih oznaka i pristupnica za autora i za naslov, za koje postoji dvije ili
vie varijanti. Kvaliteta modela predloenog u studiji FRBR moi e se bolje
sagledati nakon to se izradi studija koja e ista naela primijeniti i na pregledne
katalone jedinice i uputnice, ime se danas bavi IFLA-ina Radna grupa za
funkcionalne zadatke i obrojavanje preglednih katalonih jedinica (Working Group
on Functional Requirements and Numbering for Authority Records FRANAR)
(Chen, Lin, Chen 2002; Riesthuis, Zumer 2002).

1.2. Organizacija i struktura baze podataka


Baza podataka online kataloga sastoji se od nekoliko datoteka, od kojih su za
predmetno pretraivanje posebno vane bibliografska datoteka, datoteka predmetnih
preglednih katalonih jedinica i uputnica, te invertirana datoteka.
Bibliografska datoteka sastoji se od bibliografskih zapisa, surogata koji
predstavljaju izvornu jedinicu grae, bilo da se ona nalazi u knjinici ili negdje na
Mrei. Svaki je zapis kodiran, a meunarodni format za kodiranje elektronikih
bibliografskih zapisa, odnosno za strojno itljivo katalogiziranje jest format MARC
(MAchine Readable Cataloging). Postoje razliite inaice formata MARC8, kao,
primjerice, UNIMARC, koji se koristi i u Hrvatskoj, ili ameriki MARC 21, koji je
nedavno naslijedio USMARC i britanski UKMARC.
Polja u zapisima formata MARC koja sadre podatke o sadraju jesu
sljedea: 6XX, za termine iz kontroliranih rjenika; polja od 050 do 088, za
klasifikacijske oznake i signature; te veina polja izmeu 2XX i 5XX, predviena za
8

Kada se u tekstu koristi samo kratica MARC, ona predstavlja generiki naziv za sve njegove
inaice.

potencijalne kljune rijei za pretraivanje (Olson, Boll 2001, str. 12-13). U poljima
iz niza 6XX koja sadre predmetne odrednice postoji kd sustava, popisa
predmetnih odrednica ili tezaurusa, iz kojeg je termin preuzet (npr. Library of
Congress Subject Headings LCSH). U UNIMARC-u9 su predmetne odrednice i
klasifikacijske oznake u poljima 675-686, signatura je u 990, a interna lokacija
dokumenta u 992. Od ostalih polja u zapisu formata MARC po kojima se moe
pretraivati po kljunim rijeima najvanija su ona za naslove i napomene. esto
naslovi sadre termine koji su vrlo specifini i nisu obuhvaeni kontroliranim
sustavom termina, a slino je i s napomenama, poput napomene o sadraju (u
UNIMARC-u polje 327, a u MARC-u 505) i napomene za kratak sadraj ili sinopsis
(u UNIMARC-u polje 330, a u MARC-u 520).
Polja koja sadre klasifikacijske oznake i signature, tvrde H. Olson i J. Boll
(2001, str. 14), dobit e na popularnosti kada se uvidi prednost knjininih
klasifikacijskih sustava nad klasifikacijama koje koriste mrene web-trailice. No,
valja imati na umu da oni govore s amerikog stajalita, gdje katalona tradicija, za
razliku od europske, u pravilu nije rabila klasifikacijske sustave za pretraivanje,
ve prvenstveno za izradu signatura i smjetaj grae na policama.
Datoteka predmetnih preglednih katalonih jedinica i uputnica sadri
standardizirane oblike predmetnih odrednica, njihove sinonime i srodne, ire i ue
termine pa je ova datoteka, moe se kazati, elektronika inaica kontroliranog
rjenika (Olson, Boll 2001, str. 117). Od 1998. postoji i format za klasifikacijske
oznake u MARC-u 21 (MARC 21 concise format for classification data 2002), dok
je format za klasifikacijske oznake u UNIMARC-u jo u razvoju.
Invertirane datoteke su one koje sustav oblikuje automatski, tako da se
pojedinana polja, potpolja ili rijei stavljaju u posebnu datoteku. Invertirane
datoteke pospjeuju uinkovito pretraivanje, a pri oblikovanju knjininih sustava i
invertiranih datoteka postavljaju se sljedea pitanja: od kojih e se polja i potpolja
oblikovati invertirane datoteke, odvajanje datoteka za pretraivanje po kljunim
rijeima i po predmetnim odrednicama, hoe li se invertirane datoteke sastojati
samo od rijei ili i od izraza te to e sve ukljuivati stop-lista (Olson, Boll 2001, str.
24).

Usp. Mikai, M. Teorijske osnove sustava za predmetno oznaivanje. Zagreb : Hrvatsko


bibliotekarsko drutvo, 1996. Str. 383-385.

10

to se tie ukljuivanja potpunog teksta jedinica grae u katalonu bazu,


postoje razliita miljenja. Obraujui pitanja vezana uz mogunosti pretraivanja
potpunih tekstova (full-text retrieval), A. Barbari (2002, str. 43) ukazala je na to da
je poeljno da takva pretraivanja budu primjenjiva samo na dio grae, dok bi ostala
graa bila dostupna samo po uobiajenim pristupnicama, te da bi ipak primjerenije
bilo da katalog samo osigurava pristup potpunom tekstu jedinica grae.
U globalnom mrenom okruenju i distribuiranim digitalnim knjinicama,
gdje granice izmeu online kataloga, baza podataka i mrenih izvora nestaju, a
koriste se razliiti propisi za obradu informacijskih izvora, posljednjih se nekoliko
godina u literaturi predstavljaju prijedlozi i pokuaji modela primjene novih formata
zapisa, a samim time i nove strukture baza podataka (vidi, npr., Willer 2000). Tako
se navodi da formati MARC onemoguavaju ostvarivanje potencijalnih mogunosti
koje nudi mreno okruenje, koje se znatno razlikuje u usporedbi s mogunostima
kakve su postojale u katalozima dostupnim na lokalnim mreama ili putem telneta.
SGML (Standard Generalized Markup Language standardni jezik za prikazivanje
dokumenta) i njegova jednostavnija inaica XML (eXtensible Markup Language
proirljivi jezik za prikazivanje dokumenata), omoguavaju pretraivanje samih
jedinica grae i njihovih dijelova, pregledavanje bibliografskih zapisa u webpreglednicima (browser), web-trailicama (search engine) i knjininim sustavima
bez potrebe za konverzijom formata (vidi, npr., Oritz-Repiso, Moscoso 1999). XML
se u pojedinim sustavima koristi i kao format za kontrolirane rjenike, a njegova
obiljeja omoguuju da se putem jednog suelja pristupi razliitim kontroliranim
rjenicima (vidi, npr., Chaudiron, Ihadjadene, Role 2002).
U strunim se krugovima podosta raspravlja i o potrebi prilagodbe
katalogizacijskih pravila i strukture kataloga, jer su postojea pravila i struktura
samo preslikani na raunalni katalog, a nisu prilagoeni mrenom okruenju
(Fattahi 1995; Ayres 1999). Novi model bibliografske baze opisan je u studiji
FRBR, koja se temelji na novom okruenju i na naelima oblikovanja relacijskih
baza podataka. Bibliografska baza sastoji od mree spojenih zapisa, npr. zapis za
djelo povezan je sa zapisima za izraze toga djela i zapisima za manifestacije u
kojem postoji jedan ili vie izraza. Svaki od ovih zapisa moe se spojiti s jednim ili
vie zapisa iz datoteka preglednih katalonih jedinica i uputnica, iz kojih se svaki
pak moe povezati s nekoliko zapisa za bibliografske jedinice. Na ovaj nain

11

mogua je navigacija od zapisa do zapisa, meu razliitim datotekama (Riesthuis,


Zumer 2002; Chen, Lin, Chen 2002).
Govorei o budunosti MARC-a, H. Olson i J. Boll (2001, str. 15) tvrde da
ranije

navedena

polja

predstavljaju

golemu

fleksibilnost

predmetnom

pretraivanju, te da je teko zamisliti da postoji neka vrsta informacije o sadraju


koja se ne bi mogla obuhvatiti ovim formatom. Poboljanja koja oni smatraju
potrebnima jesu kvalitetnije klasificiranje i mogunost pretraivanja po pojedinim
fasetama.
Metapodaci mogu jedini ugroziti format MARC jer se rabe i ugrauju u
sve vei broj elektronikih informacijskih izvora dostupnih na Mrei. Meutim,
nema velike konceptualne razlike izmeu metapodataka i bibliografskih zapisa i
jedni i drugi su podaci o podacima10. Osnovni problem s metapodacima jest da su se
oni do sada najmanje bavili sadrajnim pristupom informacijama. Ipak, nude
mogunosti za standardizirani prikaz raznolikijih informacijskih izvora, i to u puno
irem kontekstu no to to moe dananja katalogizacijska praksa. Postojei
kontrolirani rjenici mogu se primijeniti za poboljanje sadrajnog pristupa
informacijama metapodataka u budunosti. Osim toga, veliki su izgledi da se
granice izmeu katalonih podataka i metapodataka pomute zbog dananje
tendencije povezivanja online kataloga s elektronikim kazalima asopisa i bazama
podataka te zbog sve veeg broja online kataloga na Mrei (Olson, Boll 2001, str.
15). Ve postoje alati za prijenos iz metapodataka poput Dublinske jezgre (Dublin
Core) u MARC i obrnuto, a razvijaju se u okviru projekta CORC (Cooperative
Online Resource Catalog) amerikog OCLC-a (Online Computer Library Center)
zapisi se mogu importirati ili eksportirati u nekom od postojeih formata. Budunost
e pokazati hoe li se format MARC samo mijenjati, ili e ga se napustiti i
zamijeniti nekim drugim formatom.

10

MARC zapravo spada u istu kategoriju kao i SGML, HTML i XML, dakle u standarde za
kodiranje elemenata u strojnoitljiv oblik, a od njih se razlikuje po tome to je specijaliziran za
knjininu grau. Za razliku od ovih standarda, standardi metapodataka propisuju elemente koji e
biti ukljueni u surogat (kao to je kataloni zapis u katalogu).

12

2. Razvoj i pristupi problematici predmetnog pretraivanja


online knjininih kataloga

2.1. Prednosti i nedostaci online kataloga u odnosu na kataloge na


listiima u predmetnom pretraivanju
Jo 1984. A. Seal uoava da je jedna od najvanijih prednosti online kataloga nad
tradicionalnima interaktivnost koja utjee na pretraivanje openito, pa tako i na
predmetno pretraivanje. Primjerice, katalog moe korisniku pokazati koje mu
mogunosti pretraivanja stoje na raspolaganju, ispravljati pogreke, predlagati
alternative jedinice grae koje mogu odgovarati kriterijima pretraivanja i voditi
korisnika kroz dugo pretraivanje.
Dok se u katalogu na listiima okupljanje i pretraivanje jedinica grae na
istu temu postie u stvarnim katalozima, u online okruenju za predmetno
pretraivanje postoji vie mogunosti. Tako u online katalogu postoje dodatne
pristupnice (kljune rijei po razliitim poljima), manipuliranje i kombiniranje
podataka na mnogo novih naina (operatori, kraenje, istodobno pretraivanje po
vie polja zapisa te suavanje opsega pretraivanja (jezik, vrsta grae, godina
izdavanja itd.).
Online katalozi za razliku od kataloga na listiima omoguuju da se
korisniku prui pomo na nekoliko razina i naina. Sustav moe odgovoriti na
korisnikove probleme i pomoi mu da donese odluku o tome to dalje uiniti da
dobije bolje rezultate (Crawford 1992, str. 67). Meutim, u online okruenju
korisnici su zapravo preputeni sami sebi pa je kvalitetna pomo u obliku uputa
neophodna. Istraivanja, meutim, pokazuju da dananji sustavi za pomo i upute
nisu dovoljno usavreni.
U odnosu na katalog na listiima, u online katalogu naelno je nii prag
tolerancije pogreaka, bilo da se radi o pogreki katalogizatora ili korisnika. Zbog
toga je potrebno razvijati sustave koji omoguuju prebiranje, prepoznaju pogreke i
korisniku nude pomo.
Iako su prednosti online kataloga nad katalozima na listiima u predmetnom
pretraivanju mnogobrojne, ta su svojstva u dananjim katalozima samo djelomino

13

iskoritena, to se posebno odnosi na interaktivnost, tehnike pretraivanja kakve se


koriste u drugim sustavima za informacijsko pretraivanja, pa ak i na predviena
svojstva polja za predmetni pristup informacijama formata MARC koja se gotovo
uope ne koriste.

2.2. Razvoj predmetnog pretraivanja u online katalozima


U literaturi se razvoj online knjininih kataloga dijeli u tri osnovna razdoblja, s
izraenim razlikama izmeu prve, druge i tree generacije (Borgman 1996; Hildreth
1984; Mitev, Venner, Walker 1985).
Prva generacija online kataloga pojavila se sredinom 1970-ih, kada su se
raunala intenzivnije poela koristiti u knjinicama. Slijedila je dva dotadanja
modela: katalog na listiima (za generaciju korisnika koja je poznavala kataloge na
listiima oblikovana su njima bliska suelja u raunalnom okruenju) i Booleov
model pretraivanja (na temelju baza podataka poput DIALOG-a ili Medline-a).
Struktura zapisa, sadraj i primarna polja za pretraivanje temeljila su se na katalogu
na listiima, a funkcije pretraivanja na sustavima za pretraivanje. Od mogunosti
pretraivanja ti su katalozi nudili samo osnovne funkcije. Pristupnice su bile iste kao
i u katalonim listiima, dakle autor, naslov i predmet u Sjedinjenim Amerikim
Dravama, odnosno autor, naslov i klasifikacijska oznaka u Europi (Borgman 1996,
str. 497). A. O'Brien (1994) spominje i signaturu. C. Hildreth (1984) pristup po
predmetnim odrednicama svrstava u drugu generaciju. U prvoj generaciji kataloga
nizovi znakova iz korisnikog upita morali su se u potpunosti podudarati s onima u
bibliografskom zapisu. Podravali su se samo oni upiti koji su se sastojali od jedne
rijei, a odnose meu rijeima u upitima s vie rijei korisnik je morao definirati
Booleovim operatorima. Prva generacija online kataloga se, stoga, naziva sustavima
s prethodnim oznaivanjem (precoordinated) ili sustavima s izrazima (phraseindexed), a dobri su za pronalaenje jedinica grae za koje korisnik zna da postoje i
ima podatke potrebne za njihovo pronalaenje (known item searching) (Hildreth
1984; O'Brien 1994).
Druga generacija online kataloga dominirala je sredinom 1980-ih. Pruala je
dodatne mogunosti pretraivanja kao to su kljune rijei, implicitni Booleovi
14

operatori i prebiranje. Velika je znaajka uvoenje kljunih rijei kao pristupnica jer
je predmetno pretraivanje postalo mogue provoditi po kljunoj rijei po bilo
kojem indeksu polja u bazi podataka. Druga generacija podravala je unos vie rijei
u upitu, tako to je sustav automatski, sam postavljao Booleove operatore meu
rijeima iz upita. O online katalozima druge generacije esto se govori kao o
katalozima s naknadnim oznaivanjem (postcoordinated) ili katalozima s kljunim
rijeima (keyword) jer su pristupnice rijei iz naslova, predmetnih odrednica, autora
ili drugih imena, a upit se moe oblikovati koritenjem Booleovih operatora
(O'Brien 1994). Meutim, svaki je sustav imao vlastiti nain provoenja odnosa
meu rijeima, npr. izmeu rijei se automatski stavlja operator OR ili operator
AND, ili se niz rijei tretira kao izraz. Neki su sustavi potivali hijerarhiju Booleove
logike (NOT, AND, OR), a drugi su pak operacije obavljali jednostavno s lijeva na
desno. Zagrade su neki sustavi dozvoljavali, a drugi nisu. C. Hildreth (1984) navodi
i mogunost prebiranja po predmetnim odrednicama, ali istie probleme s rjenikom
za predmetno pretraivanje te prevelike i loe organizirane skupove rezultata. Kao
to tvrdi C. Borgman (1996), iako su nastupile promjene u smislu poboljanja
mogunosti pretraivanja, funkcionalnost druge generacije online knjininih
kataloga u odnosu na prvu nije znaajno poboljana. C. Hildreth (1984) smatra da
druga generacija online kataloga nije uspjena jer katalozi automatski ne nude
korisniku alternativu pri pretraivanju ako pretraivanje ne uspije, jer ne omoguuju
fleksibilno pretraivanje, te korisnicima ne nude pristup saecima i recenzijama
knjiga. Isti je autor u svome radu (Hildreth 1984) predloio potrebna poboljanja za
treu generaciju: pomo pri oblikovanju strategije pretraivanja, integrirani pristup
rijeima slobodnog teksta (free-text) i rijeima iz kontroliranog rjenika, opsenije i
bolje katalone zapise, istodoban pristup razliitim bazama podataka, unos upita na
prirodnom jeziku, individualizirani prikaz rezultata, i ispravljanje pogreaka
prilagoeno kontekstu.
Krajem 80-ih poelo se raspravljati o Web-based OPAC-ima odnosno Web
OPAC-ima (WebPAC-i), online knjininim katalozima tree generacije, kojima se
moe pristupiti putem suelja World Wide Weba. U odnosu na svoje tekstualne
prethodnike, ti katalozi pruaju niz novih mogunosti. Hipertekstualni model
organizacije, prebiranja i pronalaenja informacija prua knjininim katalozima
mogunost da postanu jedan, kako to C. Long (2000, str. 161) naziva, trgovinski
centar za bibliografske zapise, grau s potpunim tekstom i podatke s hipervezama,
15

osiguravajui tako iscrpnije koritenje informacija koje online katalozi ve sadre.


Podravaju dodatne tehnike pretraivanja (uz one koje se temelje na Booleovim
operatorima, npr. tehnike za pronalaenje najbliih rezultata, tzv. best match
tehnike), nude kvalitetnije zapise koji ukljuuju dodatne kontrolirane i
nekontrolirane pristupnice (poput naslova poglavlja u knjigama), omoguuju
oblikovanje upita na prirodnom jeziku, uz mogunost koritenja rjenika za kratice,
sinonime, ili pravopisne varijante. Takoer podravaju kontekstualne automatizirane
upute, koritenje termina iz dobivenih relevantnih zapisa za poboljanje
pretraivanja te prikaz najrelevantnijih zapisa prvih (O'Brien 1994). To to
osiguravaju korisnicima poznate alate poput povlanih izbornika (pull-down
menus), prozora i sliica, kao i trailice nalik onima na Internetu (search-engines),
korisnicima znatno olakava predmetno pretraivanje (Long 2000, str. 141).
Unato do danas ostvarenim poboljanjima, istraivanja su pokazala
(Borgman 1996; Drabenstott, Weller 1996; Slone 2000) da korisnici imaju velikih
problema s predmetnim pretraivanjem, od toga da ne mogu prevesti svoje koncepte
u jezik kataloga, do toga da pronalaze previe ili premalo zapisa te da se susreu s
velikim brojem neuspjelih pretraivanja. Problematika tree generacije online
knjininih kataloga sloenija je od problematike prethodnih dviju generacija, jer
oni osim bibliografskih zapisa osiguravaju pristup i online bazama podataka,
udaljenim izvorima s Mree, raznim vrstama datoteka vezanim uz bibliografske
zapise te drugim knjininim katalozima (Matthews 1997, str. 115). Iako je dizajn
jednostavniji i jasniji nego ranije, funkcionalnost online kataloga u osnovi se nije
promijenila od ranih 1980-ih (Borgman 1996, Matthews 1997). Vjeruje se da veina
problema koji su i nadalje vezani uz online kataloge postoji zbog zadravanja
strukture kataloga na listiima i nemogunosti da se oblikuju suelja koja se temelje
na znanju i vjetinama korisnika online kataloga. Vaan iskorak, prema naemu
miljenju, zasniva se na uvaavanju korisnikog ponaanja pri traenju informacija
(usp. Borgman 1996).

16

3. Pristupi problematici predmetnog pretraivanja u online


katalozima
Jedno od prvih istraivanja predmetnog pretraivanja u online katalozima opisuje K.
Markey 1983. godine. Istraivanje je pokazalo da korisnici imaju problema s
predmetnim pretraivanjem, te je predstavila i oekivanja od online kataloga, koja
su, zajedno s osobljem, naveli korisnici. Veinu tih oekivanja C. Hildreth (1984)
navodi kao obiljeja tree generacije online kataloga.
U sluajevima kada ne znaju autora, naslov ili predmetnu odrednicu,
korisnici smatraju korisnom mogunost pretraivanja po kljunim rijeima i po
signaturi. Pri pretraivanju po kljunim rijeima vrlo je korisno da sustav sam
predloi sve mogue termine po kojima bi se upit takoer mogao provoditi. Kao i u
predmetnom i strunom katalogu na listiima, vano je da postoji mogunost
prebiranja i odabira. To je vano iz nekoliko razloga, od toga da se pri unoenju
rijei i oblikovanju upita lako pogrijei pri pisanju (tipfeleri), ili uini pravopisna
pogreka, do toga da problemi mogu nastati i zato to postoje rijei koje se mogu
razliito pisati (npr. sa i bez povlake). Sve ove sluajeve spominje i M. Yee (1991).
Najvei problem korisnicima predstavlja pronalaenje relevantne predmetne
odrednice. Rijei iz upita za pretraivanje esto su odvie specifine ili pak
preopenite. O tome govore i drugi autori (npr. Yee 1991). M. Bates (1989b) kao
razlog nedovoljne specifinosti popisa predmetnih odrednica Kongresne knjinice
(LCSH) za velike online kataloge istie to to se predmetna odrednica tradicionalno
birala tako da obuhvati cjelovitu knjigu; smatra da je potrebno poveati broj
predmetnih odrednica po jedinici grae i pobrinuti se za utvrivanje specifinije
teme djela, a ne samo ope teme. U pronalaenje relevantne predmetne odrednice
ubraja se i problem prevoenja upita na jezik sustava. M. Bates (1989b) tvrdi da se
vjerojatnost da e dvoje ljudi koristiti isti termin za koncept ili knjigu ili da e
traitelj i informacijski sustav koristiti isti termin za koncept, kree izmeu 10 i
20%. Stoga je vano osigurati vezu izmeu termina koji odabere korisnik i termina
koji koristi sustav. Istraivanje koje su proveli Wilkes i Nelson (1995) o ulozi
datoteke predmetnih preglednih katalonih jedinica i uputnica jasno je pokazalo je
takva datoteka od velike vrijednosti od 73.9% uspjenih predmetnih pretraivanja,
u katalogu bez ovakve datoteke svega je 40.6% uspjenih pretraivanja. K. Markey

17

(1984) naglaava da su predmetna pretraivanja po prirodi apstraktnija i esto


zahtijevaju vie mentalnog napora da bi se neki koncept izrazio u nekoliko izraza ili
rijei, za razliku od korisniku poznatih drugih jedinica grae.
Osim oslanjanja na datoteku predmetnih preglednih katalonih jedinica i
uputnica, problem pronalaenja pravih termina nastojao se rijeiti i uporabom
metode analize korisnikog upita na prirodnom jeziku te usporedbom s
kontroliranim rjenikom. P. Le Loarer (1993, str. 259) spominje takav sustav koji se
uspjeno primjenjivao u francuskim aplikacijama Minitel Guide des Services
(Minitelov vodi usluga) i Annuaire Electronique (Elektroniki telefonski imenik), i
zalae se za primjenu takvog sustava u online katalozima. Sustav se temelji na
leksikoj, sintaktikoj i semantikoj analizi, a zapravo predstavlja proirenje metode
koja se koristila u eksperimentalnom online knjininom katalogu Okapi. Drugi
pristup koji se primjenjivao temelji se na rezultatima dobivenim mjerenjem
statistikih odnosa izmeu rijei iz naslova i LCSH. Takav pristup primijenjen je u
eksperimentalnom online knjininom katalogu Cheshire. U katalogu Cheshire za
pretraivanje po rijeima iz prirodnog jezika isprobana je i tehnika tzv.
classification clustering (klasifikacijsko okupljanje). Dok se u online katalozima
klasifikacijska oznaka openito tretira kao samo jo jedna kljuna rije u zapisu, u
ovom projektu klasifikacijske su oznake ekstrahirane iz zapisa MARC da bi se
poveao broj termina vezanih uz pojedini zapis, i dodani su termini analogni s
uputnicama use (upotrijebi) ili RT (Related Term srodni naziv)) u tezaurusu,
upuujui korisnika na kontrolirani rjenik pojmova prikazanih klasifikacijskim
oznakama. Na taj nain class clusters (klasifikacijske skupine) funkcioniraju poput
tezaurusa (O'Brien 1994, str. 227, 230).
Od ostalih problema s predmetnim pretraivanjem, K. Markey (1983, str.
383) izdvaja one koji su vezani uz razumijevanje predmetnih odrednica. Naime,
pokazuje se da korisnici ne razumiju i zbunjeni su kada trebaju koristiti predmetne
odrednice iz LCSH jer ne znaju na to se, primjerice, odnosi predmetna odrednica
Drug abuse - Congresses. Razoarani su kada u popisu predmetnih odrednica naiu
na predmetnu odrednicu, a u knjinici ne postoji jedinica grae na tu temu. Osim
toga, esto se u literaturi navode problemi s LCSH zbog nekonzistentnosti tog
sustava, njegove nedostatne specifinosti i aurnosti, nepostojanja uputnica vidi te
pomalo neloginog oblikovanja odrednica. Meutim, neki autori smatraju da je
jednostavnije poboljati taj sustav nego izmisliti novi (Cherry, Williamson, Jones18

Simmons, Gu 1994, str. 182), tim vie to ga koristi velik broj knjinica, pa korisnici
imaju iskustvo pri njegovoj uporabi. O kontroliranim rjenicima poput LCSH govori
i A. O'Brien (1994, str. 223), a kao osnovni problem istie unos dugakog niza
znakova umjetnoga jezika. Stoga predlae, osim prebiranja i obogaivanja zapisa
drugim sadrajnim oznaiteljima, pretraivanje po kljunim rijeima, ukljuujui i
pretraivanje po rijeima iz predmetnih odrednica (vidi i C. Borgman, str. 497).
to se tie strunog kataloga u raunalnom obliku, korisnici su izrazili elju
da se uz klasifikacijsku oznaku navede i opis te oznake rijeima, odnosno prijevod
klasifikacijske oznake. Takoer su naveli da bi uz signature trebalo navesti i
pridrueni popis knjiga na policama (Markey 1983, str. 384).
Korisnici su takoer naveli elju za obogaivanjem zapisa predmetnim
pristupnicama kao to su kazala iz knjiga, opisi s knjinih omotnica, predgovori i
pogovori, te vei broj predmetnih odrednica11 (Markey 1983, str. 384).
Uz rezultate Markeyinog istraivanja, u literaturi se navode i drugi problemi
pri predmetnom pretraivanju. M. Yee (1991, str. 81) navodi da korisnici ne
razumiju razlike izmeu pojedinih datoteka i polja, izmeu kontroliranih rjenika i
kljunih rijei. A. O'Brien (1994, str. 224) takoer istie da korisnici esto ne vide
razliku izmeu pretraivanja po kljunim rijeima i po terminima iz kontroliranih
rjenika. Rjeenje za te probleme predloila je M. Bates (1989b): ukoliko se
pretraivanje po kljunim rijeima odnosi na rijei iz naslova, ta se vrsta
pretraivanja moe jednostavno nazvati naslov, a ne kljuna rije. Ili se moe zvati
pretraivanje po sadraju (subject search), a da se pretraivanje obavlja po naslovu
ili predmetnim odrednicama ili po oba ova polja istodobno. Ovakav pristup posebno
je koristan na suelju za jednostavno ili poetno pretraivanje, kada u online
katalogu postoji vie suelja za pretraivanje, dok bi u suelju za sloeno ili
napredno pretraivanje trebalo precizno navesti koje se datoteke pretrauju pod
odreenim nazivima ili oznakama polja.
M. Yee (1991) nadalje navodi da korisnici dobivaju prevelik broj rezultata;
da u upitu koriste rijei iz stop-liste jer ne znaju da takva lista postoji niti to
obuhvaa, provode pretraivanje po kljunim rijeima kada je pretraivanje po

11

Usp. O'Brien, A. Online catalogs : enhancements and developments. // Annual review of


information science and technology (ARIST). Vol. 29, 1994, str. 219-241. Autorica navodi odreena
istraivanja prema kojima poveanje broja pristupnica dovodi do veeg broja rezultata, a prevelik
broj rezultata est je problem predmetnog pretraivanja. No, nadalje se istie, ta su istraivanja samo
indikativna.

19

izrazu uinkovitije i ne koriste mogunosti poput kraenja. Korisnici esto ne


razumiju kako se koriste Booleovi operatori, ne znaju kako sustav obrauje kratice i
inicijale (npr. problem moe biti da korisnik u svom upitu ignorira kraticu, dok je
katalog obrauje kao rije), ne znaju to tono znae uputnice vidi i vidi i, i ne
razumiju zaslon s uputama. Pokazalo se i da zbog rijetkog koritenja kataloga
korisnici svaki put moraju iznova svladavati sustav (Yee 1991, str. 81).
Prema C. Borgman (1996), u kontekstu predmetnog pretraivanja, valja
istaknuti i sljedee. Korisnik mora imati mogunost unoenja fragmenata pitanja,
istraivanja strukture rjenika, zadravanja djelominih rezultata, preoblikovanja
pretraivanja uz pomo razliitih specijaliziranih programa, tzv. inteligentnih
agenata, zadravanja elemenata pretraivanja za budua pretraivanja te prijenosa
elemenata u druge sustave.
Spomenute ideje i pokuaji poboljanja predmetnog pretraivanja u online
katalogu, od uvoenja predmetnih preglednih katalonih jedinica i uputnica,
tezaurusa ili odnosa kakvi postoje u tezaurusu, osiguravanja pomoi pri prevoenju
unesenih pojmova u rjenik koriten u katalogu i preoblikovanju upita pri
neuspjenom pretraivanju, do osiguravanja mogunosti prebiranja (Larson 1992;
Hildreth 1989), prvi su omoguili eksperimentalni online katalozi tree generacije
poput Okapia i CHESHIRE-a (Larson 1992). Njihove prednosti obuhvaaju i
mogunost oblikovanja upita prirodnim jezikom bez potrebe za koritenjem sloene
sintakse, ispis rezultata prema slinosti s upitom ili prema relevantnosti te
podravanje vee interakcije s korisnikom, i to i prilikom definiranja upita i
prilikom koritenja povratne informacije o relevantnosti (relevance feedback) pri
emu se relevantni rezultati koriste za daljnje preoblikovanje upita i dobivanje
slinih jedinica grae. Istraivanja Okapia (Hancock-Beaulieu, Walker 1992)
nadalje su pokazala prednosti dodatnih mogunosti predmetnog pretraivanja koje
se odnose na automatsko preoblikovanje upita (automatic query expansion),
rangirani ispis rezultata prema kljunoj rijei (best match keyword searching),
automatsko kraenje, automatsko ispravljanje pravopisnih pogreaka i pogreaka u
pisanju te sustav uputnica. Idue istraivanje nove inaice, XOkapi, iz 1995.
(Hancock-Beaulieu,

Fieldhouse,

Do

1995)

obuhvatilo

je

interaktivno

preoblikovanje upita (interactive query expansion) na temelju povratne informacije


o relevantnosti, jer su rezultati pokazali da automatsko preoblikovanje upita ostavlja
korisniku nedovoljno nadzora nad preoblikovanjem upita i pretraivanja te da
20

implicitno koritenje tezaurusa ponekad ima nedostatke u odnosu na eksplicitno,


kada korisnik sam odabire traene pojmove.

21

4. Problematika korisnikih pristupa pri predmetnom


pretraivanju
Svrha informacijskog sustava jest korisnicima omoguiti pristup relevantnim
dokumentima. Korisnici se meusobno znatno razlikuju u pretraivanju informacija,
pa su provoena mnoga istraivanja s ciljem boljeg razumijevanja naina na koji
korisnici tragaju za informacijama. Tri su razliite kole u informacijskoj i
knjininoj znanosti koje povezuju korisnike s informacijom: fizika, kognitivna i
konstruktivistika (Olson, Boll 2001, str. 265-273).
Fizika kola izrasla je iz empiricistike tradicije i usmjerena je na mjerenja
informacije koje se prenesu iz dokumenata na korisnike te na mjerenje stupnja do
kojeg informacija zadovoljava korisnike potrebe. Prema ovoj koli korisnike
potrebe su konkretne i mogu se identificirati te se smatra da je mogue na njih
odgovoriti potrebnim informacijama. Korisnike karakteristike poput, na primjer,
raunalnih vjetina kojima vladaju, mogu se smatrati umom kroz koju se moe
pronai put ako se poduzmu primjerene mjere.
Kognitivna kola potjee iz racionalistike tradicije, prema kojoj je logika
superiornija od iskustva. Vjeruje se da korisnici imaju individualne strukture znanja
koje se temelje na pravilima i koje odreuju ulazne i izlazne informacije na logian
nain. Istraivanja se bave prepoznavanjem imbenika koji utjeu na interakciju
korisnika i sustava, a posebno utjecajem obrazovanja i iskustva na oblikovanje
strukture znanja pojedinaca. Ovoj koli pripada koncept ASK (Anomalous State of
Knowledge anomalijsko stanje znanja) N. Belkina (Belkin, Oddy, Brooks 1982),
prema kojemu je korisnikovo znanje centralno pitanje u informacijskom sustavu. N.
Belkin tvrdi da tzv. best match sustavi nisu prikladni jer od korisnika zahtijevaju da
definira svoj informacijski problem. Informacijski sustav trebao bi nastojati
korisnika sam ispitati i dokuiti njegovu informacijsku potrebu.
Konstruktivistika kola proizlazi iz tradicije historicizma, usmjerene na
drutvo i kulturu, a ne na pojedinca. Prema ovoj koli informacijske su potrebe
pojedinca uvjetovane drutvenim silama.
Dosadanja istraivanja pokazala su da su karakteristike korisnika koje
utjeu na njegovo ponaanje vezano uz pretraivanje informacija dob i spol,
obrazovanje i iskustvo te svrha istraivanja, istraivaki stadij i slino. Meutim,

22

ovako iroko postavljena problematika ne ulazi u opseg ovoga rada. Dio koji slijedi
usmjeren je prvenstveno na ponaanje korisnika pri predmetnom pretraivanju i
implikacijama za oblikovanje online kataloga za tu vrstu pretraivanja.
Veina dananjih kataloga zahtijeva od korisnika odreeni napor. Naime,
korisnik mora preoblikovati i ponovno unositi upit sve dok ne dobije
zadovoljavajue rezultate. Ovaj pristup temelji se na pretpostavci da korisnik zna to
eli, da moe opisati potrebnu informaciju u obliku koji je prihvatljiv raunalnom
sustavu, da moe razumjeti poruke koje dobije od kataloga i rijeiti probleme pri
pretraivanju tako da na kraju doe do eljenih rezultata (Borgman 1996; Borgman
2000; Matthews 1997; Smeaton 1997). Pritom, kao to smo ranije istaknuli, veina
problema u online katalozima postoji zbog ostataka strukture kataloga na listiima,
koja se dobro ne preslikava u online okruenje, i nemogunosti da se oblikuju
suelja koja se temelje na znanju i vjetinama korisnika online kataloga. Online
katalozi izrasli su iz kataloga na listiima, a istraivanja su pokazala da korisnici i u
manualnim i automatiziranim sustavima dolaze do kataloga s nedovoljnom
informacijom za bilo koju pristupnicu. Cutterova pravila ne odraavaju prikladno
nain na koji ljudi trae informacije. Iako je sam Cutter tvrdio da uvijek ima na umu
korisnika, njegova perspektiva kao i perspektiva drugih teoretiara iz tog razdoblja
odraava racionalan, pozitivistiki pristup, a ne znanje o nainu na koji ljudi trae
informacije.
Danas korisnici online kataloga imaju vie mogunosti pretraivanja no to
im je to uope poznato i no to ih koriste. U katalozima na listiima postojale su
predodreene metode za pretraivanje autor, naslov, predmet. Prvi online katalozi
zahtijevali su od korisnika da znaju oblikovati strategiju pretraivanja. Druga
generacija online kataloga pribliila se korisnikim potrebama, meutim, korisnici
kataloga tree generacije jo se uvijek susreu s problemom razvoja strategije za
pretraivanje (Lombardo, Condic 2000, str. 141).
Prema C. Borgman (1996; 2000), postoje tri razine znanja potrebne za
pretraivanje online kataloga. Konceptualno znanje odnosi se na prevoenje
informacijske potrebe na upit za pretraivanje, npr. Koje pojmove upotrijebiti ako
traim grau o osobama s posebnim potrebama. Semantiko znanje je ono koje se
primjenjuje pri odabiru mogunosti sustava, npr. Trebam li koristiti naredbu Find
ili Browse?. Sastoji se od tri parametra: akcije (pronai, odabrati, proitati,
prebirati), pristupnice ili oznake polja (autor, naslov, predmet) i termina za
23

pretraivanja, i to pojedinanih (npr. Grieg, fizika) ili u kombinaciji s Booleovim


operatorima (npr. Barcelona OR Madrid). Tehniko znanje obuhvaa temeljne
raunalne vjetine i sintaksu upita, npr. Trebam li unijeti Borges Jorge L. ili Jorge
L. Borges?. Slino tome, A. Large i J. Beheshti (1997) navode da korisnik mora
prvo konceptualizirati potrebu za informacijom o odreenom predmetu, zatim tu
konceptualizaciju izraziti u odreenim pojmovima za pretraivanje, te za te pojmove
pronai odgovarajue termine, koji se koriste u online katalozima za oznaivanje
predmeta.
Istraivanja ponaanja korisnika pri pretraivanju usmjerena su na
semantiko znanje i tehnike vjetine, a vrednovanje sustava najee se temelji
samo na tehnikim vjetinama (mjeri se uspjenost korisnika i pogreke u
oblikovanju upita). Upute o koritenju online kataloga preesto su usmjerene samo
na tehnike vjetine, bez da se te vjetine stave u kontekst semantikog znanja, a jo
manje konceptualnog (Borgman 1996).
C. Borgman (1996; 2000) takoer tvrdi da je korisnicima najtee odrediti
termine za pretraivanje u predmetnom katalogu, jer ne znaju da su predmetne
odrednice preuzete iz kontroliranog popisa ili tezaurusa koji je zasebno pretraiv.
Umjesto toga, koriste kljune rijei koje najbolje poznaju, esto metodom pokuaja i
pogreaka. Pretraivanje informacija problematino je jer je potrebno opisati
informaciju koju nemate. Traitelji moraju prevesti svoju informacijsku potrebu na
opis informacije koju trae, oslanjajui se na njihovo znanje o problemu, poznavanje
alata koje sustav prua da pomogne u opisivanju problema, te, ako je mogue, na
usluge vjetih knjiniara ili posrednika koji vre pretraivanje.
S jedne strane postoje sustavi koji zahtijevaju od korisnika da u potpunosti
oblikuje upit za pretraivanje, pa takav sustav vraa skup zapisa koji odgovaraju
upitu. S druge strane, postoje sustavi koji korisniku doputaju da unese bilo koje
fragmente ideje kao poetnu toku, osiguravajui razne alate kao pomo u
ispitivanju informacijske potrebe. Veina kataloga temelji se na modelu oblikovanja
upita koji imaju odreeni stupanj mogunosti preoblikovanja pretraivanja, ali
daleko su od idealnih sustava. Oblikovanje upita prema autoru i naslovu takoer je
teko jer korisnik mora imati preciznu informaciju koja se u potpunosti poklapa s
odrednicom u katalogu ili, pak, mora znati kako prepoznati druge mogue oblike.
Predmetno pretraivanje jo je tee jer korisnik treba iznai nain na koji e
artikulirati namjeravano znaenje koritenjem termina koji postoje u katalogu, bilo
24

da su to termini koje rabe autor, katalogizator ili osoba koja izrauje predmetne
pristupnice. O tome govori i D. Slone (2000, str. 761) i istie da je odnos izmeu
onoga to korisnik upie i naina na koji su jedinice oznaene, esto slab ili
nepouzdan, to dovodi do nezadovoljavajuih rezultata pretraivanja. Poseban
problem u njenom istraivanju predstavljali su usko postavljeni, specifini upiti za
koje je bilo potrebno utroiti najvie vremena na pretraivanju. Kao uspjena
tehnika pretraivanja pokazalo se postepeno suavanje ire teme, uz sluenje
predmetnim odrednicama iz pronaenih zapisa kao termina za novo pretraivanje.
U online katalozima takoer se ne uzima u obzir to to korisnici upit oblikuju
postepeno, ve njihov dizajn odraava stajalite da korisnici oblikuju upit kojim je
utvren cilj pretraivanja i da je svaka sesija pretraivanja nezavisna. Pretraivanje
moe obuhvatiti niz sesija s razliitim izvorima, bilo online ili offline, pri emu
korisnik odabire neke od brojnih mogunosti da bi doao do traene informacije.
Model postepenog pretraivanja koji bi se trebao primijeniti u online informacijskim
sustavima prva je uvela M. Bates (1989a). Njezin model, tzv. berrypicking
(sakupljanje bobica), u osnovi se temelji na ideji da rezultat pretraivanja nije
odjednom pronaeni skup jedinica, ve nekoliko izvrenih odabira dijelova
informacije tijekom pojedinanih stadija pretraivanja i stalnog preoblikovanja
upita. Priroda upita je promjenjiva, ona se razvija, nije jedinstvena, pretraivanje ne
vodi do jednog najboljeg skupa pronaenih rezultata, tehnika pretraivanja stalno se
mijenja, kao to se i pronaeni izvori mijenjaju i u obliku i sadraju. M. Bates
(1989a) stoga sugerira da sustavi za pretraivanje trebaju osigurati to vie razliitih
strategija za pretraivanje, to e rezultirati uinkovitijim pretraivanjem.
Pokazalo se da je Booleova logika teko razumljiv koncept (Yee 1991) te da
ak i znanstvenici i inenjeri koji imaju iskustava u primjeni logike na drugim
aplikacijama esto pri pretraivanju koriste AND i OR obrnuto (Borgman, Case and
Meadow 1989), a istraivanja iz kognitivne psihologije (Tversky, Kahneman 1974)
pokazuju da ljudi slijede intuiciju pa AND i OR koriste u njihovom jezinom
znaenju, tj. da je AND inkluzivno i da znai vie, a OR da je ekskluzivno i da
smanjuje skup dakle, obrnuto od Booleove logike (Borgman 1996, str. 496). Za
oblikovanje upita uz pomo Booleovih operatora potrebno je konceptualno znanje o
tome kako se termini mogu kombinirati i semantiko znanje o tome kako odreeni
sustav izvrava Booleove operatore. Online katalozi razliito koriste operatore,
posebno implicitne, to zbunjuje korisnike. Ako se unese vie termina, neki sustavi
25

ih tretiraju kao AND, neki kao OR, a neki kao izraz. Neki potuju logiku
hijerarhiju, neki samo po redu izvravaju, neki koriste zagrade, a neki ih ignoriraju.
Samo najiskusniji traitelji imaju dovoljno znanja o Booleovoj logici i o tome kako
sustav tretira upite od vie rijei. Krajnji korisnici uglavnom nemaju volje to ispitati,
pa prenose znanje o sustavu koji su prije koristili (Borgman 1996, str. 498). U online
katalozima s komandnim sueljem (command-driven) postoje takoer velike razlike
u nainu na koji se koriste naredbe i nazivi polja pa tako za autora nazivi u
razliitim sustavima mogu biti npr. AU i AUT (od author), NA (od name), PA (od
personal author).
Kao to se pokazalo u prethodnom poglavlju, velik je broj neuspjenih
predmetnih pretraivanja, kojima su razlozi raznoliki. Osim spomenutih, problem je
i taj to korisnici nakon prvog neuspjeha najee odustaju od pretraivanja uope.
P. Le Loarer (1993, str. 251) navodi da korisnik, kada ne dobije rezultate, odustane
od traenja jer smatra da informacija koju trai u katalogu ne postoji.
Vano je takoer istaknuti da esto, ak i kad postoje mogunosti za razliite
vrste predmetnog pretraivanja, korisnik toga ne mora biti ni svjestan. Zbog toga je
potrebno osigurati upute o mogunostima te ponuditi pomo koja e korisnika
uputiti na nain kako da preoblikuje upit radi pronalaenja eljenih informacija
(Loarer 1993, str. 253; Hancock-Beaulieu 1993, str. 278).
Takoer valja upamtiti da je korisnika zajednica online kataloga heterogena
po dobi, jeziku, kulturi, poznavanju podruja, raunalnim vjetinama, i da e u njoj
veina biti vjeni poetnici u informacijskom pretraivanju. Ako se promatraju
samo korisnici visokokolskih knjinica, razvidno je da posjeduju razliite razine
znanja o koritenju knjinica, od dodiplomskih studenata s malim ili nikakvim
iskustvom, do znanstvenika koji su u pretraivanju knjininih kataloga vrlo iskusni
(Rasmussen 1999, str. 410). Pokazalo se, takoer, da postoji snana veza izmeu
akademskog smjera i provoenja pretraivanja. Tako, primjerice, osobe s tehnikim
obrazovanjem imaju bolje rezultate pretraivanja oni koji su studirali matematiku i
prirodne znanosti bili su bri u pretraivanju nego oni iz humanistikih znanosti
(Borgman 1989, str. 247-248).
Pokazalo se i da neki traitelji imaju stil koji primjenjuju na veinu zadaa
pretraivanja, dok drugi mijenjaju svoje ponaanje pri pretraivanju ovisno o
zadatku. Neki traitelji prvo dobro promisle o oblikovanju upita, dok drugi
primjenjuju pristup pokuaja i pogreaka, pri emu je cilj pretraivanja bolje
26

oblikovanje upita. Neki traitelji istrauju, a drugi se odluuju za najizravniji put do


cilja. Odreene funkcije sustava problematine su veini, dok su druge problem
samo nekolicini. Potrebno je provoditi jo istraivanja o tome koji aspekti traenja
informacija su univerzalni, a koji specifini za neku situaciju ako elimo oblikovati
informacijske sustave koji e sluiti heterogenoj skupini korisnika sa sve veim
razlikama u korisnikim informacijskim potrebama (Borgman, Hirsh, Hiller 1996,
str. 581).
S obzirom na razliita znanja i potrebe korisnika jednog sustava, suvremena
suelja trebala bi biti prilagoena pojedincu. Takvo suelje moe se temeljiti na
razliitim vrstama informacija prikupljenih o korisniku, kao to su njegova znanja o
odreenom podruju, vjetine pretraivanja kojima vlada, njegove tipine potrebe
pretraivanja (preciznost (precision) ili odziv (recall); prebiranje ili oblikovanje
upita, jezik, ako je suelje viejezino i sl.), baze koje najee pretrauje s
pripadajuim lozinkama i dr. Takvo bi suelje trebalo sadravati strategije
pretraivanja i dobivene rezultate iz prethodnih pretraivanja. Relevantne
informacije o korisniku mogu se prikupljati na razne naine. Na primjer, pri prvom
ulasku u sustav moe se izraditi korisniki profil na osnovu podataka koje korisnik
ispuni u prireenom obrascu, ili se podaci mogu prikupljati praenjem korisnikovih
akcija za vrijeme pretraivanja te na temelju upita koje oblikuje (Vickery, Vickery
1993, str. 114-115).
C. Borgman (1996) zakljuno navodi da bi dugoroan cilj trebao biti
oblikovanje intuitivnih sustava u kojima se dodatna pomo moe svesti na najmanju
moguu mjeru, dok se, kratkorono gledano, moe osigurati dodatno obuavanje i
upute o pretraivanju, imajui na umu da to nije zamjena za dobro oblikovan sustav.
Dugorono gledano, informacijski strunjaci trebali bi oblikovati sustave koji se
temelje na bihevioralnim modelima postavljanja pitanja. Korisniku je pri
oblikovanju upita potrebno osigurati pomo, kao i pri pregledavanju rjenika, tim
vie to je korisnik na Internetu preputen sam sebi, ali pomo i upute ne mogu
zamijeniti dobar intuitivan dizajn, ve sustavi moraju biti tako oblikovani da
predvide svaku moguu situaciju i potrebnu pomo pri iznalaenju pravog pristupa.
Takoer je potrebno osigurati mogunost preoblikovanja pretraivanja uz pomo
specijaliziranih programa, tzv. inteligentnih agenata, zadravanja djelominih
rezultata za budue pretraivanje, te prenoenje segmenata pretraivanja u druge
sustave (Borgman 1996).
27

Osim suelja i mehanizama predmetnog pretraivanja, i same je kontrolirane


rjenike potrebno oblikovati prema potrebama korisnika i prema nainima na koje
e korisnik pronalaziti informacije, o emu e vie govora biti u poglavlju koje
slijedi.

28

5. Predmetni pristup informacijama u online knjininim


katalozima

5.1. Vrste predmetnih pristupnica


Pronalaenje informacija temelji se na interakciji korisnika s bazom informacijskog
sustava. Korisnik postavlja upit koji se tipino sastoji od rijei koje se usporeuju s
pristupnicama u bazi podataka. Osim ovoga naina, informacijski sustavi
omoguuju odabiranje pristupnica iz ponuenog popisa, koja se tehnika
pretraivanja naziva prebiranjem ili pregledavanjem (browsing). Postoje i napredne
tehnike pretraivanja usporeivanjem rijei uz upita s pristupnicama u bazi
podataka, poput tzv. latentnog semantikog oznaivanja (latent semantic indexing),
kojom se rijei iz upita s predmetnim pristupnicama u bazi podataka usporeuju na
temelju statistike semantike analize upita i odnosa meu rijeima u upitu. Ovaj se
nain razlikuje od prethodnih po tome to omoguuje pronalaenje relevantnih
jedinica grae i kada se rijei iz upita i pristupnice razlikuju morfoloki, ali se
preklapaju semantiki (Hjorland, Nielsen 2001, str. 251).
U online knjininim katalozima pristupnica moe biti bilo koji element iz
zapisa. Danas su najee predmetne pristupnice one za predmetnu odrednicu,
klasifikacijsku oznaku, deskriptor i kljunu rije, koja moe biti iz jednog, nekoliko
ili svih polja iz zapisa odjednom, npr. iz naslova, predmetne odrednice, napomene o
sadraju ili, rjee, iz anotacije12. Predmetne pristupnice u raunalnom okruenju
mogu biti i podaci o formalnim obiljejima grae, pa je podjela izmeu predmetnih i
ostalih vrsta pristupnica danas teko odrediva. U literaturi se donedavno isticala i
razlika izmeu predmetnih pristupnica i opisnih podataka (descriptive data). Opisni
podaci omoguavali su traenje poznatih jedinica, a predmetni podaci traenje
poznatih ili nepoznatih jedinica na danu temu. Danas se, meutim, jasna podjela
izmeu predmetnih i opisnih podataka gubi (Hjorland, Nielsen 2001, str. 251). Tako
su, na primjer, naslovi istodobno i opisni podaci i predmetne pristupnice. Ono to se
moe prihvatiti kao valjano polazite je to da su najvrednije predmetne pristupnice

12

Vidi, npr., WebPAC Knjinica grada Zagreba, URL: http://www.kgz.hr.

29

one koje korisniku omoguavaju da u bazi informacijskog sustava pronae


najrelevantnije dokumente.
U predmetnom su pretraivanju kao pristupnice vrlo korisne kljune rijei iz
termina kontroliranih rjenika, poput predmetnih odrednica i deskriptora. Ovaj nain
pretraivanja korisnicima omoguava da pronau odobrene kontrolirane termine
koje ne poznaju. Za pronalaenje kontroliranih termina osigurava se i sustav
uputnica, ija je izrada, meutim, u usporedbi s kljunim rijeima, zahtjevna i
skupa, ali svakako preporuena. Vrlo su korisne i kljune rijei iz ostalih polja za
sadraj, poput naslova, saetka i napomena, ime se omoguava pronalaenje po
drugim aspektima no to su oni pokriveni kontroliranim terminima. Primjerice,
kljune rijei iz ovih polja mogu biti specifinije od dvije ili tri predmetne odrednice
koje slue opisu cjelovitog djela. Da bi se postigli najbolji rezultati pretraivanja po
kljunim rijeima, potrebno je koristiti operatore i kraenje.
Kada se govori o kljunim rijeima iz naslova kao predmetnim
pristupnicama, valja naglasiti da ova vrsta predmetnog pretraivanja ima nekoliko
nedostataka. Iako se nepunoznane rijei (stop-rijei poput lanova, prijedloga i
veznika) ne uvrtavaju u indeks rijei iz naslova, rezultati ove vrste pretraivanja
esto su vrlo niske razine preciznosti. Za to postoji nekoliko razloga. Najvei je
problem taj to autori naslove esto izraavaju metaforikim jezikom, kako bi
pobudili zanimanje potencijalnih itatelja. Usto, naslovi esto izraavaju openitije
aspekte, no to su u radu zapravo obraeni. Ako govorimo o knjininim katalozima
koji popisuju razliite vrste grae, jo je jedan problem s naslovima taj to brojni
dokumenti, poput slika i pisama ili poruka zapravo ni nemaju naslov (Voorbij
1998).
P. Hodges (1983), pak, smatra da je, iako se pretraivanjem po rijeima iz
naslova pronalazi manje od 50% relevantnih naslova iz prethodno navedenih
razloga, takva preciznost esto je dovoljna korisniku visokokolskih knjinica. Kao
razlog tome navodi da studenti i nastavnici najee ne trae detaljan popis jedinica
grae o odreenoj temi, ve samo ele stei uvid u koliinu raspoloive grae o toj
temi ili dobiti osnovne informacije.
Na predmetno pretraivanje po saecima utjee njihova kvaliteta. Saeci
koje izrade autori smatraju se informativnima jer nisu objektivan prikaz rada, za
razliku od tzv. indikativnih saetaka koje izrauju informacijski strunjaci i koji su
stoga kritini. Informacijski strunjaci koji prireuju saetke mogu koristiti
30

tezauruse, klasifikacijske sustave i slina pomagala te se na taj nain sadrajna


analiza i terminologija u saecima moe formalizirati (Fidel 1986). Saeci imaju
znatno vei utjecaj na poveanje razine odziva i preciznosti, nego naslovi i kljune
rijei (Hjorland, Nielsen 2001, str. 271).
Iako knjinini katalozi uglavnom ne sadre saetke, formati MARC
osiguravaju polje za saetak. Tako u UNIMARC-u postoji polje 330, predvieno za
kratki sadraj ili sinopsis jedinice. Ovo je polje izborno, a moe sadravati svaku
vrstu saetka, bilo informativan ili indikativan saetak, kritiki osvrt ili procjenu.
Osim saetka, u literaturi se esto navodi obogaivanje bibliografskih zapisa
stranicama sa sadrajem. Zbog razmjerno visokih trokova ovako iscrpne obrade
knjinine grae, rijetki su katalozi koji ove predmetne pristupnice doista sadre.
Meutim, danas postoji mogunost preuzimanja ovih podataka iz drugih izvora na
Mrei, poput online knjiara, iji su zapisi obogaeni i drugim potencijalno korisnim
podacima. T. Koch (2002) sugerira da bi moda bilo dovoljno samo povezati ISBN
iz zapisa u knjininom katalogu s ISBN-om u zapisu u online knjiari i na taj nain
omoguiti pristup tim podacima, bez potrebe za preuzimanjem itavog zapisa.
Ukoliko se u tom sluaju eli omoguiti pretraivanje polja ijem sadraju je samo
omoguen pristup, potrebno je implementirati trailicu ili osmisliti druge tehnike
kojima e se takvo pretraivanje osigurati.
U ovome se smjeru na meunarodnoj razini i kree suradnja knjiniarske
zajednice s nakladnikim i knjiarskim zajednicama. Tako su Britanska knjinica
(British Library) i OCLC izradili tablice za konverziju nakladnikog i knjiarskog
formata ONIX u knjinine formate UNIMARC i MARC 21. Sam format ONIX
razvijan je u suradnji s knjiniarskom zajednicom te se, izmeu ostalih
dokumenata, temelji na FRBR-u (Green 2001; Danskin 2001). Danas zapise ONIXa ve preuzima Kongresna knjinica (Library of Congress), a isto su najavile i
britanska, njemaka i vedska nacionalna knjinica.
O ukljuivanju potpunog teksta u katalog postoje razliita stajalita, a A.
Barbari (2002, str. 43) tvrdi da se potpuni tekst ne bi trebao ukljuivati u katalog
jer ostale jedinice grae za koje potpuni tekst ne postoji, ne bi bile pretraive po tom
polju. Stoga je, smatra, dovoljno iz kataloga osigurati pristup potpunom tekstu
dokumenta. U ovome u se radu, s obzirom na opsenost problematike pretraivanja

31

po potpunom tekstu, ograniiti samo na najosnovnije13. Istraivanja provedena na


informacijskim sustavima s potpunim tekstom, poput komercijalnih baza podataka,
najvie su usmjerena na dodane oznake (value-added tags), koje prema
kontroliranim rjenicima za oznaivanje unose informacijski strunjaci. Pokazalo
se, naime, da pretraivanja po potpunom tekstu imaju niu razinu preciznosti od
pretraivanja po saetku i kontroliranom rjeniku pa su ove oznake vrlo korisne
(Tenopir, Ro 1990). Takoer se puno istrauje o ulozi raunalne obrade prirodnog
jezika te o pretraivanju po odreenim dijelovima potpunog teksta dokumenta, tj. po
pojedinim odlomcima ili sadrajnim cjelinama kao to su uvod, metodologija i
zakljuak. Smatra se da su saeci optimalni za potrebe pretraivanja jer
pretraivanje po potpunom tekstu esto dovodi do velike koliine nerelevantnih
rezultata, odnosno niskom preciznou (Pinto, Lancaster 1999).
Dananje je stajalite struke da su kontrolirani jezici (s predmetnim
pristupnicama poput predmetnih odrednica, deskriptora i klasifikacijskih oznaka) i
prirodni jezici (kljune rijei) meusobno komplementarni u predmetnom
pretraivanju, jer svaki ima svoje prednosti i nedostatke. Relativne snage i slabosti
razliitih vrsta jezika za oznaivanje i pretraivanje utvruju se istraivanjima na
temelju svojstava i potreba za razliite vrste dokumenata, grae, strunih podruja i
korisnikih zajednica. O ovoj problematici vie e biti govora u poglavlju 5.5.

5.2. Vrste sustava za oznaivanje i pretraivanje


Na uspjenost predmetnog pretraivanja utjeu sustavi za oznaivanje i
pretraivanje. Postoje razliite podjele ovih sustava. U ovome radu rabit e se
podjela H. Olson i J. Bolla (2001, str. 31-51), prema kojima se sustavi za
oznaivanje i pretraivanje dijele u etiri osnovne skupine.
Prvu skupinu obiljeava to to se pretraivanje, za razliku od ostale tri
skupine,

temelji

na

netekstualnoj

osnovi

(nonverbal,

nontextual),

poput

pretraivanja po slikama, glazbenim melodijama, kemijskim formulama i


geografskim koordinatama, iako se takva vrsta pretraivanja esto kombinira s
13

Pretraivanjem potpunog teksta danas se intenzivno bave konferencije TREC (Text Retreival
Conference), URL: http://trec.nist.gov.

32

tekstualnim opisom objekta. Budui da dananji online katalozi ne osiguravaju


pristup bazama podataka s netekstualnim informacijama i da za ovu vrstu
netekstualnog pretraivanja jo ne postoje standardi ni dovoljno razvijene
tehnologije, u tu se problematiku u ovome radu nee detaljno zalaziti. U prvu
skupinu ubraja se i tzv. citatno oznaivanje (citation indexing), a temelji se na
citiranju jednog rada u drugim radovima. Ono zapravo nije sustav za oznaivanje i
pretraivanje u pravom smislu te rijei, ve je to sustav bibliografskih referenci,
utemeljen na pretpostavci da se dokumenti koji citiraju druge dokumente bave istim
predmetom. Ono omoguava i jednostavno praenje razvoja nekog predmeta u
strunoj literaturi, a intenzivno se koristi u podruju prava, u svom osnovnom obliku
jo od dvanaestog stoljea. U druge se znanosti proirilo dolaskom raunala,
preciznije 1961., kada je ameriki Institut za znanstvene informacije (Institute for
Scientific Information ISI) poeo izdavati Citatno kazalo za prirodoslovlje
(Science Citation Indeks)14.
Druga vrsta sustava za oznaivanje i pretraivanje su nekontrolirani ili
prirodni sustavi, a temelje se, dakle, na rijeima prirodnog jezika, u kojima se jedini
nadzor nad semantikom i sintaksom obavlja uz pomo stop-liste. Preostale dvije
vrste sustava za oznaivanje i pretraivanje ine kontrolirani sustavi, i to oni koji se
temelje na kontroliranim terminima iz prirodnog jezika, tzv. abecedni sustavi
(alphabetical systems) (trea vrsta), ili, pak, na klasifikacijskim oznakama koje se
sastoje od brojeva i slova, tzv. klasifikacijski sustavi (classed systems) (etvrta
vrsta).
Nekontrolirani sustavi, koji se temelje na rijeima preuzetima iz dokumenta,
poeli su se koristiti 1950-ih. Tada se M. Taube zalagao za tzv. sustav uniterma,
odnosno termina koji se sastoje od samo jedne rijei, smatrajui da se viesloni
termini mogu oblikovati koritenjem Booleovih operatora u trenutku pretraivanja.
Ubrzo se pokazalo da unitermi dovode do niske preciznosti u rezultatima i da su
neprimjereni za predstavljanje glavnih pojmova odreene discipline i strukturiranje
rjenika te discipline (Svenonius 2000, str. 134). Sustav uniterma, indeksi kljunih
rijei iz naslova poznati pod nazivima KWAC (keyword-alongside-context), KWIC
(keyword-in-context), i KWOC (keyword-out-of-context), s vremenom su prerasli u
kljune rijei iz teksta itavog dokumenta, ukljuujui naslov, saetak, predmetne

14

Thomson ISI, URL: http://www.isinet.com

33

odrednice i ostala polja bibliografskog zapisa. Danas se u online katalozima za sve


njih rabi samo termin kljuna rije.
U abecedne sustave spadaju popisi predmetnih odrednica ili predmetni
sustavi, kojima u elektronikom okruenju kao izvor termina slui datoteka
predmetnih preglednih katalonih jedinica i uputnica ili tezaurus, te deskriptori,
kojima kao izvor termina slui tezaurus. Temeljna razlika izmeu ove dvije vrste
sustava za oznaivanje i pretraivanje jest u tome to se predmetnim odrednicama u
pravilu opisuje glavni predmet dokumenta, a deskriptorima pak pojedini aspekti
predmeta dokumenta. Deskriptori mogu biti samostalne, pojedinane rijei ili
prekoordinirani termini, koji se sastoje od dvije ili vie rijei u predodreenom
obliku. Obino se dodjeljuje jedna do tri predmetne odrednice, te izmeu pet i
dvadeset i pet deskriptora (Olson, Boll 2001, str. 37). No, Kongresna je knjinica
1996. uvela praksu prema kojoj je dozvoljeno do deset predmetnih odrednica radi
potpunijeg opisa sadraja, ime se gubi razlika izmeu deskriptora i predmetnih
odrednica.
U klasifikacijske sustave ubrajaju se enumerativni i sintetiki klasifikacijski
sustavi. Izvor oznaka su im klasifikacijske tablice. Enumerativni klasifikacijski
sustavi, poput Deweyeve decimalne klasifikacije DDK (Dewey Decimal
Classification DDC) i Klasifikacije Kongresne knjinice KKK (Library of
Congress Classification LCC), u tablicama popisuju sve dozvoljene oznake, za
razliku od sintetikih klasifikacijskih sustava, poput Univerzalne decimalne
klasifikacije UDK (Universal Decimal Classification UDC), ije tablice popisuju
elemente koji se naknadno kombiniraju u klasifikacijske oznake. Najbolje sintetike
klasifikacijske tablice su fasetne, poput Klasifikacije s dvotokom KD (Colon
Classification CC), u kojima su predmeti podijeljeni na sastavne elemente sa
pojedinanih aspekata.
Osnovna razlika u strukturi predmetnih i klasifikacijskih sustava jest ta to su
u predmetnom sustavu termini poredani abecednim slijedom po poetnim slovima
rijei, a u klasifikacijskom su sustavu okupljeni po skupinama i podskupinama te
hijerarhijama po slinosti i srodnosti. No, i u predmetnom sustavu donekle postoji
okupljenost po slinosti, to moe biti sluajno, tj. da i termini okupljeni po
abecednom naelu jesu semantiki povezani (npr. maloljetnost, maloljetniko
prijestupnitvo), ili namjerno, tj. oblikovanjem predmetnih odrednica s
predmetnim pododrednicama (npr. knjiniari obrazovanje).
34

Postoje i djelomino kontrolirani sustavi za oznaivanje i pretraivanje


(semicontrolled). Tu spadaju obogaeni KWIC i KWOC sustavi (enriched
KWIC or KWOC), koji su obogaeni imenima ili drugim dodanim kontroliranim
terminima; te sintaktiki sustavi za oznaivanje i pretraivanje (string indexing
systems). Sintaktiki sustavi temelje se na ideji da je predmetna odrednica reenica
pa se oznaivanje obavlja tako to se analiziraju razliiti aspekti predmeta o kojima
se u dokumentu radi i biljee se odobrenim terminima i tzv. operatorima uloga (role
operators), na temelju kojih raunalo generira jedan niz rijei koji prikazuje sadraj
dokumenta. Zatim raunalo automatski preoblikuje ovaj niz tako da je i svaki
znaajan termin zasebno pretraiv preko indeksa. Zbog pokrivanja pojedinih
aspekata koji su zasebno pretraivi, i ovi se sustavi ubrajaju u fasetne. Primjeri
takvih sustava su britanski PRECIS (Preserved Context Indexing System - Sustav za
predmetno oznaivanje sa sauvanim smislom konteksta), indijski POPSI
(Postulate-based Permuted Subject Indexing Predmetno oznaivanje s preokretom,
utemeljeno na postulatima) i hrvatski Sintaktiki sustav za oznaivanje predmeta
(SSZOP). Iako ovi sustavi do sada nisu zaivjeli, njihova svojstva vrlo su poeljna u
elektronikom okruenju.
U online katalozima i bazama podataka klasifikacijski, abecedni sustavi i
kljune rijei danas se koriste integrirano, te je u pojedinim online katalozima i
bazama podataka razlika izmeu ova tri sustava korisniku nevidljiva, pruajui
poveane mogunosti pretraivanja. Integrirano koritenje razliitih sustava
poeljno je jer svaki od njih omoguava pretraivanje sa drukijih aspekata.

5.2.1. Podjela sustava za oznaivanje i pretraivanje prema prethodnom i


naknadnom oznaivanju
Prekoordinirani sustavi ili sustavi s prethodnim povezivanjem (precoordinated) su
oni u kojima se termini oblikuju u trenutku oznaivanja. Postkoordinirani sustavi ili
sustavi s naknadnim oznaivanjem (postcoordinated) zahtijevaju da korisnik u
samome trenutku pretraivanja oblikuje jedan termin koji se sastoji od niza rijei i
predstavlja traeni koncept. Ovaj se termin sastoji od termina koji su u sustavu
meusobno nepovezani, iako sami mogu biti prekoordinirani (vielani termini).
35

Postkoordinacija se pojavila 1940-ih, kada su nastali prvi sustavi utemeljeni na


kljunim rijeima poput uniterma i koristile se tehnologije pretee raunalnim
tehnologijama, poput sustava tzv. optikog podudaranja (optical coincidence) ili
peek-a-boo sustava. Mogunosti postkoordinacije do izraaja su dole pojavom
raunala, a posebno razvojem online kataloga.
Sintetiki i fasetni klasifikacijski sustavi te sintaktiki sustavi za oznaivanje
i pretraivanje su prekoordinirani sustavi, jer se elementi povezuje u trenutku
oznaivanja. No, online katalozi imaju tu prednost da mogu osigurati
postkoordinaciju, tj. povezivanje u trenutku pretraivanja nekoliko prekoordiniranih
termina ili oznaka, kao i omoguiti pretraivanje samo po jednom elementu
klasifikacijske oznake ili odrednice sintaktikog sustava.
Enumerativni klasifikacijski sustavi i abecedni sustavi su sustavi s
ogranienom ili djelominim prekoordinacijom. Odreeni termini ili oznake mogu i
ne moraju biti prethodno povezani, ve ovisno o koritenim terminima odnosno
oznakama i pravilima sustava.
Nekontrolirani

sustavi

koji

se

temelje

na

kljunim

rijeima

su

postkoordinirani sustavi. U njima se svaka kljuna rije tretira kao jedan termin,
iako pojedine kljune rijei mogu biti prekoordinirane.
U trenutku traenja mogue je naknadno povezivati termine ili oznake (bilo
da su oni kontrolirani ili nekontrolirani, prethodno povezani, abecedni ili
enumerativni), ako online katalog to omoguava. Online katalozi esto omoguuju
pretraivanje po kljunim rijeima iz predmetnih odrednica. Takoer je mogue
pretraivati po pojedinim elementima kontroliranih termina ili oznaka, ukoliko to
sam sustav za oznaivanje omoguava i sam online katalog podrava.

5.3. Kontrolirani sustavi u predmetnom pretraivanju


Kontrolirani sustavi omoguavaju oznaivanje i pretraivanje i po konceptima ili
pojmovima15, a ne samo po rijeima. Kontrolirani sustavi kontrolirani su do
razliitih stupnjeva. Nastali su iz potrebe za rjeavanjem sinonimije, homonimije,

15

Pojam se odreuje kao misao o bitnim karakteristikama onoga o emu mislimo.

36

izraza i razliitih morfolokih oblika rijei prirodnog jezika, s ciljem da se za


pojedine koncepte ili pojmove iz dokumenta osigura jedinstven jezini oblik. U
kontroliranom jeziku za svaki pojam postoji samo jedan termin ili oznaka, odreen
je opseg tog termina ili oznake, hijerarhijski odnosi i odnosi srodnosti mogu biti
eksplicitno prikazani, uspostavljena je kontrola nad razliitim nainima pisanja i
eksplicitno su identificirani koncepti izraeni homonimima upotrebom izraza,
pridjeva, kvalifikatora ili precizne terminologije. U raunalnim katalozima korisnika
se moe uputiti s rijei koju je unio u upit na odobreni termin u kontroliranom
sustavu, ili se pretraivanje moe automatski preusmjeriti na termin iz kontroliranog
sustava. Ova druga mogunost nije preporuena jer korisnici, pokazalo se, ele i
trebaju imati nadzor nad pretraivanjem. Prikaz semantikih odnosa meu
terminima korisniku moe pomoi pri izboru termina ili pri promjeni upita nakon
nezadovoljstva dobivenim rezultatima. U svakom je sluaju preduvjet za uspjeno
predmetno pretraivanje u online katalozima datoteka predmetnih katalonih
jedinica i uputnica povezana s bibliografskom datotekom, s razraenom strukturom
uputnica.
Kontrolirani

sustavi

online

knjininim

katalozima

mogu

biti

klasifikacijski sustavi, popisi predmetnih odrednica, tezaurusi i sintaktiki sustavi.


E. Svenonius (2000, str. 131-132) rabi podjelu kontroliranih jezika na temelju toga
koristi li jezik sintaksu. Jezike koji imaju sintaksu naziva sintetikima, a ostale
enumerativnima. Veina sintetikih jezika ima, dakle, neto to odgovara
reeninom subjektu i predikatu. Primjerice, kategorija Key system u PRECIS-u i
Personality u Klasifikaciji s dvotokom odnose se na ono o emu se govori
(subjekt). Oznaka koja odreuje odnos razliitih znaenjskih elemenata i poblie
odreuje znaenje je operator odnosa (relator) (predikat). Operatori odnosa u
PRECIS-u, sintaktikom sustavu za oznaivanje, zovu se operatori uloga. Oni
uklanjaju vieznanost, odreuju redoslijed jezinih elemenata i pokazuju odnose
meu njima. U Univerzalnoj decimalnoj klasifikaciji, sintetikom klasifikacijskom
sustavu, kao operatori odnosa koriste se matematiki simboli i interpunkcija, koji
razjanjavaju znaenje jezinog elementa, odreuju njihov redoslijed i omoguuju
razlikovanje inae identinih oznaka. Operator odnosa u formatu MARC 21
osigurava prije nemogue postkoordinirano pretraivanje pojedinih elemenata
predmetne odrednice ili klasifikacijske oznake, iako danas gotovo da nema sustava
koji ovu prednost doista koristi (Olson, Boll, 2001, str. 65). U poljima 6XX za
37

podatke o sadraju, potpolja imaju funkciju da odijele elemente prekoordiniranog


jednolanog ili vielanog termina, ali i da odreuju kategoriju svakog potpolja.
Tako je u poljima za predmetne odrednice potpolje $x za tematsku, $y za
vremensku, a $z za zemljopisnu podjelu. U UNIMARC-u je potpolje $x tematska,
$y zemljopisna, a $z vremenska podjela. Primjer za publikaciju Podrka
demokraciji G. Sorosa glasi
606 $aDemokracija$xsocijalizam, kriza$yEuropa, istona$z20. st.
(606 je polje za tematsku predmetnu odrednicu, $a je potpolje za prvi element
unosa, odnosno za pojam u obliku koji propisuje sustav predmetnih odrednica)
(Prirunik za UNIMARC 1999, str. 606-2). Raunalno okruenje, dakle, omoguava
pretraivanje po svakom od ovih aspekata na nain da pretrauje svako od ovih
potpolja, a ne samo jednu odrednicu, kao to je to bio sluaj u papirnom okruenju.
Na ovaj nain prekoordinirani i djelomino prekoordinirani sustavi preuzimaju
svojstva postkoordiniranih sustava. Ovi se aspekti takoer u literaturi nazivaju
fasetama, pri emu se naglasak stavlja na velik potencijal oblikovanja odrednica ili
oznaka uz pomo jasno definiranih faseta, meusobno neovisnih ili povezanih
preciznim sintaktikim pravilima, dostupnih pri raunalnom pretraivanju po bilo
kojem redoslijedu, po hijerarhijskim ili abecednim kriterijima, po obliku,
vremenskom razdoblju ili drugim kriterijima.
S potrebom za integriranjem i usklaivanjem pojedinih informacijskih
sustava, koji koriste razliite kontrolirane sustave za oznaivanje i pretraivanje,
oblikuju se tezaurusi kao alati za povezivanje ovih sustava. Osnovna prednost
tezaurusa jest ta to su u njemu precizno odreeni odnosi ekvivalentnosti, srodnosti i
hijerarhije, za to se koriste simboli BT (broader term iri naziv, N), NT
(narrower term ui naziv, UN), RT (related term srodni naziv, SN), UF (use for
koristiti umjesto nekog drugog naziva) i USE (umjesto ovoga, koristiti neki drugi,
odreeni naziv). Usporedbe radi, u sustavima predmetnih odrednica odnosi su
odreeni samo uputnicama vidi, koje se koriste za odnose ekvivalentnosti, i
uputnicama vidi i, koje se koriste za hijerarhijske odnose i odnose srodnosti.
Proteklih nekoliko desetljea vee knjinice stavljale su primjerke tiskanih
LCSH uz katalog na listiima, meutim, kao problem se pokazalo to to su takvi
sustavi bili namijenjeni prvenstveno knjiniarima i svojim su kraticama,
38

objanjenjima i strunom terminologijom zbunjivali korisnike. U 1980-im godinama


M. Bates i drugi poeli su predlagati oblikovanje tezaurusa za korisnike (end-user
thesauri, user thesauri), za pretraivanje, a ne za oznaivanje, koji bi sadravali puno
vie nedeskriptora po kojima korisnici mogu traiti neki pojam (Oslon, Boll 2001).
Ovi tezaurusi povezuju rijei korisnika na temelju korisnikog jamstva ili jamstva
informacijskoga zahtjeva s rjenikom u bazi, bilo kontroliranim ili nekontroliranim.
Usporedbe radi, J. Aitchinson, A. Gilchirst i D. Bawden (2000, str. 1-3) razlikuju tri
osnovne vrste tezaurusa: klasini tezaurus (classic thesaurus), koji se upotrebljava i
za oznaavanje i za pretraivanje, tezaurus za oznaivanje (indexing thesaurus), koji
se koristi samo za oznaivanje, ija je prednost ta to sadri velik broj sinonima i
uih naziva kojima se mogu obogatiti bibliografski zapisi da bi se poveao broj
pristupnica, te tezaurus za pretraivanje (searching thesaurus), koji se koristi samo
za pretraivanje, a njegova je specifinost ta to pomae u pretraivanju baza
podataka predlaui dodatne termine po kojima se pretrauje, posebice sinonime i
ue pojmove. Tezaurus za pretraivanje koristi se kada se zapisi ne obogauju
dodatnim pristupnicama, a korisnika se na dodatne termine moe uputiti
interaktivno, tako da mu se ponudi dodatni popis termina na odabir, ili automatski
(Bawden 2001, str. 185).
Godine 1994. godine sastavljen je za online okruenje Tezaurus za umjetnost
i arhitekturu (Art and architecture thesaurus), na temelju odreenog broja
dotadanjih, esto ue specijaliziranih popisa termina. Amerika Nacionalna
medicinska knjinica (National Library of Medicine) objavila je 1990. metatezaurus
Jedinstveni medicinski jezini sustav (Unified Medical Language System) koji se
temelji na vie od trideset kontroliranih rjenika iz podruja medicine.
Metatezaurusi omoguuju konverziju termina izmeu razliitih tezaurusa, a ovaj
ukljuuje i druge rjenike kao to su Medicinske predmetne odrednice MeSH
(Medical Subject Headings), tezaurus koji se koristi za oznaivanje baza podataka
Medline i SNOMED (detaljna nomenklatura patologije), i Meunarodna klasifikacija
bolesti (International Classification of Diseases) (Bawden 2001, str. 185). Sam
MeSH ima integrirane termine iz sustava predmetnih odrednica i klasifikacijskih
oznaka, to zbog neodgovarajuih odnosa izmeu termina dvaju razliitih sustava
koji su se razvijali neovisno jedan o drugome inae nije jednostavno postii.
Razvoj tehnologija poput XML-a pospjeuje pristup razliitim kontroliranim
rjenicima putem jednog suelja (vidi, npr., Chaudiron, Ihadjadene, Role 2002;
39

Light, R. 2001), to je alternativa izradi skupih integriranih kontroliranih sustava


poput MeSH-a i Jedinstvenog medicinskog jezinog sustava.
Iako se sintaktiki sustavi danas gotovo uope ne koriste, njihova
fleksibilnost i mogunost pristupa svakom aspektu predmeta nekog dokumenta ine
ga dobrim kandidatom za online katalog, to bi zahtijevalo odreenu razinu
prilagodbe (Olson, Boll 2001, str. 191).

5.3.1. Klasifikacijski sustavi


U klasifikacijskim sustavima predmeti dokumenata okupljeni su prema slinosti i
srodnosti po skupinama i podskupinama, odnosno hijerarhijama. U klasifikacijske
sustave ubrajaju se enumerativni i sintetiki klasifikacijski sustavi. Enumerativni
klasifikacijski sustavi, poput Deweyeve decimalne klasifikacije i Klasifikacije
Kongresne knjinice, u tablicama imaju popisane sve dozvoljene elemente, za
razliku od tablica sintetikih klasifikacijskih sustava u kojima su popisani samo
elementi koji se kombiniraju u klasifikacijske oznake. To omoguava znatno
fleksibilnije izraavanje i prikaz razliitih sloenih koncepata. Najbolje sintetike
klasifikacijske tablice su one fasetne, u kojima su predmeti prikazani sa svih vanih
stajalita, a svako stajalite je jedna faseta kojoj je pridruen jedan simbol, na
temelju kojih se zatim slau primjerene oznake. Svaka faseta ima vlastitu
hijerarhiju, svojstva i oznake pa je tipina fasetna klasifikacija multihijerarhijska. U
tome je oigledna razlika od ostalih sintetikih klasifikacija, u kojima se hijerarhije
ne mogu meusobno jednostavno razlikovati po prepoznatljivim oznakama. to ima
vie faseta, to je precizniji prikaz sadraja, ali je oznaka dua.
Knjinini klasifikacijski sustavi desetljeima su se koristili za organizaciju
bibliografskih izvora, a najvie za raspored grae na policama. Od nedavna se
provode brojna istraivanja o tome kako poboljati knjinine klasifikacijske sheme
radi usklaivanja s potrebama novih informacijskih okruenja. Od 1960-ih
klasifikacijski sustavi poeli su se ponovno razmatrati kao sustavi za oznaivanje i
pretraivanje u elektronikom okruenju i online katalozima. U 1980-im i 1990-im
online katalozi poeli su razvijati pristupe i metode za odabir termina iz abecednog

40

popisa koji bi ih zatim doveo do strunih oznaka, po kojima bi mogli nastaviti


pretraivanje (Olson, Boll 2001, str. 76).
Prva istraivanja klasifikacijskih sustava uglavnom su bila usmjerena na
oznaivanje, a s pretraivakim aspektom detaljno se prvi put bavio projekt OCLC-a
pod vodstvom K. Markey, zapoet 1983. (Olson, Boll 2001, str. 76). Bibliografski
zapisi obogaeni su prijevodima klasifikacijskih oznaka iz Deweyeve decimalne
klasifikacije, pri emu je neke bilo potrebno prilagoditi krajnjim korisnicima.
Pokazalo se da su rezultati predmetnog pretraivanja poboljani. Godine 1993.
objavljena je i elektronikom okruenju prilagoena inaica Univerzalne decimalne
klasifikacije, tzv. Master Reference File (MRF), a ubrzo i Klasifikacije Kongresne
knjinice i Deweyeve decimalne klasifikacije.
Prvi i jedini opi fasetni klasifikacijski sustav oblikovao je S. R.
Ranganathan 1920-ih godina, pod nazivom Klasifikacija s dvotokom, koja se
temelji na pet faseta. Kasnije je razvijeno nekoliko specijaliziranih fasetnih
klasifikacija poput Klasifikacije knjinine i informacijske znanosti (Classification
of Library and Information Science) i ostalih sustava koji se temelje na fasetama,
poput sustava za lanano oznaivanje (chain indexing systems) i sintaktikih
sustava. Jo je S. R. Ranganathan za fasetnu klasifikaciju razvio abecedno lanano
kazalo (chain index) radi olakavanja pristupa strunim oznakama i fasetama koje
oznaku sainjavaju. Lanana kazala sastoje se od bibliografskih opisa poredanih u
strunom slijedu pod strunom oznakom faseta iz strune oznake djela koje opisuju,
a ove su oznake putem uputnica izraenih rijeima povezane s viim hijerarhijskim
razinama sloenog predmeta.
Tijekom 1990-ih godina eksperimentiralo se s primjenom lananih kazala u
online

katalozima

za

enumerativne

Deweyevu

decimalnu

klasifikaciju

Klasifikaciju Kongresne knjinice, namijenjene korisnicima, a ne klasifikatorima


(Olson, Boll 2001, str. 174). Tehnika se pokazala kvalitetnom, meutim, uvidjelo se
i da je kao preduvjet za izradu lananih kazala u enumerativnim klasifikacijama
potrebno uskladiti nekonzistentne elemente postojeih tablica. Za razliku od
lananih

kazala,

sintaktiki

su

sustavi

potpuno

neovisni

odreenom

klasifikacijskom sustavu. Stoga valja razmotriti mogunost primjene sintaktikih


sustava u enumerativnim klasifikacijskim sustavima kao nainu pristupa pojedinim
aspektima iz klasifikacijskih oznaka.

41

Fasete omoguavaju specifinije i detaljnije oznaivanje, nego to je to


sluaj s enumerativnim sustavima, te pretraivanje po pojedinim elementima
sloenih oznaka, a posebno putem rijei i prijevoda tih oznaka. Fasetnost se nastoji
usavriti i u Deweyevoj decimalnoj klasifikaciji, Univerzalnoj decimalnoj
klasifikaciji (McIllwaine 2001), Blissovoj bibliografskoj klasifikaciji (Bliss
Bibliographic Classification) (Broughton 2001), a P. Cochrane tvrdi da e
Klasifikacija Kongresne knjinice s vremenom postati fasetna (2002). Primjena
faseta u elektronikom okruenju posebno je korisna zbog jednostavne mogunosti
pretraivanja po svakoj pojedinoj faseti.
Tradicionalni klasifikacijski sustavi u online pretraivanju koriste se za
pretraivanje po samoj klasifikacijskoj oznaci, ali najbolje je kada se u abecednom
kazalu klasifikacijskog sustava moe odabrati eljeni termin (prijevod oznake),
povezan s klasifikacijskom oznakom, uz pomo koje se pronalaze bibliografski
zapisi. Mogu se koristiti i kao osnovni oblik mehanizma povratne informacije, na
temelju ega se zatim pronalaze i drugi zapisi s istom klasifikacijskom oznakom kao
prethodno dobiveni relevantni zapisi.
U mrenom okruenju klasifikacijski sustavi potencijalno imaju dodatna
svojstva koja pospjeuju mogunosti pretraivanja poput kraenja, prebiranja po
hijerarhijskim strukturama, pretraivanja po svakom, a ne samo prvom elementu
klasifikacijske oznake, ukljuujui i u enumerativnim klasifikacijskim sustavima
(npr. pronai samo udbenike u ovom brojanom nizu), ukoliko tablice osiguravaju
dovoljno preciznosti za ovakvu vrstu pristupa (Olson, Boll 2001, str. 185).
Klasifikacijski sustavi u WebPAC-ima lake se mogu eksploatirati za bolji prikaz
hijerarhijskih odnosa i faseta. U web-suelju takoer nisu potrebne klasifikacijske
oznake, ve korisnicima puno prikladniji prijevodi, termini koji prirodnim jezikom
opisuju oznaku u tablicama. Prevoenje naziva i opisa oznaka u klasifikacijskim
tablicama na jezik krajnjih korisnika pokrenuo je OCLC za Deweyevu decimalnu
klasifikaciju (Vizine-Goetz 1996), a u pojedinim katalozima koriste se inaice koje
su izradile same knjinice, kao na primjer Knjinica Hrvatske akademije znanosti i
umjetnosti na temelju UDK (Lei, Cvita 2001).
Dok knjinini softveri danas omoguavaju pretraivanje po klasifikacijskim
oznakama, sve mogunosti hijerarhijskog sustava i prebiranja po irim i uim
oznakama rijetko su prisutne. Format MARC omoguava i pretraivanje po svim
elementima oznake, a ne samo po prvim (to vrijedi i za predmetnu odrednicu), no
42

malo koji online knjinini katalog to dozvoljava. Isto vrijedi i za kraenje, na koje
dodatno utjee i nain na koji je klasifikacijska oznaka oblikovana te je i na to
potrebno misliti pri izradi oznaka. Poseban je problem povezivanje popisa signatura
s klasifikacijskim tablicama.
U mrenom okruenju prikaz klasifikacijskih sustava je vizualiziran i
korisnicima razumljiviji, iako postoje razliiti tipovi ljudi (vizualni, verbalni,
apstraktni) te je za sve njih potrebno osigurati primjereno suelje. Skraeni oblik
klasifikacijskih tablica, tzv. pretraivako stablo (search tree, subject tree) korisniku
omoguava lociranje odreenog predmeta i pregledavanje viih i niih razina
specifinosti. Postoje razliite vrste ovakvih sustava s raznolikim mogunostima.
Veina ih prikazuje broj zapisa i hipervezu na zapise koji sadre odreene oznake.
Na Internetu se esto koriste ovakva pretraivaka stabla utemeljena na
Univerzalnoj decimalnoj klasifikaciji, Deweyevoj decimalnoj klasifikaciji i
Klasifikaciji Kongresne knjinice, obino u kombinaciji s web-trailicom, no takvi
su sustavi vrlo iroko postavljeni i ne mogu se mjeriti sa specifinou i preciznou
pristupa kakav osiguravaju knjinini klasifikacijski sustavi.
Vano je naglasiti da se u ovim sustavima ne koriste klasifikacijske oznake,
ve njihovi prijevodi, koje su korisnicima razumljivije i jednostavnije za koritenje.
Tzv. predmetni gatewayi kontrolirane kvalitete (quality-controlled subject
gateways) osiguravaju razraeniji predmetni pristup grai putem klasifikacijskih
sustava, najee zajedno sa sustavima predmetnih odrednica i tezaurusima. Tako,
npr. SOSIG koristi Univerzalnu decimalnu klasifikaciju, BUBL Deweyevu
decimalnu klasifikaciju, a OMNI klasifikacijski sustav amerike Nacionalne
medicinske knjinice (Koch 2000). U okviru stvaranja globalne informacijske
infrastrukture valja istaknuti meunarodni projekt DESIRE (Development of a
European Service for Information on Research and Education), pokrenut s ciljem
razvoja europske mree meusobno pretraivih informacijskih izvora namijenjenih
akademskoj zajednici, u okviru kojeg se ispituju tehnike automatske klasifikacije na
temelju ugraenih metapodataka, baze podataka koje puni robot i distribuirano
mreno oznaivanje.
Kada se govori o globalnoj informacijskoj infrastrukturi i prilagodbi
klasifikacijskih sustava elektronikom okruenju, za povezivanje i pretraivanje
razliitih klasifikacijskih sustava potrebno je uspostaviti zajednike elemente. Danas
su takva nastojanja u tijeku, ali na samome poetku uspostavljanja osnovne
43

klasifikacijske strukture. I. Dahlberg (2001) uspostavila je tablicu od 81 jednakosti


izmeu vodeih klasa iz DDK, UDK, KKK, BK i KD sa strunim skupinama u
autoriinoj Klasifikaciji za kodiranje informacija (KKI) (Information Coding
Classification ICC). U matricu koja se sastojala od devet podruja i devet faseta
smjestila je sve skupine KKI-a i popunila je odgovarajuim oznakama
klasifikacijskih sustava. Veina polja mogla se popuniti i sada ova matrica
predstavlja temelj za prouavanje kompatibilnosti na uim razinama strunih
podruja. KKI moe biti vaan alat i pokazatelj pri reviziji klasifikacijskih tablica.
Revizija klasifikacijskih tablica moe se temeljiti i na istraivanju
korisnikih potreba. Jedno takvo istraivanje provedeno za Deweyevu decimalnu
klasifikaciju i Kinesku decimalnu klasifikaciju pokazalo je da neki usko povezani
predmeti u tablicama nisu hijerarhijski grupirani (Pu 2002). Istraivanje je
provedeno na temelju podataka o posudbi s ciljem utvrivanja srodnih predmeta na
temelju jedinica grae koje posuuju slini korisnici, a kao zakljuak se predloilo
obogaivanje klasifikacijskih tablica s odnosima meu klasama utvrenih na temelju
korisnikih potreba.
H. Olson i J. Boll (2001, str. 193-196) opisuju kako bi trebalo oblikovati
suelje za predmetno pretraivanje po klasifikacijskim oznakama, pri emu veina
vrijedi i za pretraivanje po predmetnim odrednicama. Sami istiu kako je upitno
jesu li sva ta obiljeja isplativa s obzirom na sredstva potrebna za njihovu
implementaciju, ali su ona svakako poeljna i tehniki izvediva.
Istiu da bi, openito, upute trebale biti jasne i na laikom jeziku. Predlau
otvaranje prozoria s kratkim objanjenjem u trenutku prelaska kursora nad
odreenim terminom, a pogotovo nad sliicom. Jasne upute o tome kako
jednostavno iskljuiti ili ukljuiti ovu opciju neophodne su.
to se tie samog prikaza i oblikovanja suelja, potrebno je osigurati
nekoliko razliitih suelja za korisnike, od poetnikog do naprednog. Osim na
poetnikom suelju, korisnik treba imati mogunost ui u eljeni dio sustava bez da
prolazi nepotrebne korake. Bez obzira na to na kojem se stadiju pretraivanja
korisnik nalazi, uvijek treba biti u mogunosti ograniiti pretraivanje po godini,
jeziku, zemlji izdavanja i drugim kriterijima. Sustav treba dopustiti nekoliko tehnika
pretraivanja poput komandnog, putem izbornika i rangiranja po relevantnosti te
dopustiti prelazak s jedne tehnike na drugu u bilo kojem stadiju pretraivanja. Upute

44

o pretraivanju trebaju jasno opisati je li prekoordinirani skup termina obavezan,


dozvoljen ili ne postoji. Isto se odnosi na kriterije ograniavanja pretraivanja.
Osim po klasifikacijskim oznakama, valja omoguiti i pretraivanje po
signaturi. Korisniku treba biti jasno koja je razlika izmeu ta dva popisa te treba
postojati mogunost jednostavnog prelaska s jednog popisa na drugi. Ukoliko
traena klasifikacijska oznaka ili signatura ne postoji, rezultat pretraivanja treba
biti ispis najbliih oznaka ili signatura u hijerarhijskoj strukturi, s pojanjenjem toga
rezultata. Treba postojati mogunost prebiranja po brojanom nizu, pri emu valja
prikazati i pripadajue prijevode uz svaki broj ili oznaku. U sustavu trebaju postojati
dva popisa prijevoda pojedinih oznaka, jedan za korisnika, a drugi za knjiniara.
Pristup popisu signatura ili klasifikacijskih oznaka treba osigurati i putem oznake i
rijeima kao to su predmetne odrednice, kljune rijei iz opisa, biljeaka, indeksa
ili drugih termina koritenih za opis broja u tablicama. Kada god se prikae
klasifikacijska oznaka ili signatura, korisnik treba imati mogunost da otvori prozor
u kojem e se prikazati taj broj i njegove ire i ue razine, zajedno sa svim
prijevodima. Pri pretraivanju po signaturama, prikaz zapisa unutar jedne skupine
treba biti mogu prema popisu signatura, po kronolokom slijedu, godini izdavanja,
relevantnosti i ostalim vanim kriterijima. Valja omoguiti kombinirano oblikovanje
upita po predmetnim odrednicama ili kljunim rijeima s klasifikacijskim oznakama
koritenjem Booleovih operatora. Za vrijeme pretraivanja po kljunim rijeima iz
razliitih dijelova tablica s Booleovim operatorima, treba omoguiti prikaz
klasifikacijskih oznaka s prijevodima, zajedno s brojem bibliografskih zapisa sa
svakom oznakom iz popisa signatura kao i s traenom kombinacijom. Takoer, uz
svaku prikazanu oznaku valja prikazati biljeku o koritenju u tablicama, npr. kada
je uvedena u tablice.
Prebiranje valja omoguiti po klasifikacijskim tablicama pri emu uz sve
oznake treba prikazati oznake i prijevode oznaka, a uz svaku oznaku treba
omoguiti prijelaz na popis signatura, a uz signaturu broj dokumenata s osnovnim
podacima (autor, naslov, godina izdavanja). Isto je tako potrebno omoguiti
prebiranje po popisu signatura, te jednostavan prelazak s klasifikacijskih tablica na
popis signatura i obrnuto, i sa skraenih zapisa na potpune. Valja integrirati popise
signatura knjinica u skupnom katalogu i omoguiti ogranienje pregledavanja samo
odreenog popisa.

45

Prebiranje valja omoguiti i po hijerarhijskim odnosima, tj. treba imati


mogunost odlaska s glavnih skupina na podskupine do najue oznake, s
pridruenim prijevodima, kao i u obrnutom smjeru. Treba postojati mogunost da se
od struke doe do konkretne jedinice i obrnuto (npr. od biologije do dijelova biljke).
Koristan bi bio ekspertni sustav koji bi automatski za sintetiziranu signaturu
pokazao sve hijerarhijske popise za pojedine elemente signature. To MARC
omoguava i za predmetne odrednice. Ako pretraivanje poinje s rijeju, sustav bi
trebao prikazati i popis predmetnih odrednica i klasifikacijske tablice, ostavljajui
korisniku da sam napravi izbor.
Predmetno pretraivanje po klasifikacijskim oznakama u dananjim se online
katalozima ne koristi dovoljno, iako je ve dugo poznato da se ovom vrstom
pretraivanja dobivaju drukiji rezultati nego pretraivanjem po rijeima i da ta dva
pristupa pretrauju dokumente koji se preklapaju, ali ne i udvostruavaju. Format
MARC 21 omoguuje predmetno pretraivanje na puno sofisticiraniji nain s vie
aspekata no to je to bilo mogue do tada. Iako ova vrsta pretraivanja ne spada u
ono to bi svakodnevni, usputni korisnik trebao, trebalo bi ju omoguiti za potrebe
iscrpnih i temeljitih predmetnih pretraivanja.
Istraivanja su pokazala da se najbolji rezultati pretraivanja dobiju
kombiniranjem kontroliranog strunog ili predmetnog sustava s nekontroliranim
rjenikom te se sva tri pristupa trebaju koristiti ukoliko se eli najpotpuniji mogui
popis rezultata. Meutim, samo je mali broj online kataloga uspjeno
implementiralo sindetike strukture klasifikacijskih sustava ili sustava predmetnih
odrednica u kojima se moe prebirati po hijerarhijskim odnosima koji zbog toga
korisnicima ostaju skriveni (Olson, Boll 2001, str. 185). Veina online kataloga
prua mogunosti pretraivanja po predmetnoj odrednici ili kljunoj rijei, mnogi i
po signaturi, neki i po poetku signature, neki omoguavaju prebiranje po popisu
signatura, ali gotovo da nema kataloga koji sustav omoguava proirenje ili suenje
upita prebiranjem po strunoj oznaci. Rijetki su i online katalozi koji doputaju
oblikovanje kombiniranih upita od predmetnih odrednica, kljunih rijei i
klasifikacijskih oznaka. Primjerice, korisno bi bilo za upit o arhitekturi u Barceloni
prije Gaudija oblikovati upit na sljedei nain: (klasifikacijska oznaka za
arhitekturu grada Barcelone) OR (predmetna odrednica za arhitekturu grada
Barcelone) OR (kljune rijei Barcelona AND arhitektura) NOT ((klasifikacijska
oznaka za Antonia Gaudija) OR (predmetna odrednica za Antonia Gaudija)).
46

5.3.2. Popisi predmetnih odrednica


Popisi predmetnih odrednica ili predmetni sustavi kontrolirani su rjenici za
oznaivanje koji se sastoje od rjenika i sintakse. Rjenik je popis dozvoljenih ili
odobrenih rijei, na temelju kojih se sastavljaju jednostavne ili sloene predmetne
odrednice. Sintaksu ine pravila koja propisuju odreivanje predmeta dokumenta i
oblikovanje predmetne odrednice, koja se moe sastojati i od pododrednica (npr.
vremenskih, geografskih i formalnih). Cilj sustava predmetnih odrednica jest saeti
itav sadraj dokumenta uz pomo jednog ili vie dozvoljenih termina koji su
jednako specifini kao i predmet koji oznauju. Neke je predmete nemogue
prikazati jednom predmetnom odrednicom, u kojim se sluajevima dodjeljuje njih
nekoliko, obino jedna do tri (Olson, Boll 2001, str. 37), iako je Kongresna
knjinica 1996. uvela praksu prema kojoj je dozvoljeno do deset predmetnih
odrednica radi potpunijeg opisa sadraja.
Vano je omoguiti pretraivanje po pojedinim podpredmetnicama, ime se
poveava broj potencijalnih predmetnih pristupnica. K. Drabenstott i M. Weller
(1996b) predlau tehniku koju nazivaju stablo za odluivanje (decision tree), a
temelji se na ideji o programiranju suelja na nain da se za svaki pojedini upit
utvrdi najuinkovitiji nain pretraivanja. Ukoliko se rijei iz upita potpuno
preklapaju s predmetnom odrednicom, onda se pretraivanje provodi u datoteci
predmetnih odrednica, a ako ne, pretraivanje se prvo provodi po kljunim rijeima
iz predmetnih odrednica, zatim iz naslova i tako dalje. Valja naglasiti da je korisnika
uvijek potrebno uputiti u nain na koji sustav obrauje njegov upit.
Popis predmetnih odrednica moe imati uputnice na kontrolirane termine ili
integriran automatski sustav prevoenja na rijei sustava, kakav mehanizam ima
MeSH, pri emu treba postaviti uputu o provedenom postupku. Neki sustavi poput
LCSH nemaju ovakva rjeenja te pribjegavaju ukljuivanju ekvivalenata u svoju
datoteku predmetnih preglednih katalonih jedinica i uputnica. To se moe ostvariti
na dva naina, ukljuivanjem svakog termina u hijerarhijsku strukturu, ili izradom
uputnica sa svih drugih ekvivalentnih termina za vrijeme izrade nove odrednice.
Pokazalo se da korisnicima nije uvijek jasno kako uputnice funkcioniraju. Stoga je
potrebno osigurati upute o tome to su npr. nedeskriptori, iri, ui i srodni termini i
to koja uputnica znai. U svakom sluaju, korisnici bi uvijek trebali znati i vidjeti
gdje se u hijerarhiji nalaze, pa je u online katalogu potrebno uvijek prikazati jednu
47

ili dvije ire ili ue razine. Primjerice, problem u online inaici LCSH je taj to
korisnik mora uvijek pritisnuti tipku Enter da bi od Business dobio Business
intelligence (Wasylenko 2000).
LCSH je u Sjevernoj Americi najraireniji sustav predmetnih odrednica te,
premda nije prilagoen online okruenju, Kongresna knjinica pozitivno reagira na
kritike i provodi preinake. Kongresna knjinica poveala je broj predmetnih
odrednica koje se dodjeljuju dokumentu, a A. O'Brien (1994, str. 225-226) sugerira
da bi, po uzoru na Nacionalnu medicinsku knjinicu, trebala napraviti razliku
izmeu glavnih i sporednih predmetnih odrednica, kako bi se sauvala mogunost
pristupa po glavnom predmetu, a ne bi se onemoguio pristup po sporednim
predmetima.
Radi potpunijeg pristupa s razliitih aspekata, OCLC nastoji povezati LCSH
i Klasifikaciju Kongresne knjinice (Olson, Boll 2001, str. 141). Budui da se
klasifikacijski sustavi temelje na strunom rasporedu, a predmetni na abecednom,
integrirani bi sustav omoguio prikazivanje i pristupanje svakoj temi i grai u
razliitim kontekstima i sa razliitih aspekata. Meutim, povezivanje ovih dvaju
sustava u puno je sluajeva nemogue jer ne postoje ekvivalenti. MeSH je uspjeno
integrirao termine iz sustava predmetnih odrednica i klasifikacijskih oznaka.
Jednostavnije rjeenje za povezivanje popisa predmetnih odrednica s
klasifikacijskim sustavima jesu tezaurusi, gdje se prvo okupljaju pojmovi u fasete i
hijerarhije, a zatim se svakom pojmu pridrui predmetna ili struna oznaka u
trenutku kada se sustav oblikuje. Primjeri takvih tezaurusa su Tezaurus ERIC-ovih
deskriptora (Thesaurus of ERIC descriptors) i Tezaurus za umjetnost i arhitekturu,
koji su specijalizirani pa ih je jednostavnije oblikovati nego opi tezaurus. Kao
model za jedan opi tezaurus mogao bi posluiti online tezaurus MeSH, u kojem je
svaki predmet sadran i u popisu predmetnih odrednica i deskriptora, a ima
integrirane termine iz sustava predmetnih odrednica i klasifikacijskih oznaka. Ovi
tezaurusi pokazuju da se predmetne odrednice mogu strukturirati u abecedno i
hijerarhijski koordinirane sustave. to se tie spajanja LCSH i Klasifikacije
Kongresne knjinice, moda je bolje, smatra se, stvoriti vrstu sindetiku strukturu
za sam sustav LCSH, kakvu ima MeSH (Olson, Boll 2001, str. 142).

48

5.3.3. Oznaivanje na temelju kontroliranih sustava


Jezik ima posebno vanu ulogu u pretraivanju. Korisnik postavlja upit rijeima, a
informacijski sustav sadri informacije o dokumentima izraene najee rijeima.
Komunikacija izmeu poiljatelja i primatelja uspjena je ukoliko obje strane
razumijevaju poruku na isti nain. Stoga su pretraivanje i oznaivanje dva
meusobno povezana procesa koja se moraju temeljiti na istoj terminologiji. Na
pretraivanje utjee i kvalitetno oznaivanje jedinica grae prema kontroliranim
sustavima, kao i kvaliteta samog kontroliranog sustava. Oznaivanje i kontrolirani
sustav treba prilagoditi korisnikoj zajednici (Bates 1989b; Hjorland, Nielsen 2001;
Pu 2002).
O oblikovanju kontroliranih sustava kao i o predmetnom oznaivanju postoji
opsena literatura, no detaljno obraivanje te tematike nadilazi predvieni opseg
ovoga rada. Stoga emo se ovdje ograniiti na osnovnu problematiku.
Prema standardu ISO 5963-1985 za predmetno oznaivanje, tri su osnovna
koraka u predmetnom oznaivanju: odreivanje teme ili sadraja jedinice, pojmovna
analiza radi utvrivanja koji se aspekti jedinice trebaju prikazati u bibliografskom
zapisu, i prevoenje pojmova ili aspekata na kontrolirani rjenik, ime se oblikuju
pristupnice. Svi ovi koraci trebaju biti usklaeni s pravilima odreene knjinice ili
standardima poput popisa predmetnih odrednica ili klasifikacijskih tablica.
Na pretraivanje posebno utjee tonost, iscrpnost, specifinost i
konzistentnost oznaivanja (Olson, Boll 2001, str. 88). Tonost oznaivanja
obuhvaa sposobnost osobe koja provodi oznaivanje da identificira pojmove koje
je potrebno predstaviti i sposobnost da te pojmove prevede na termine kontroliranog
rjenika. Nakon utvrivanja sadraja i predmeta dokumenta, potrebno je odrediti
koliko e se aspekata prikazati predmetnim odrednicama, deskriptorima i/ili
klasifikacijskim oznakama. Knjinini katalozi tradicionalno imaju relativno nisku
razinu iscrpnosti. Iscrpnost ili dubina spadaju u pojmovnu analizu, nakon koje
slijedi prevoenje. U prevoenju je vana specifinost koja se moe opisati kao
hijerarhijska razina prikaza predmeta, a moe se podijeliti na tri imbenika:
specifinost i prikladnost rjenika (koliko su hijerarhijske razine samog rjenika
specifine), specifinost primjene (pravilo je da se upotrijebi najui postojei
termin) i specifinost termina u kontekstu danog kataloga (visoka specifinost znai
da je termin u katalogu relativno rijedak; ova specifinost treba biti imbenik u
49

odabiru vrste kontroliranog rjenika prema katalogu, no, knjinica esto nema puno
izbora). Svi ovi imbenici utjeu na preciznost i odziv u pretraivanju. Veina
dokumenata ima glavni predmet koji e osobe koje vre oznaivanje uglavnom isto
odrediti; meutim, oznaivanje sporednih predmeta moe znatno varirati.
Konzistentnost se odnosi na potrebu da se isti predmeti oznae istim terminima,
kako bi u katalogu bili okupljeni slini predmeti, to se u praksi pokazalo teko
izvedivim. Konzistentnost je obrnuto proporcionalna s iscrpnou i specifinou jer
visoka razina iscrpnosti ili visoka razina specifinost dovode do niske razine
konzistentnosti (Olson, Boll 2001, str. 89).
Kvaliteta samog kontroliranog sustava takoer utjee na uspjenost
predmetnog pretraivanja. Za izbor termina koji ulaze u kontrolirani rjenik
tradicionalno se primjenjuju kriteriji knjievnog jamstva (literary warrant),
korisnikog jamstva (use warrant) i strukturalnog jamstva (structural warrant)
(Svenonius 2000, str. 135-137). Knjievno jamstvo zahtijeva uvrtavanje termina na
temelju grae koju je potrebno opisati, korisniko jamstvo odnosi se na potrebu da
se uvrste oni termini ili nazivi koje koristi korisnik pa je vano da se ukljue svi
nazivi pod kojima se pojam moe pronai, a strukturalno jamstvo postoji zbog
potrebe za ukljuivanjem onih termina koji nisu odabrani ni prema prvom, niti
prema drugom jamstvu, ali su neophodne zbog strukturalne funkcije u rjeniku, npr.
zbog nadopunjavanja praznina u hijerarhiji ili okupljanja uih termina. esto se
istie da su najbolji izvor za kontrolirani sustav korisnici i naini na koje provode
pretraivanja, a tek onda jedinice grae (Bates 2002; Cochrane 2002).
Meutim, oblikovanje sustava prema ovim jamstvima esto nije u potpunosti
mogue. Na primjer, postoje sustavi koji se koriste globalno pa je teko slijediti
knjievno jamstvo. Postavlja se i pitanje treba li uvoditi nadzor nad rijeima iz
drutvenih i humanistikih znanosti koje imaju jako puno znaenja (npr. kultura) i
ima li to uope smisla. Slino tome je pitanje interdisciplinarnih rjenika jer mnoge
rijei imaju razliita znaenja u razliitim disciplinama. Osim toga, kontrolirani
sustavi za grau u video ili audio formatu imaju posebnih potreba, pa je tako npr. za
oblikovanje Tezaurusa za umjetnost i arhitekturu uvedeno predmetno jamstvo
(object warrant), prema kojem su dozvoljeni svi nazivi koje umjetniki predmeti
mogu imati.
U posljednje se vrijeme istraivanja sustava za oznaivanje i pretraivanje
bave sueljem (npr. kako pospjeiti korisnikov odabir termina za pretraivanje),
50

poboljanjem prirodnog jezika kao sredstva pretraivanja, ili hipertekstom (za


povezivanje srodnih jedinica grae), a malo se govori o uinkovitosti termina za
prikaz pojmova iz dokumenata ili samih dokumenata. Takva su istraivanja
potrebna jer je u doba kada je nastala veina kontroliranih sustava koja se danas
koristi okruenje uglavnom bilo papirno.

5.3.3.1. Automatizacija oznaivanja na temelju kontroliranih sustava

Kada se koriste kontrolirani jezici, oznaivanje radi ovjek, iako su dosadanja


istraivanja usmjerena ka automatizaciji ovoga procesa u pojedinim segmentima
dala uspjene rezultate. Zbog ogranienog opsega ovoga rada, u ovu se tematiku
nee dublje zalaziti.
E. Svenonius (2000, str. 132) navodi da su algoritmi pri preslikavanju rijei
iz prirodnog jezika na rijei kontroliranog jezika potrebni za izdvajanje
terminologije kontroliranog jezika iz teksta na prirodnom jeziku, za izdvajanje i
formalizaciju semantikih informacija u rjenicima prirodnog jezika radi uporabe u
kontroliranom jeziku (homonimi, polisemi, sinonimi, hijerarhijski odnosi i odnosi
srodnosti), za kategorizaciju terminologije kontroliranog jezika po semantikim i
gramatikim kategorijama te za oblikovanje termina kontroliranog jezika
(predmetnih odrednica).
U prirodnim i tehnikim znanostima jednostavno je razlikovati termine od
rijei koje to nisu. Postoje i neki automatski naini na koje se to moe na temelju
statistike i leksiko-gramatikih svojstava nizova znakova. No, u drutvenim i
humanistikim znanostima znaenja se esto iznova definiraju i mijenjaju
(Svenonius 2000, str. 133), to dodatno komplicira oblikovanje kontroliranih
sustava.
Nakon izdvajanja termina i utvrivanja semantike kategorije potrebno je
utvrditi njihove odnose ekvivalentnosti i hijerarhinosti. to se tie automatizacije
utvrivanja odnosa ekvivalentnosti, ono moe biti jednostavno, ukoliko su termini
morfoloki srodni. Mnogi dananji sustavi za pretraivanje ve osiguravaju ovu
vrstu povezivanja, npr. automatsko utvrivanje oblika u jednini i mnoini ili
uklanjanje sufiksa radi okupljanja termina s istom osnovom. Vjeruje se da e s
51

vremenom veina sustava za pretraivanje ugraditi algoritme za ujednaavanje


ortografskih, sintaktikih i leksikih oblika. Za rijei koje su semantiki, ali ne i
morfoloki ekvivalentne, potrebni su sofisticiraniji postupci i rjenici, tezaurusi,
pojmovnici, ili baze termina za automatsko utvrivanje odnosa sinonimije.
Hijerarhijske odnose teko je automatski ustvrditi. Ono to jest mogue je okupiti
termine na temelju njihovih slinih statistikih distribucija i zatim ih runo
hijerarhijski poredati.
Kvalitetno oznaivanje, uspjeno pretraivanje i uinkovito automatsko
oznaivanje ovise o mogunosti definiranja predmeta. Stupanj do kojeg se moe rei
da se u nekom dokumentu radi o neemu ovisi o nekoliko imbenika, od kojih su
najvanija obiljeja jezika koji se koristi. To se moe ilustrirati koritenjem modela
predmetne analize koja se temelji na reeninoj gramatici (Svenonius 2000, str. 4647).
Postupci za automatizaciju oznaivanja i dalje se intenzivno istrauju. Danas
automatizacija omoguuje premoivanje jaza izmeu rjenika koji rabi korisnik i
kontroliranog rjenika koji postoji u katalogu. Suvremeni razvoj automatizacije
oznaivanja na temelju kontroliranih sustava temelji se na raunalnoj obradi
prirodnog jezika (Slavi 1998, str. 107) (vidi poglavlje 5.6.).

5.4. Prirodni sustavi u predmetnom pretraivanju


Prirodni sustavi za oznaivanje temelje se na rijeima preuzetima iz same jedinice
grae, a ne na terminima preuzetima iz nekog kontroliranog sustava za oznaivanje.
Sve rijei koje se u dokumentu spominju potencijalni su termini za oznaivanje. U
praksi oznaivanje prirodnim jezikom obuhvaa rijei iz naslova, iz ostalih polja
katalonog zapisa (npr. polje za kratki opis ili sinopsis), saetka ili potpunog teksta
dokumenta.
Prirodni sustavi za oznaivanje su postkoordinirani sustavi jer termine za
pretraivanje oblikuje korisnik u trenutku postavljanja upita. O sustavima za
oznaivanje rijeima prirodnog jezika M. Mikai (1996) govori kao o sustavima
bez gramatike, a E. Svenonius (2000, str. 131) kao o enumerativnim predmetnim
jezicima ili jezicima bez sintakse (za razliku od sintetikih predmetnih jezika), jer se
52

rijei iz teksta dokumenta tom dokumentu pridruuju kao niz slobodnih, meusobno
nepovezanih rijei. Drugim rijeima, za razliku od kontroliranih sustava za
oznaivanje, u prirodnim sustavima ne postoje propisani naini oblikovanja termina.
Prvi popisi kljunih rijei koji su se izraivali raunalno su unitermi i rijei
iz naslova (KWAC, KWIC i KWOC). Oznaivanje prirodnim jezikom u veini
dananjih sustava provodi se automatizirano, tj. raunalom koje izrauje invertirane
datoteke. Invertirane datoteke popisuju i okupljaju sve rijei iz svakog pojedinog
zapisa po odreenim poljima iz katalonih zapisa. Rijei koje nisu obuhvaene
invertiranim datotekama, poput lanova, veznika i prijedloga, ine tzv. stop-listu.
Pretraivanje se temelji na usporedbi rijei iz upita s rijeima u invertiranoj datoteci.
Osnovni problem prirodnog jezika u funkciji pretraivanja ine njegova
obiljeja sinonimije, homonimije i polisemije (Lancaster 1986; Foskett 1997; Olson,
Boll 2001). Koritenje neogranienog broja prirodnih rijei pri oznaivanju i
pretraivanju dovest e do odreenog broja pogreaka u informacijskom
pretraivanju. Jedina kontrola koja postoji nad terminima u prirodnom sustavu jest
stop-lista.
T. Peters i M. Kurth (1991) preporuuju strategije pretraivanja kojima se
iskoritava prednost koritenja kljunih rijei iz naslova: 1) ako korisnik zna za
barem jednu jedinicu grae, unese rije iz naslova, dobije zapis u kojem pronae
predmetne odrednice, prema kojima provodi daljnje pretraivanje; 2) ako korisnik
zna za barem jednu jedinicu grae, rijei iz naslova te jedinice koristi za
pronalaenje drugih slinih jedinica; 3) korisnik moe pokuati pretraivati po
kljunoj rijei iz naslova da bi dobio barem jednu relevantnu predmetnu odrednicu
koja e mu pomoi za daljnje pretraivanje; te, 4) traenje po kljunim rijeima iz
naslova moe se koristiti za predmetni pristup umjesto traenja po kontroliranom
rjeniku.
Uporaba prirodnog jezika poveava odziv, ali smanjuje preciznost, dok je s
kontroliranim jezicima obrnuto (Rowley 1994). Pretraivanjem putem kljunih rijei
ne pronalaze se sve relevantne jedinice, a broj nerelevatnih rezultata nadilazi
relevantne. Pretraivanje po rijeima iz odrednica (ne samo predmetnih, ve i
osobnih, korporativnih i stvarnih) predstavlja moan alat pri predmetnom
pretraivanju (Borgman 1996, str. 497). Metode i tehnike pretraivanja poput
kljunih rijei, kraenja, Booleovih i drugih operatora, automatskog oznaivanja i
pretraivanja (algoritmi), rangiranja po relevantnosti i ekspertnih sustava, koji se
53

koriste sa sustavima prirodnih jezika, mogu djelomino zamijeniti kontrolirane


jezike. Meutim, ono to se danas uoava kao najbolje rjeenje jest istodobna
mogunost koritenja i pretraivanja po prirodnim i kontroliranim sustavima.

5.5.

Prirodni

sustavi

naspram

kontroliranih

mogunosti

pretraivanja
Rasprava o ulozi prirodnog i kontroliranog jezika u pretraivanju pokrenuta je prije
vie od jednoga stoljea. E. Svenonius jo je 1986. povijest ove debate podijelila u
tri razdoblja, a J. Rowley (1994, str. 113-116) dodaje etvrto. Razdoblja o kojima
govore jesu sljedea: 1. uvoenje kontroliranog jezika, 2. usporedba razliitih jezika
za oznaivanje s ciljem odreivanja najboljeg, 3. spoznaja da se najbolji rezultati
dobivaju usporednim koritenjem obiju vrsta jezika, te, 4. naglasak je na
oblikovanju sustava prema potrebama krajnjeg korisnika. Valja naglasiti da su se
argumenti za i protiv odreenih sustava esto temeljili na tada dostupnoj tehnologiji.
Tek razvojem online sustava omogueno je istodobno koritenje razliitih sustava,
kada se postie konsenzus o usporednoj uporabi razliitih sustava (Olson, Boll
2001).
Prvo razdoblje, iz 19. stoljea, obiljeeno je kontroliranim jezicima, a
rasprava zapoinje kada oznaivanje po rijeima iz naslova postalo popularno.
Klasifikacijski sustavi koristili su se za redanje bibliografskih zapisa u strunim
katalozima. Poveavanjem kataloga korisnici su sve tee pronalazili odreenu
jedinicu grae, a terminologija u katalogu nije bila korisniki pristupana. Sredinom
1850-ih u Velikoj Britaniji predloeno je oznaivanje rijeima iz naslova, no C.
Cutter prevladao je svojom ustrajnom tvrdnjom da naslovi ne izraavaju istinski
predmet dokumenta te da graa o istom predmetu u knjinici nije okupljena ako se
rijei u naslovima slinih jedinica grae razlikuju. C. Cutter uveo je ukrteni katalog
koji se sastojao od abecednog i predmetnog niza, koji je bio prototip sustava LCSH.
Time je ova rasprava ostala zapeaena na pola stoljea, u korist kontroliranih
rjenika.
1960-ih postavilo se pitanje same ocjene rezultata kao relevantnih. U
poetku se smatralo da je savren onaj sustav koji kao rezultate daje sve dokumente
54

iz sustava koji odgovaraju upitu (ne samo neke), te samo one koji su relevantni (ne i
nerelevantne). Kasnih 1960-ih T. Saraevi i drugi poeli su uvoditi mjere poput
relevantan, manje relevantan i nerelevantan, koje se temelje na matematikoj
vieznanoj logici i o vieznanoj teoriji skupova, koje je prvi opisao L. A. Zadeh
sredinom 1960-ih (Olson, Boll 2001, str. 74). Formule za vieznane skupove
omoguavaju pronalaenje i djelomino odgovarajuih rezultata i njihov ispis po
vjerojatnoj relevantnosti.
Drugo

razdoblje,

1960-ih,

obiljeavaju

istraivanja

usmjerena

na

usporeivanje razliitih jezika za oznaivanje s ciljem utvrivanja koji je najbolji.


Ovo razdoblje vezano je uz pojavu raunalno utemeljenih sustava za oznaivanje i
pretraivanje, a prvi je 1959. uveo H. P. Luhn, kao kljunu rije u kontekstu
(KWIC). KWIC se temeljio na raunalnom prikazu svake rijei iz naslova, okruene
ostalim rijeima iz naslova. Niski odziv rezultata pretraivanja ukazao je na
injenicu da je za sofisticiranije oznaivanje potrebno u obzir uzeti i semantika i
sintaktika obiljeja jezika. Najpoznatija istraivanja ovoga razdoblja provedena su
u okviru cranfieldskih eksperimenata, koji su uspjenost mjerili na temelju
preciznosti i odziva. Preciznost i odziv utvrivali su se za trideset i etiri jezika.
Pokazalo se, izmeu ostalog, da se iscrpnijim i potpunijim oznaivanjem sadraja
dokumenta poveava odziv, a smanjuje preciznost, da specifinost termina za
oznaivanje pospjeuje odziv i preciznost, te da uputnice u kontroliranom rjeniku
pridonose poveanju odziva i smanjenju preciznosti. Pokazalo se i da uspjenost
sustava za oznaivanje ne ovisi o tome koristi li se klasifikacijski ili predmetni
sustav za oznaivanje, ve o mogunostima jezika za oznaivanje i standarda za
oznaivanje, to se danas jo uvijek prihvaa. Tada je utvreno i da su preciznost i
odziv u pravilu u obrnuto proporcionalnom odnosu, emu su se drugi znanstvenici
suprotstavili jer se, primjerice, odziv moe poveati ukljuivanjem sinonima, to
nikako ne smanjuje preciznost (Olson, Boll 2001, str. 75). Takoer su neki pokazali
da zadovoljstvo korisnika vie ovisi o odzivu nego o preciznosti. Drugi cranfieldski
eksperiment pokazao je da prirodni jezik uz minimalnu kontrolu sufiksa i sinonima
daju jednako dobre ili bolje rezultate nego sofisticirani jezik za oznaivanje. K.
Markey, P. Atherton i C. Newton (1980) pokazale su da kontrolirani jezici
poboljavaju preciznost, a nekontrolirani jezici odziv. Istraivanja provoena u
1960-ima i 1970-ima takoer su pokazala da prirodni jezici daju jednako dobre
rezultate, ako ne i bolje. No, ta su istraivanja bila usmjerena na to koji je jezik
55

bolji, a ne kako se mogu zajedno koristiti za dobivanje najboljih rezultata. Mnogi


autori poput R. Fugmanna i E. Svenonius kasnije su pokazali komplementarnost
prirodnog jezika i kontroliranih jezika. Dok su s jedne strane ovi eksperimenti
kritizirani zbog laboratorijskih, a ne stvarnih uvjeta i injenice da se odreivanje
preciznosti i odziva temeljilo na procjeni relevantnosti, koja je subjektivna, mnogi
vjeruju u rezultate ovih eksperimenata jer drugih pokazatelja nema, a i teko bi bilo
provesti testove koji bi bili pouzdaniji. Prvi i drugi cranfieldski eksperimenti nisu
obuhvatili online kataloge.
Tijekom treeg razdoblja, 1970-ih, i dalje su se provodila manja istraivanja.
Vie se nije teilo velikim eksperimentima ve manjim studijama sluaja. Novi
naglasak istraivanja jest na korisniki prilagoenim sueljima i algoritmima za
uinkovitije koritenje prirodnih jezika. Osnovno je obiljeje ovoga razdoblja
spoznaja da se najbolje pretraivanje moe postii istodobnim koritenjem
prirodnog i kontroliranog jezika za oznaivanje. Usporeuju se prednosti i nedostaci
jednog i drugog jezika, koje navode C. Dubois (1987) te T. Aitchinson i A. Gilchrist
(1987). U osnovne prednosti prirodnog jezika C. Dubois ubraja niske trokove
obrade, pojednostavljeno pretraivanje zbog rijei prirodnog jezika, mogunost
pretraivosti po svim sadrajnim elementima, svaka rije ima istu vrijednost u
pretraivanju, izostanak ljudskih pogreaka pri oznaivanju i aurnost u
ukljuivanju novih termina. T. Aitchinson i A. Gilchrist dodaju da visoka
specifinost osigurava preciznost i izvrsnost u pronalaenju imena osoba i
organizacija, a iscrpnost omoguava visoki odziv, te olakanu razmjenu meu
bazama podataka jer izostaje problem jezine nekompatibilnosti. H. Olson i J. Boll
(2001, str. 49) navode i da nije potrebno utroiti vrijeme, novac i napor na izradu
rjenika i sloene sindetike strukture, da korisnik koji trai pod bilo kojem od
postojeih sinonima ima dobre anse da nae barem nekoliko odgovora, te da
nekontrolirane rijei mogu posluiti kao ulazne toke za kontrolirane termine i kao
djelomina zamjena za tezaurus jer omoguuju istodobno ili slijedno pretraivanje
nekoliko kontroliranih jezika u vie baza podataka.
C. Dubois u nedostatke prirodnog jezika ubraja vee optereenje korisnika
zbog odabira termina, izostavljanje sadrajne informacije koja nije eksplicitno
navedena rijeima, nepostojanje veza sa specifinih termina na ope i potrebu za
poznavanjem strunog podruja. T. Aitchinson i A. Gilchrist spominju i probleme sa
sintaksom i lane veze istiu da iscrpnost moe dovesti do smanjene preciznosti. H.
56

Olson i J. Boll (2001, str. 50) spominju da aurnost moe biti i nedostatak jer
korisnici ne moraju znati novu terminologiju (npr. promjena naziva drava) te
naglaavaju da su lane veze posebno mogue ako sustavi ne podravaju operator
bliskosti.
to se tie kontroliranih jezika, prema C. Dubois njima se rjeavaju brojni
semantiki problemi, identificiraju se generiki odnosi te prikazuju struna
podruja, a T. Aitchinson i A. Gilchrist takoer istiu navoenje pojmova koji su u
tekstu implicitno navedeni, zaobilaenje sintaktikih problema koritenjem
vielanih termina i drugih alata, ublaeno sniavanje razine preciznosti zbog
pretjerane iscrpnosti (pronalaenje manje znaajnih pojmova), a posebno se istie
njihova vrijednost u numerikim bazama podataka i viejezinim sustavima. H.
Olson i J. Boll (2001, str. 39) navode veu vjerojatnost da e i oznaitelj i korisnik
na isti nain izraziti jedan pojam, veu vjerojatnost da e i jedan i drugi lake doi
do eljenog termina uz pomo sindetikih obiljeja (ui/iri pojam, srodni pojam,
vidi, vidi i), veu vjerojatnost da e isti termin koristiti razliiti oznaitelji ili isti
oznaitelji u razliitim sluajevima ime se osigurava konzistentnost, ubrzava
pretraivanje, ali i oznaivanje jer nije potrebno prisjeati se i traiti mogue
sinonime kada prvi traeni termin nije u bazi. Takoer se pomae korisniku da lake
i bre osvijesti svoju informacijsku potrebu.
Nedostaci kontroliranog rjenika su visoki troak, potencijalna neprimjerena
pokrivenost podruja, ljudska pogreka koja moe dovesti do izostajanja rezultata,
zastarjelost terminologije, problem sustavnog uspostavljanja svih relevantnih
odnosa meu terminima (C. Dubois), nedovoljna specifinost, ak i u detaljno
razraenim sustavima, nedostatak iscrpnosti ili potpunosti, potreba da korisnik naui
umjetni jezik, te oteana razmjena zbog nekompatibilnosti (T. Aitchinson i A.
Gilchrist).
U etvrtom razdoblju razvijanje i oblikovanje sustava usmjereno je ka
potrebama krajnjeg korisnika. Zapoelo je u kasnim 1980-ima sa studijama koje su
provodile istraivanja s pravim korisnicima i u novonastalim sustavima kao to su
grafika korisnika suelja. Potvruje se da se najbolji rezultati pretraivanja dobiju
komplementarnim koritenjem prirodnog i kontroliranog jezika za oznaivanje. O
tome svjedoi niz provedenih istraivanja, kao i ono S. Cousins (1992). Ona se
bavila ispitivanjem mogunosti predmetnog pretraivanja u online katalozima te je
dola do zakljuka da i prirodni jezik i PRECIS kao nadopuna zapisima MARC
57

pozitivno utjeu na broj pronaenih relevantnih jedinica grae, s time da PRECIS


dovodi do boljih rezultata, dok je u kraenju prirodni jezik najbolji. Takoer navodi
da osnovni problem s prirodnim jezikom lei u odabiru pojmova za pretraivanje,
meutim, automatsko kraenje i koritenje uputnica pospjeuju uspjenost
pretraivanja.

5.6.

Raunalna

obrada

prirodnog

jezika

predmetnom

pretraivanju
Zbog dominantnosti prirodnog jezika tijekom pretraivanja, raunalna obrada
prirodnog jezika (natural language processing NLP) moe imati znaajnu ulogu u
pospjeivanju predmetnog pretraivanja. Prijedlozi da se raunalna obrada
prirodnog jezika iskoristi kao metoda za unapreenje uspjenog predmetnog
pretraivanja temelje se na injenici da rijei u korisnikom upitu pripadaju jeziku te
da kao takve imaju odreena morfoloka ili sintaktika obiljeja, na temelju kojih se
mogu utvrditi i pronalaziti semantike informacije. Tako bi, primjerice, izraz
European policy on money trebalo biti mogue pronai izrazima kao to su
European monetary policy, monetary policy of the common market, ecu policy in
Europe itd. (Le Loarer 1993, str. 254). Meutim, WebPAC-i koji bi na takav nain
rukovali korisnikim upitima, jo su u istraivakom stadiju. Ovo poglavlje nastojat
e prikazati dosadanja postignua i mogue razvojne smjerove.
Tri su osnovne razine NLP-a: leksika, sintaktika i semantika (Smeaton
1997). Leksika razina obuhvaa rijei i vrste rijei. Svaka rije obrauje se
morfoloki na temelju razliitih nastavaka, neovisno o kontekstu, pri emu se koristi
rjenik. U engleskom jeziku, primjerice, vrlo esto razliite vrste rijei imaju isti
oblik pa su zbog toga potrebne i druge vrste jezine analize. Sintaktika razina
odnosi se na reeninu gramatiku i slubu rijei, a pokazalo se da je nemogue u
potpunosti ustvrditi sintaktika pravila i da takva sveobuhvatna gramatika ne
postoji. Semantika razina odnosi se na analizu znaenja.
Za raunalnu obradu prirodnog jezika neophodan je kontrolirani rjenik, ija
sofisticiranost, uz same algoritme za obradu prirodnog jezika, utjee na kvalitetu
ovoga procesa. Rjenici su potrebni za rjeavanje problema homoniminosti u
58

jeziku, za iznimke u pravilima za obradu jezika (npr. nepravilne mnoine, idiomi),


za odreivanje semantikih veza izmeu rijei i kontroliranih termina, ukljuujui
veze izmeu rijei iz upita i deskriptora ili oznaka koritenih u bazi podataka, za
prikaz i koritenje strukture predmetnog podruja, za podatke o svakoj rijei
potrebne pri oblikovanju upita, za povezivanje rijei u razliitim jezicima, zbog ega
je izrada rjenika vrlo zahtjevna (Vickery, Vickery 1993, str. 135).
Obrada prirodnog jezika u pretraivanju obino se odnosi na postupak kojim
se korisnikov upit oblikovan na prirodnom jeziku, korisnikovim rijeima, pretvara u
upit s Booleovim operatorima. Ovaj proces opisuju B. Vickery i A. Vickery (1993,
str. 121-125). Prvi korak sainjava sintaktika i semantika analiza, kojom se
uklanjaju suvine rijei iz upita (npr. rijei iz stop-liste), utvruje se jedno,
kontekstom odreeno znaenje rijei, te semantiki odnosi meu preostalim
rijeima. Za ove postupke potrebna je baza s pravilima za obradu jezika i rjenikom.
Samo prepoznavanje rijei sloen je proces zbog razliitih sluajeva16: zbog
rijei koje se piu s povlakom, apostrofom, kosom crtom, zbog (s) u zagradi, brojeva
(mogu se pisati s decimalnom tokom, zarezom ili znakom minusa), nizova brojeva
(brojevi mogu biti odijeljeni povlakom ili kojim drugim znakom), brojanih oznaka,
slovobrojanih oznaka, kratica koje sadre toku, zbog mjernih jedinica koje mogu
biti kratice i sastojati se od znakova poput % i $, ili od broja i naziva mjerne
jedinice, zbog matematikih formula koje sadre znakove poput +, -, *, zbog
kemijskih formula, te znakova interpunkcije poput zareza, toke i zagrade.
Za izdvajanje rijei ili skupina rijei iz upita i za odreivanje njihovih
meusobnih odnosa postoji nekoliko pristupa. Najjednostavnije je izdvojiti skupine
rijei odijeljene funkcionalnim rijeima iz stop-liste17 i svaku skupinu podvri
analizi. Drugi pristup je sloeniji, ali vrlo rairen u informacijskom pretraivanju, a
sastoji se u primjeni programa za parsiranje (sintaktika analiza). Ovaj program niz
rijei iz upita pretvara u gramatiku strukturu, na temelju koje se izvode zakljuci o
odnosima meu terminima. Nadopuna ovome pristupu moe biti rjenik, u kojem uz
svaku rije stoji oznaka o vrsti te rijei. Najsloeniji pristup temelji se na
semantikim kategorijama, koje se definiraju za podruje iji se tekst analizira. Ove

16

Temelje se na engleskom jeziku.


Stop-rijei mogu biti veznici, prijedlozi, lanovi i neke nepunoznane rijei ili nizovi rijei poput
treba mi neto o (I am interested in).
17

59

kategorije unaprijed su odreene i runo se unose uz svaku rije u rjeniku. Ovaj


pristup najuspjeniji je za usko specijalizirane domene.
Idui problem predstavlja izdvajanje vielanih termina ili izraza (npr.
elektrina struja). Prvi pristup sastojao se od odreivanja apsolutne frekvencije svih
skupina od po dvije i tri rijei koje postoje u dokumentu, a zatim bi se kao vielani
termini odabirale one skupine rijei koje prelaze odreeni frekvencijski prag.
Suvremeniji pristupi zamjenjuju statistika mjerenja s algoritmima koji se temelje
na obradi prirodnog jezika. Pri tome je potrebna baza pravila za odreivanje koje e
se skupine rijei iz upita prihvatiti kao vielani termini. Ova pravila mogu se
temeljiti na gramatikim ili semantikim kategorijama pridruenima svakom
terminu.
Jezina vieznanost predstavlja najvei problem. Razliite su vrste jezine
vieznanosti: sintaktika vieznanost, semantika vieznanost, homonimija
(rijei istog morfolokog oblika, ali nepovezanih znaenja), te vieznanost
specifina za pretraivanje, a odnosi se na rijei iz upita koje imaju znaenje za
pretraivanje i one koje nemaju (Treba mi informacija o ulozi informacije u
demokratizaciji drutva; Uporaba Booleovih operatora AND i OR u bazama
podataka) (Svenonius 2000, str. 148); postoje i situacije u kojima se javlja vie
oblika vieznanosti zajedno. Sintaktika vieznanost odnosi se na sluajeve kada
jedan oblik rijei predstavlja razliite vrste rijei (npr. igra moe biti imenica i
glagol). Ova vieznanost razrjeava se parsiranjem (sintaktikom analizom), tako
da se odredi kategorija rijei prema sufiksu, a ako nema razlike, onda prema
kategorijama u koje spadaju susjedne rijei. Semantika vieznanost odnosi se na
sluajeve u kojima postoje dva ili vie semantiki povezana znaenja (perilica
moe biti osoba ili stroj). Ova vieznanost takoer se esto moe razrijeiti
kontekstom, za to je preduvjet da je u rjeniku uz svaku rije navedena njena
definicija i opseg pojma koji predstavlja. Automatske ili poluautomatske metode za
utvrivanje kontekstualnog znaenja i rjeavanje homonimije esto se temelje na
analizi susjednih rijei. Npr. rije inmate (zatvorenik, stanar) u blizini rijei cell
(elija, stanica) upuuje da se radi o prison cell (zatvorskoj eliji), a ne o blood cell
(krvnoj stanici) (Svenonius 2000, str. 155). Ako upitom nije odreen kontekst
vieznanih rijei, korisniku je potrebno postaviti pitanje, npr. luk se odnosi na: (1)
oruje, ili (2) povre. Takoer se za svaku vieznanu rije u rjeniku mogu uvesti
pravila specifina za pojedinu rije, npr. ako iza rijei informacija stoji neka od
60

rijei o, za, vezana uz, koja se odnosi na i sl., onda se informacija ne uzima kao
termin za pretraivanje. Postoje i nastojanja da se izrade openitija pravila vezana uz
struno podruje. Primjerice, ukoliko je na temelju korisnikog profila u bazi
podataka poznato struno podruje upita, na temelju tog podatka moe se odrediti
kontekstualno znaenje. Za to je potrebno osigurati da uz svaku rije i njena
znaenja budu navedena sva struna podruja kojima moe pripadati.
Malo je pomaka postignuto u automatskom razvrstavanju pojmova u
semantike kategorije, djelomino zbog toga to ne postoje dovoljno razvijene baze
rijei, koje kombiniraju rjenik i tezaurus, odnosno preslikavanje prirodnog u
kontrolirani jezik, metatezaurusi, semantike mree, banke termina i razne druge
vrste alata za prikaz znanja. Ovakvi alati poboljat e automatizaciju razvrstavanja
termina u semantike kategorije, to e pomoi i u automatskom oznaivanju.
Razliiti su naini na koje sustavi provode obradu prirodnog jezika u
predmetnom pretraivanju (Vickery, Vickery 1993; Smeaton 1997). Prvi je korak
obino kraenje sufiksa rijei iz upita, na temelju ega se pronalaze odgovarajui
termini u rjenikoj bazi (to moe biti i sustav predmetnih odrednica, npr. MeSH).
Na primjer, upit information retrieval u kontroliranom rjeniku ili u invertiranoj
datoteci pronalazi sve pod information retriev, information, retriev. Najbolja vrsta
kraenja je svoenje na normirane osnove rijei. Zatim se obino na temelju
konteksta utvruje znaenje pojedinih termina. Pri tome se rabe kontekstualna
pravila, ili se korisnik na temelju postavljenih pitanja odlui za neko od postojeih
znaenja. Daljnji postupak moe biti automatska zamjena rijei iz upita terminima iz
kontroliranog rjenika ili prikaz popisa relevantnih termina (ukljuujui, npr. ire,
ue, srodne termine) iz kontroliranog rjenika, korisniku na odabir. Metoda
utvrivanja relevantnih termina koja se danas koristi je odreivanje teine
pojedinih termina na temelju broja dokumenata koji sadre taj termin u bazi, te na
temelju broja termina u samom dokumentu. Najpopularnija metoda za odreivanje
teine jest ona koja kombinira ove dvije frekvencije pojavljivanja. Teina e se,
dakle, izvui statistikom analizom koja se temelji na frekvenciji pojavljivanja rijei
u dokumentu, u odnosu na frekvenciju pojavljivanja termina u drugim dokumentima
u bazi.
Katalog Nacionalne medicinske knjinice podrava unos upita na prirodnom
jeziku (Vickery, Vickery 1993, str. 161). Nakon to se upit unese, razlomi se na
rijei koje se zatim usporede sa stop-listom od 600 rijei i krate se. Svaka osnova
61

rijei usporeuje se s popisom rijei s istom osnovom. Zatim se svim pronaenim


oblicima s istom osnovom dodijeli teina, koja se odreuje na temelju njihove
frekvencije u invertiranoj datoteci. Svim terminima s istom osnovom dodjeljuje se
ista teina. Teine termina koriste se za izraunavanje teine dokumenata, a
rezultati se prikazuju rangirano prema teini dokumenta. Osnove rijei koriste se i
za pretraivanje termina, uputnica, i anotacija MeSH-a. Primjerice, upitom
biofeedback pronai e se predmetne odrednice feedback i biofeedback (psychlogy).
Identificirane predmetne odrednice MeSH nose kombiniranu teinu unesenih
rijei koje odgovaraju tim predmetnim odrednicama. Unesene rijei iz upita i
njihove varijante, predmetne odrednice i pododrednice MeSH rangiraju se po
teini i prikazuju korisniku na odabir. Korisnik se poziva da odredi koji su termini
relevantni, nakon ega sustav analizira ostale termine MeSH koritene za
oznaivanje relevantnih jedinica, te prikazuje popis tih jedinica korisniku na odabir
radi provoenja daljnjeg pretraivanja (Vickery, Vickery 1993, str. 107-108).
Slijedi jo nekoliko primjera modela informacijskih sustava za pretraivanje
koji koriste prethodno navedene metode za raunalnu obradu prirodnog jezika, a
temelje se na opisima koje su dali B. Vickery i A. Vickery (1993). Mogu posluiti
kao modeli primjene raunalne obrade prirodnog jezika za predmetno pretraivanje
u online katalozima.
Sustav FASIT ima stop-listu koja, osim uobiajenih rijei poput lanova,
veznika, zamjenica, svih oblika pomonih glagola to be i to have, sadri neke ope
rijei bez znaenjske vrijednosti u oznaivanju (npr. certain, other, basis), te vlastita
imena, iako autori tvrde da bi imena trebalo staviti u posebnu datoteku preglednih
katalonih jedinica i uputnica. Ukoliko rije iz upita nije na stop-listi, utvruje se
njezin sufiks na temelju baze od otprilike 450 sufiksa. U ovoj bazi postoji i otprilike
1.000 pravila za utvrivanje vieznanih sufiksa, a temelje se na rijeima iz upita
koje slijede i prethode analiziranoj rijei. Nakon ovog postupka reenica iz upita
pretvorena je u skup kategoriziranih osnova rijei, koje se zatim usporeuju sa 160
kombinacija vrsta rijei (npr. imenica prijedlog imenica), radi utvrivanja
reeninih elemenata. Zatim se iz svakog elementa uklanjaju suvine rijei (npr.
retriev of information skrauje se u retriev information). Pronalaze se svi oblici koji
se u barem jednoj osnovi preklapaju (od retriev of information dobiva se
information retriev, information i retriev).

62

Sustav CIRCE nakon izbacivanja suvinih rijei prema stop-listi, preostale


rijei usporeuje s terminima iz tezaurusa, nakon ega se izradi popis korisnikovih
rijei uz pripadajue termine iz tezaurusa. Uz svaki termin stoji oznaka o njegovom
statusu, koja oznauje sljedee: izvor termina (upit ili tezaurus, ako tezaurus, je li
korisnik vidio i komentirao termin); ako je korisnik komentirao termin, njegovo
razumijevanje termina i njegova procjena relevantnosti za upit; mjera koliko tono
termin iz tezaurusa odgovara korisnikovom terminu iz upita; ima li termin vie od
jednog znaenja; te, specifinost termina (npr. ako je korisnikov termin pronaen u
tezaurusu oznaen kao srednje specifian, korisniku se predloi da odabere ui
termin iz tezaurusa). Pitanja koja se postavljaju korisniku odabiru se na temelju
pravila iz 60 reeninih predloaka u koje se ubacuju relevantni termini, npr. Could
you please clarify that input? (Moete li pojasniti svoj upit?), What is X related to?
(Na to se odnosi X?), How is X related to Y? (U kakvom su odnosu X i Y?), Does
X mean the same as Y? (Znai li X isto to i Y?).
LEXIQUEST se temelji na postupcima slinima sustavu CIRCE. Posebnost
ovoga sustava jest u tome to se nakon izdvajanja rijei koje nisu na stop-listi
oduzimaju njihovi pluralni sufiksi, a preostale osnove rijei usporeuju se s
terminima u kontroliranom rjeniku.
Jo jedna tehnika koja se moe primijeniti u obradi prirodnog jezika je
strojno uenje (Cunnigham, Witten, Littin 1999). Ono nalazi primjenu i na drugim
razinama procesa oznaivanja i pretraivanja informacija, koje sve utjeu na
predmetno pretraivanje. Prema D. Lewisu (1991), postoje 4 faze u tom procesu:
oznaivanje, oblikovanje upita, usporedba i povratna informacija. Prva faza,
oznaivanje, obuhvaa utvrivanje i odabir obiljeja (feature extraction), grupiranje
dokumenata (document clustering) i klasificiranje teksta (text classification).
Najvaniji dio procesa je odabir obiljeja i najbolji se rezultati postiu ako se
shemama za strojno uenje da odreeni broj distinktivnih obiljeja na temelju kojih
algoritmi ue. Grupiranje dokumenata pomae u pretraivanju stvaranjem veza
izmeu slinih dokumenata. Time se omoguava pronalaenje slinih dokumenata,
nakon to se jedan dokument procjeni relevantnim za upit. Veze se mogu uspostaviti
na bilo kojoj razini, od samih kljunih rijei do slinih podtema po odlomcima.
Slijedei ove veze, sustav pronalazi dokumente s odreenim stupnjem slinosti i
prema tome ih rangira. Ostale tri faze obino tvore petlju koja se ponavlja sve dok
korisnik nije zadovoljan pronaenim dokumentima. Kao to se pokazalo u etvrtom
63

poglavlju, odabir termina za upit korisnicima predstavlja veliki problem. Stoga


sustavi koji koriste mehanizam povratne informacije o relevantnosti pronaenih
dokumenata korisniku pomau da odabere najprimjerenije termine, pri emu se
korisniku mogu predloiti i novi termini iz dobivenih relevantnih dokumenata.
Primjena strojnog uenja tek zapoinje. Tehnike strojnog uenja koje se
danas primjenjuju u informacijskim sustavima za pretraivanje jednostavne su, a
neki od preostalih problema mogu se rijeiti koritenjem novijih i naprednijih
tehnologija (Cunningham, Witten, Littin 1999, str. 373).
Ekspertni sustavi raunalni su programi koji se sastoje od baze znanja
(knowledge base), s informacijama iz vrlo uskog podruja ljudskog znanja, i stroja
za zakljuivanje (inference engine), koji primjenjuje prikladne informacije iz baze
znanja za rjeavanje odreenog problema iz tog uskog podruja. Dananji ekspertni
sustavi mogu rjeavati probleme bolje nego ovjek laik, a koriste se uglavnom u
bazama s potpunim tekstovima. Meutim, danas jo uvijek postoje problemi za koje
se ne vide rjeenja za proces pretraivanja jer teko je predvidjeti sve mogue
potrebe korisnika. Razvoj ekspertnih sustava s vremenom e moda korisniku
omoguiti jednostavno postavljanje upita na prirodnom jeziku i dobivanje preciznih
i potpunih rezultata, a do tada e se predmetno pretraivanje svoditi na usporedno
koritenje prirodnih i kontroliranih jezika (Rowley 1994, str. 117).
Raunalna obrada prirodnog jezika jo uvijek ima problema sa sintaksom, a
od rjeavanja semantike problematike jo je daleko. Savreno i sveobuhvatno
izvoenje vjerojatno je nedosezivo u predvidljivoj budunosti jer su koriteni
modeli prirodnog jezika ogranieni. Ipak, primjenu NLP-a u predmetnom
pretraivanju danas ne treba zanemariti jer se u odreenim segmentima postiu
dobri rezultati, kao to potvruju prikazani primjeri. Moe se dodati primjer trailice
WebPAC-a knjinica Filozofskog fakulteta, koja e na temelju tzv. datoteke afiksa
za hrvatski jezik uskoro omoguiti automatsko pretraivanje po svim moguim
morfolokim oblicima rijei (Pavlinui 2002).

64

6. Provoenje predmetnog pretraivanja

6.1. Operatori
Pri predmetnom pretraivanju po rijeima prirodnog jezika operatori omoguuju
odreen stupanj rjeavanja problema sinoniminosti i homoniminosti u prirodnom
jeziku te problema razliitih morfolokih oblika rijei. Omoguavaju pronalaenje
pojmova ili aspekata pojmova za koje ne postoji, ili nije poznato da postoji, termin
ili oznaka kontroliranog rjenika u bazi podataka. Njima se, takoer, u upitu mogu
kombinirati i termini iz kontroliranog rjenika. Neophodni su u postkoordiniranom
predmetnom pristupu, gdje se termini zajedno kombiniraju u trenutku pretraivanja,
a ne u trenutku oznaivanja.
Booleovi operatori temelje se na logici skupova. Prilikom pretraivanja
koriste se operacije logikog zbroja (AND), logikog produkta (OR) i logike
razlike (NOT), ime se esto dobivaju i one jedinice grae u kojima se traeni
predmeti ne nalaze, tj. uspostavljene su tzv. lane veze (Mikai, 1990, str. 46). U
predmetnom pretraivanju operatori AND, OR i NOT stavljaju se izmeu rijei ili
skupina rijei ili drugih elemenata u upitu. Ovi elementi u suvremenim sustavima
mogu biti kljune rijei, kontrolirani termini, skraene rijei, klasifikacijske oznake,
pa i neverbalni elementi.
Operatorom OR pronalaze se svi dokumenti koji sadre bilo koji od
elemenata koje operator povezuje. Ovaj operator utjee na poveavanje odziva.
Koristan je za pronalaenje sinonima, npr. knjinino drutvo OR knjinino
udruenje OR knjinina udruga, kao i varijanti u pisanju i kratica, ukoliko sustavi
nemaju automatska rjeenja ove sluajeve. Inaica XOR koristi se u slinoj funkciji,
s time to pronalazi bilo koji od dva termina iz upita, ali ne oba. Ukoliko se ele
precizniji rezultati i manji odziv, koristi se operator AND. Operator AND pronalazi
dokumente koji sadre obje rijei iz upita povezane ovim operatorom. Operator
NOT takoer poveava preciznost, a smanjuje odziv, te se upotrebljava ukoliko se
neki termin eli iskljuiti iz traenog skupa rezultata. Tako e se, npr. upitom
zagaenje NOT zrak, pronai dokumenti o zagaenju openito i dokumenti o
zagaenju voda i tla, ali ne i zraka.

65

Problem pretraivanja s Booleovim operatorima jesu lane veze, tj.


neoekivani i nerelevantni rezultati koji se dobivaju kada se rijei iz upita nalaze u
dokumentu, ali pripadaju drukijem kontekstu no to je korisnik elio. Smanjivanju
broja nerelevantnih rezultata mogu pridonijeti tzv. operatori blizine (proximity
operators, positional operators). Ovi operatori korisniku omoguuju da definira gdje
se u polju ili poljima traeni termini nalaze u odnosu jednih na druge. Pretraivanje
se najee provodi tako da se termini pojavljuju jedan uz drugi ili da su odvojeni s
nekoliko rijei u istom polju ili u istom potpolju. Operator ADJ pronalazi rijei koje
nisu meusobno udaljene vie od odreenog broja rijei (rijeX ADJn rijeY, gdje
n=1-99). Postoji jo nekoliko inaica ovoga operatora, npr. WITHIN n i %n, a slian
je i operator !n koji, osim to odreuje maksimalan broj rijei izmeu rijei iz upita
(n), odreuje i da redoslijed rijei bude isti kao u upitu. Operator SAME pronalazi
rijei koje se nalaze u istom odlomku (rijeX SAME rijeY), a operator NEAR rijei
u istoj reenici (rijeX NEAR rijeY). Pojedini informacijski sustavi koriste jo neke
podvrste operatora blizine, pod razliitim nazivima. Iako su ovi operatori vrlo
korisni, danas se, osim Booleovih, u online katalozima ostale vrste operatora rijetko
primjenjuju (Oritz-Repiso, Moscoso 1999).
Prisutnost operatora u sustavu moe biti eksplicitna, tj. korisnici ih unose
sami, ili implicitna, tj. sustav automatski meu rijei iz upita postavlja odreeni
operator. Implicitno postavljanje operatora poelo se uvoditi u sustave jer su
istraivanja pokazala da se korisnici esto ne znaju sluiti Booleovim operatorima.
Najei implicitni operatori su operator AND, operator blizine i operator OR
(Olson, Boll 2001, str. 57).
Online katalozi meusobno se razlikuju po nazivima i vrsti operatora
(pogotovo operatora blizine), po vrsti implicitnih operatora te po redoslijedu
izvravanja operacija odreenih operatora. Prva generacija online kataloga
dozvoljavala je unos samo jedne rijei u upitu, a u upitima s vie rijei odnose meu
rijeima bilo je potrebno definirati Booleovim operatorima. Od druge generacije
online kataloga dozvoljava se unos vie rijei u upitu, a sustav sam odreuje odnose
meu njima: jedni sustavi rijei povezuju operatorom OR, drugi operatorom AND,
neki operatorom blizine, a ostali unesene rijei smatraju izrazom. Jedni potuju
hijerarhiju Booleove algebre pa prvo izvravaju operacije s NOT, zatim s AND, te
na kraju s OR, a drugi ne pa operacije izvravaju s lijeva na desno ili nekim drugim

66

redoslijedom, neki dozvoljavaju zagrade pa prednost imaju operacije u zagradama, a


neki ne.
Pokazalo se da je Booleova logika teko razumljiv koncept (Yee 1991) te da
ak i znanstvenici i inenjeri koji imaju iskustava u primjeni logike na drugim
aplikacijama esto pri pretraivanju koriste AND i OR obrnuto (Borgman, Case and
Meadow 1989), a istraivanja iz kognitivne psihologije (Tversky, Kahneman 1974)
pokazuju da ljudi slijede intuiciju pa AND i OR koriste u njihovom jezinom
znaenju, tj. da je AND inkluzivno i da znai vie, a OR da je ekskluzivno i da
smanjuje skup dakle, obrnuto od Booleove logike (Borgman 1996). C. Hildreth
(1997) proveo je istraivanje druge generacije online kataloga i ustvrdio da korisnici
nemaju nikakvog znanja o tome kako implicitni Booleovi operatori funkcioniraju.
C. Borgman (1996) tvrdi da je za oblikovanje uspjenih Booleovih upita
potrebno konceptualno znanje o nainima na koje se pojmovi za pretraivanje mogu
kombinirati, te semantiko znanje o tome kako neki sustav obrauje ili provodi
Booleove upite. Niska razina tih dviju vrsta znanja osnovni je imbenik koji dovodi
do nezadovoljavajuih rezultata pretraivanja. Budui da se online katalozi razlikuju
u koritenju operatora, korisnici esto ne dobivaju traene rezultate jer uglavnom
nemaju volje ispitati kako se u sustavu koriste operatori, ve prenose znanje koje
imaju o sustavu koje su prije koristili (Borgman 1996, str. 498). C. Borgman
predlae dva rjeenja ovih problema online kataloga: poboljanje metoda
obuavanja korisnika i poboljanje suelja online kataloga koje odraava ponaanje
vezano uz informacije. Drugo rjeenje puno je praktinije ni iz jednog drugog
razloga no to e uvijek biti manje sustava koje treba usavriti nego korisnika koje
treba obuiti. Neovisno o tome, WebPAC-i u hipertekstualnom okruenju imaju
potencijal za interaktivnu funkcionalnu pomo traiteljima (Hildreth 1997, str. 62),
to svakako valja iskoristiti i u ovome kontekstu.

6.2. Kraenje
Pri oblikovanju upita s operatorima esto se koristi kraenje. Ono omoguava
okupljanje razliitih morfolokih oblika iste rijei, npr. jednine i mnoine ili
imenice, glagola i pridjeva.
67

Znaenje termina kraenje ili krnjenje u hrvatskome jeziku obuhvaa


znaenje triju engleskih termina: truncation, stemming i wildcard. Ovi termini
razlikuju se u sljedeem: truncation se najee koristi u znaenju kraenja sufiksa i
afiksa za odreen broj znakova bez obzira na korijen rijei, stemming se koristi za
pronalaenje svih rijei iz upita koje imaju isti korijen, a wildcard se najee
odnosi na znakove koji se mogu staviti u sredinu rijei iz upita i zamijeniti jedan ili
vie znakova. Uobiajen primjer za koritenje znakova wildcard jest za razliite
varijante rijei, kao npr. u engleskom jeziku color (amerika varijanta) i colour
(britanska varijanta).
Ovisno o katalogu, kraenje moe biti eksplicitno, tj. odreeno od strane
korisnika, i automatsko ili implicitno, kada sustav sam krati odreen broj znakova.
Najee se krati sufiks nakon odreenog znaka, npr. sedmog, kako bi se upitom
obuhvatili svi oblici rijei koja moe imati razliite nastavke (npr. ovisno o rodu,
broju, padeu). Kada je kraenje eksplicitno, umjesto jednog ili vie znakova obino
se stavlja neki od sljedeih znakova: *, ?, $, #, !, ili %. Eksplicitno kraenje
zahtijeva od korisnika da se prisjeti svih mogunosti, a implicitno ne uzima u obzir
kontekst ve automatski krati po postojeem algoritmu ili postojeim pravilima, pa
se postavlja pitanje koje je rjeenje najbolje za sustav.
Jasno je da kraenje nije pravo rjeenje za sve probleme pretraivanja jer ne
omoguava pristup irim i uim terminima, sinonimima, varijantama u pisanju ili
inaicama na drugim jezicima. Za ove sluajeve sustav treba osigurati kontrolirani
sustav, ili se korisnik sam mora dosjetiti svih mogunosti. Meutim, kraenje je
potrebno osigurati i po terminima iz kontroliranog rjenika.
Oblikovanjem upita za pretraivanje koritenjem kraenja mogu se dobiti i
neoekivane i nerelevantne rijei. Primjerice, ako u katalogu na engleskom jeziku
traimo jedinice grae o itanju i unesemo read?, moemo dobiti zapise koji
sadravaju rijei readable, reader, readership, reading, ali i readapt, readiness,
readdress, readies, readily.

68

6.3. Oblikovanje upita


Pronalaenje informacija temelji se na interakciji korisnika s bazom informacijskog
sustava. Korisnik postavlja upit koji se tipino sastoji od rijei koje se usporeuju s
pristupnicama u bazi podataka. Osim ovoga naina, informacijski sustavi pruaju
mogunost odabiranja pristupnica iz ponuenog popisa, koja se tehnika
pretraivanja naziva prebiranjem ili pregledavanjem (browsing). Postoje i napredne
tehnike pretraivanja usporeivanjem rijei uz upita s pristupnicama u bazi
podataka, poput tzv. latentnog semantikog oznaivanja (latent semantic indexing),
kojom se rijei iz upita s predmetnim pristupnicama u bazi podataka usporeuju na
temelju statistike semantike analize upita i odnosa meu rijeima u upitu. Ovaj se
nain razlikuje od prethodnih po tome to omoguuje pronalaenje relevantnih
jedinica grae i kada se rijei iz upita i pristupnice razlikuju morfoloki, ali se
preklapaju semantiki (Hjorland, Nielsen 2001, str. 251).
Osnovni problem s kojim se korisnik susree pri pretraivanju jest
prevoenje upita na jezik sustava. Za to je potrebno uspostaviti datoteku predmetnih
katalonih jedinica i uputnica i sline mehanizme koji e korisnika uputiti s
nekoritenih termina na koritene, istodobno im pokazujui ire, ue i srodne
pojmove te biljeke o upotrebi. Pitanje koje se postavlja jest da li upit automatski
prevesti na kontrolirani jezik ili korisniku pokazati mogunosti i dozvoliti mu da
sam napravi odabir. Termini za pretraivanje mogu se korisniku predloiti i nakon
provedenog pretraivanja, na temelju povratne informacije o relevantnosti dobivenih
dokumenata, kada se iz zapisa koje korisnik odredi kao njemu relevantne, ponude
na odabir ostali termini iz tih zapisa. Osim toga, termini mogu biti slini jer se
zajedno citiraju, jer su meusobno povezani hipervezom, ili su slinih statistikih
distribucija, na emu se u nekim informacijskim sustavima takoer temelje odreene
tehnike za prikaz slinih termina (Svenonius 2000, str. 162).
Veliki problem, dakle, pri pretraivanju predstavlja izbor rijei za upit. U
tom kontekstu provode se istraivanja o nainu preoblikovanja upita, preklapanju
rijei iz upita i termina u kontroliranom rjeniku i pogrekama u pisanju. Rezultati
ovih istraivanja upuuju da su upiti koje trebaju postavljati krajnji korisnici loi te
da je potrebno poboljati uinkovitost novim modelima koji e smanjiti kognitivni
napor potreban za oblikovanje strategije pretraivanja koju informacijski sustav

69

razumije. Ove metode obuhvaaju interaktivno pretraivanje preoblikovanjem upita


(gore prikazano) i neku vrstu prebiranja (Bates 1989a; Marchionini 1997).
Osim upisivanja rijei koje se zatim usporeuju s pristupnicama u bazi
sustava, odnosno oblikovanja upita svojim rijeima, korisniku online kataloga na
raspolaganju moe biti i mogunost odabira termina putem izbornika iz pojedinih
polja, tj. prebiranje. Prebiranje se u literaturi predlae kao druga mogunost kada
korisnik ne zna to tono trai ili u sustavu ne postoji toan odgovor na njegov upit.
Prebiranje po indeksima pojedinih polja korisno je i zbog toga to korisnici ne
trebaju znati kako se tono neka rije pie, a time se sprjeavaju i pogreke u
pisanju, odnosno pravopisne pogreke. Ono se moe definirati i kao istraivanje
baze podataka s idejom da se slijeenjem veza moe naii na neto zanimljivo ili
korisno (Olson, Boll 2001, str. 287). Posebna vrsta prebiranja je ona u kojoj se kao
odgovor na upit iskazan korisnikovim rijeima prikau rezultati, ali i ostale susjedne
jedinice grae, bilo da su poredane po abecedi naslova ili autora, relevantnosti ili
nekom drugom kriteriju.
Novi modeli prikaza sadraja jedinica grae zamjenjuju klasian sustav u
kojem se rijei iz upita koje daje korisnik usporeuju s terminima u invertiranoj
datoteci baze kataloga. Kada govorimo o prebiranju, tradicionalni kontrolirani
rjenici prilagoeni online okruenju uinkoviti su alati, posebno u kombinaciji s
naprednim tehnikama informacijskog pretraivanja poput onih koji koriste
raunalnu obradu prirodnog jezika. Tome je razlog to to ovakvi alati pospjeuju
konceptualno znanje korisnika o informacijskom sustavu, njegovom sadraju i o
nainu na koji je informacijski prostor organiziran, olakavajui mogunost odabira
termina za proirenje ili preoblikovanje upita.
Danas mnogi online katalozi ne iskoritavaju prednosti mrenog okruenja
pa se prebiranje svodi na pristup terminima linearno, tj. svaki je termin povezan
samo s terminom koji mu neposredno prethodi ili slijedi (Oritz-Repiso, Moscoso
1999). Prebiranje bi se trebalo temeljiti na hipervezama, trebalo bi biti nelinearno i
fleksibilno, tako da korisnik moe jednostavno odlaziti s termina na termin, ve
prema tome kakve odnose meu terminima ele slijediti. Kao dobar primjer
iskoritavanja prednosti mrenog okruenja moe posluiti portal Highwire Press
Sveuilita Stanford (University of Stanford), gdje se osigurava pristup
elektronikim publikacijama baza podataka, a podravaju se napredne funkcije
pretraivanja, ukljuujui po referencama, te dvije vrste prebiranja po predmetnim
70

podrujima: linearno i po tematskoj mapi (TopicMap), gdje su popisane struke,


predmeti unutar struke, a pod svakim predmetom nalazi se popis postojeih radova
(Atkins 2002).

6.4. Rangiranje i prikaz rezultata


Koritenje prvih online kataloga zahtijevalo je precizan unos rijei u upit jer su
rezultati bili samo oni koji su tono odgovarali upitu (to su tzv. exact match sustavi).
Kasniji katalozi postali su tzv. probabilistiki sustavi (ili best match sustavi), koji
omoguuju pronalaenje i onih rezultata koji samo djelomino odgovaraju upitu. U
ovim je sustavima svakako poeljno da zapisi ili dokumenti dobiveni pretraivanjem
budu rangirani po relevantnosti, iz nekoliko razloga. Rangiranje prema procijenjenoj
slinosti s upitom omoguava korisniku da sam odlui u kojem trenutku da prestane
s pregledavanjem rezultata jer nema potrebe da ih pregledava sve, jedan po jedan
(Smeaton 1997). Rangiranje rezultata olakava sustavu da na temelju povratne
informacije ponovi pretraivanje prema onome to korisnik odabere kao relevantne
dokumente, tako da doda ili izbaci termine iz upita.
Skupni katalog Bopac218, pokrenut 1996. godine s ciljem umreavanja
kataloga razliitih knjinica putem protokola Z39.50, posebno se bavio
mogunostima grupiranja rezultata po slinim kriterijima. Kada se dobije vie od pet
rezultata, oni se prikazuju u tzv. Full Cluster View, a na temelju tzv. okupljajueg
(clustering) algoritma, pri emu se prikazuje naslov, autor i dio zapisa koji sadri
termine iz upita. Na taj su nain slini zapisi okupljeni, i to prema naslovu, autoru,
jeziku, vrsti grae ili po knjinici, a predvieno je i okupljanje po predmetu, na
temelju postojeih kontroliranih termina iz zapisa MARC i putem tehnika za
odreivanje relevantnosti kakve se koriste u informacijskom pretraivanju (Ayres,
Nielsen, Ridley 1999, str. 28-34).
Rangiranje rezultata po relevantnosti je, meutim, jo uvijek na poetnom
stupnju razvoja. Eksploatira se najvie u bazama s potpunim tekstom i na webtrailicama, dok softveri za online kataloge vie ili manje ove funkcije ne
18

URL: http://www.bopac2.comp.brad.ac.uk/~bopac2/

71

podravaju. Rangiranje rezultata temelji se na pretpostavci da to pojedinih rijei u


jednom dokumentu ima vie, to je vea vjerojatnost da se u tom dokumentu radi o
pojmu oznaenom tom rijeju. Stoga se pretraivanje temelji na usporedbi rijei iz
upita s rijeima u invertiranoj datoteci19, pri emu se svakoj rijei dodjeljuje
teina (weight), vrijednost koja odraava vjerojatnost da ta rije prikazuje sadraj
dokumenta. Ova vrijednost dobiva se statistikom analizom na temelju estoe te
rijei u zapisu ili dokumentu, obino u odnosu na estou rijei u drugim zapisima
ili dokumentima u bazi i u odnosu na duinu dokumenta. Ova tri postupka temelje
se na sljedeim pretpostavkama: termini koji se javljaju samo u nekim zapisima ili
dokumentima vjerojatno su korisniji od onih koji se javljaju u mnogima; to je rije
ea u dokumentu, to je vjerojatnije da je vanija za taj dokument; te, da je rije
koja se javlja jednak broj puta u kratkom dokumentu kao i u dugakom vjerojatno
vanija za kratak dokument nego za dui. Sve se ove teine kombiniraju da bi se
dobila najpreciznija teina za svaki termin. B. i A. Vickery (1993, str. 151)
navode sljedee tehnike za odreivanje teine termina: vea vrijednost pridaje se
izvornim terminima (onima iz upita), nego naknadno dodanim sinonimima i ostalim
terminima za preoblikovanje upita; subjektivno dodjeljivanje vrijednosti o vanosti
termina od strane korisnika; te, odreivanje obrnute vrijednosti u odnosu na
frekventnost rijei u relevantnim i nerelevantnim jedinicama, pri emu korisnik radi
procjenu relevantnosti jednog uzorka rezultata. Rezultati se ispisuju prema stupnju u
kojem odgovaraju upitu u padajuem slijedu.
Slijedi primjer kako je rangiranje po relevantnosti rijeeno u jednoj bazi
podataka, prema B. Vickeryu i A. Vickery (1993, str. 146). Vrijednost svakog
termina izrauna se prema formuli w = log(N/n), gdje je N broj jedinica u zbirci
dokumenata (unaprijed poznat), a n je broj pojavljivanja termina u dobivenim
rezultatima. Vrijednost dobivenog skupa rezultata je ukupan zbroj vrijednosti
pronaenih termina. Zatim se dobiveni skup rangira i prikazuje korisniku. Korisnik
tada moe pojedine dokumente odrediti kao relevantne, nakon ega se vrijednosti
skupa ponovno izraunaju. Isto se tako moe dodati novi termin, pa e iznova biti
potrebno izraunati vrijednosti, ili se termin moe izostaviti, pri emu e njegova
vrijednosti biti jednaka nuli.

19

Kao to je ranije istaknuto, u online katalozima i bazama podataka rijei iz zapisa i/ili dokumenata
koje nisu na stop-listi nalaze se u invertiranoj datoteci.

72

Istraivanja su pokazala da razliiti genetski algoritmi za povratnu


informaciju o relevantnosti rezultata pretraivanja imaju dobru mogunost primjene
i kao takvi poboljavaju mogunosti sustava za pretraivanje (vidi, npr., LopezPujalte, Guerrero Bote, de Moya-Anegon 2002).
Jo jedna tehnika koja se moe razmotriti za primjenu u predmetnom
pretraivanju u bazama s hipertekstualnim dokumentima jest analiza strukture
hiperveza, koja se sve vie koristi u algoritmima za pretraivanje i rangiranje
rezultata u web-trailicama na Mrei (vidi, npr., Lempel, Moran 2002).
No, kao to tvrdi E. Svenonious (2000, str. 191), raunalna automatska
obrada moe pomoi u rangiranju po relevantnosti na temelju statistikih i drugih
postupaka, ali semantiko rangiranje bez ljudske pomoi nije mogue.

73

7. Korisniko suelje za predmetno pretraivanje

7.1. Oblikovanje suelja za predmetno pretraivanje


to se tie ukljuivanja korisnika pri pretraivanju, vano je odluiti koji se stupanj
fleksibilnosti eli pruiti korisniku neki koraci mogu se automatizirati, ili ih moe
obavljati korisnik (Vickery, Vickery 1993, str. 110-111). Pojedini sustavi
dozvoljavaju unos upita koji se zatim dalje obrauje i prenosi u bazu, dok neki
oekuju od korisnika da aktivno pridonosi oblikovanju upita. To se odnosi na
funkcije poput sljedeih: da li koristiti implicitne ili eksplicitne Booleove operatore,
da li koristiti automatsko kraenje ili ne, automatsko prevoenje na kontrolirani
rjenik ili ponuditi popis kontroliranih termina na izbor korisniku.
Istraivanja su pokazala da korisnici trebaju imati nadzor nad algoritmima,
poput onoga za automatsko kraenje, jer taj algoritam moe tjerati korisnika da trai
dalje i dalje, a da odgovarajua jedinica u katalogu zapravo ne postoji (Mandel,
1986; McCarn, 1983). Okapi koristi sloene algoritme koji pomau korisniku u
pronalaenju najbliih termina nakon to tzv. exact matching (potpuno preklapanje)
nije dovelo do rezultata (Hancock-Beaulieu 1992, str. 33-34). No, korisnik bi nad
njima trebao imati nadzor. Nije dobro initi neto to korisnik nije zatraio da se
uini i bez njegova znanja. Npr. ako korisnik trai informaciju o temi koja nije
koritena, izuzetno bi bilo korisno izbaciti popis predmetnih odrednica, prikazujui
Ova knjinica koristi ' ' i da se hipervezom odmah ode na tu predmetnu odrednicu
ili se odabere u upit i kombinira s drugim terminima u upitu. Ukoliko se ne moe
prikazati popis, dobro je prikazati poruku s tekstom, npr. U ovoj se knjinici ne
koristi izraz osobe s invaliditetom, ve osobe s posebnim potrebama. Meutim,
automatski promijeniti pretraivanje nije u redu (Crawford 1992, str. 69).
Takoer je vano da u svakom trenutku rada sa sustavom korisnik zna gdje
se nalazi u procesu, koji zadaci su zavreni, i to je jo potrebno rijeiti. Istodobno
na zaslonu trebaju postojati tekui rezultati dobiveni od sustava, poruka s uputama,
informacije o mogunostima koje korisniku stoje na raspolaganju (npr. pomo,
provoenje odreenih zadataka) (Vickery, Vickery 1993, str. 152-153). Istraivanja
su pokazala da se korisnici ne snalaze u katalozima i da je pri oblikovanju sustava

74

potrebno osigurati odgovore na pitanja poput Gdje sam? Kako se mogu vratiti na
popis zapisa? to bih sada trebao uiniti? (Matthews 1997, str. 112).
Predmetne odrednice u zapisu treba istaknuti te povezati hipervezama s
drugima. Mora postojati mogunost da se pronau djela vezana uz prikazani zapis,
ili djela vezana uz prikazanu predmetnu odrednicu ili signaturu (Hildreth 1995).
Za ispravljanje pogreaka i ujednaavanje pravopisnih varijanti najbolje bi
bilo razviti softvere. Softveri su poeljni i za ameriku i britansku varijantu
engleskoga jezika. Meutim, vano je za funkcije koje e softveri podravati razviti
standarde, jer, npr. danas neki softveri pretvaraju povlaku u razmak pa se rije
indeksira kao dvije rijei, a drugi je briu pa se rije indeksira kao jedna rije.
Korisnici ne bi trebali pamtiti kako koji sustav radi do ovakvih detalja.
Vano je da korisnik moe mijenjati redoslijed akcija u pretraivanju i vratiti
se na prethodne upite i promijeniti ih. Istraivanja pokazuju da mnogi zadaci vezani
uz pretraivanje informacija mogu imati koristi od automatski i/ili runo snimljenih
prethodnih pretraivanja (Komlodi, Soergel 2002, str. 152). Pokazalo se da korisnici
esto ponavljaju dijelove svojih upita pri provoenju pretraivanja, to upuuje da
zaboravljaju to su ve probali, i na potrebu za nekom vrstom mogunosti pregleda
prolih pretraivanja. Poeljno je i da se prola pretraivanja mogu provesti i na
nekom drugom sustavu.
Na temelju istraivanja (Large, Beheshti 1997) zakljueno je da korisnici pri
pretraivanju koriste i kljune rijei i kontrolirani rjenik, te bi obje opcije trebale
biti ponuene na prvoj stranici za pretraivanje. Takoer se pokazalo da imbenici
poput redoslijeda utjeu na korisnikov izbor, i to tako da su ee odabrani oni prvi
navedeni. Stoga C. Long (2000, str. 166) predlae da se na vrh poetne stranice za
pretraivanje stave one mogunosti za koje postoji najvea vjerojatnost da e biti
najuinkovitije.
Istraivanja su pokazala da korisnici ne poznaju rad sustava i da ne razlikuju
pretraivanje po kljunim rijeima od pretraivanja po predmetnim odrednicama
(Hildreth 1997; Borgman 2000). Stoga je potrebno uz svaku opciju za pretraivanje
ponuditi detaljne upute da bi korisnici znali odabrati to im najbolje odgovara. U
tom smislu, korisnici trebaju znati i koji se dio bibliografskog zapisa pretrauje kad
se radi o kljunim rijeima, kako bi dobili ideju u opsegu i ogranienjima svojeg
pretraivanja. Korisnici trebaju znati emu slui kontrolirani rjenik, koji se
kontrolirani rjenik koristi, da se kontrolirani rjenik moe nezavisno pretraivati i
75

gdje se nalazi. Budui da korisnici pregledavaju predmetne odrednice u dobivenim


zapisima s ciljem preoblikovanja upita (Long 2000, str. 167; Slone 2000, str. 758),
dodavanje hiperveza na ostale zapise koji sadre relevantne predmetne odrednice,
kao i na deskriptore kada se unese nedeskriptor, te na ire, ue i srodne deskriptore,
jedno je od najkorisnijih svojstava koja suelja WebPAC-a mogu pruati. Posebno
oznaivanje traenih pojmova (npr. bojom) u dobivenom zapisu moe pomoi pri
odreivanju relevantnosti dobivene jedinice (Long 2000, str. 167).
Za poboljanje predmetnog pretraivanja, C. Long (2000, str. 170 ) priredio
je sljedee smjernice za oblikovanje suelja WebPAC-a (pored ovih, priredio je i
smjernice vezane uz pristupanost i upute, o kojima e kasnije biti rijei):
1. Na poetnoj stranici za pretraivanje trebale bi postojati obje mogunosti
pretraivanja, i za kljune rijei i za predmetne odrednice, te bi trebale biti
dovoljno istaknute.
2. Upute uz pojedine mogunosti pretraivanja trebale bi jasno opisati koja se
vrsta pretraivanja provodi.
3. U opciji za kljune rijei potrebno je navesti koja e se polja iz
bibliografskog zapisa pretraivati.
4. Korisnicima je pri pretraivanju po predmetnim odrednicama potrebno rei
da pojmovi iz njihova upita za pretraivanje moraju odgovarati onima iz
popisa predmetnih odrednica.
5. Potrebno je navesti podatak o vrsti koritenog popisa predmetnih odrednica.
6. Popis predmetnih odrednica koriten u katalogu trebao bi biti pretraiv
online putem.
7. Korisnici bi trebali imati na raspolaganju alternativni nain pretraivanja po
predmetu, poput kljunih rijei po polju za predmetne odrednice ili
pretraivanja po klasifikacijskoj oznaci.
8. Predmetni sustav kataloga trebao bi imati izgraen sustav uputnica.
9. Dobiveni zapisi trebali bi sadravati hiperveze s predmetne odrednice na
ostale zapise s istom predmetnom odrednicom.
10. Korisnikovi pojmovi za pretraivanje trebali bi u dobivenim zapisima biti
posebno istaknuti.

76

7.2. Pomo i upute


WebPAC treba osigurati da novi korisnici upoznaju sustav s minimalnim potrebnim
uputama, istodobno omoguujui iskusnijim korisnicima da provode sloena
istraivanja. Kao to je ranije spomenuto, za poboljanje predmetnog pretraivanja
mogu se oblikovati metode obuavanja korisnika i prilagoditi suelja online
kataloga koja e odraavati ponaanje korisnika pri pretraivanju (Borgman 1996).
Ovo rjeenje puno je praktinije ni iz jednog drugog razloga no to e uvijek biti
manje sustava koje treba usavriti nego korisnika koje treba obuiti. Neovisno o
tome, WebPAC-i, u hipertekstualnom okruenju, imaju potencijal za interaktivnu
funkcionalnu pomo traiteljima (Hildreth 1997, str. 62), to svakako valja
iskoristiti.
Ono to se predlae kao openita pomo koju treba osigurati korisniku jest
sljedee: nakon ulaska u sustav, pokazati zaslon s osnovnim informacijama o
koritenju kataloga, osigurati upute o mogunostima pretraivanja drugih kataloga
ako takve postoje, osigurati novosti o knjinici, uslugama, katalogu, upute o
povratku na prethodne korake i o tome kako izai iz sustava ili kako se vratiti na
poetni zaslon. Sama pomo moe biti eksplicitna (na zahtjev) ili implicitna
(sama se poziva ovisno o kontekstu, a za nove korisnike mogu se osigurati
tutoriali20.
Istraivanja su pokazala da su upute koje online knjinini katalozi pruaju
nedostatne te da ih je potrebno osigurati pri svakom koraku tijekom pretraivanja
(Borgman 1996; Hancock-Beaulieu 1992; Hildreth 1995). Vano je da upute za
pomo budu stalno dostupne dok korisnik obavlja radnju, a ne da se prozor s
uputama mora zatvoriti radi druge aktivnosti.
Pomo od raunalnog zaslona trebalo bi omoguiti pri preoblikovanju upita,
npr. pri promjeni operatora ili termina za pretraivanje. Predmetne odrednice u
dobivenim zapisima mogu biti korisne za daljnje pretraivanje, ali korisnike je na to
potrebno uputiti, kao i osigurati pomo o uputnicama u knjininim katalozima, koje
su neophodne, ali kako one funkcioniraju nije uvijek jasno korisnicima (Wasylenko
2000). Istraivanja su pokazala (vidi, npr., Zumer, Lei 1994) da, iako veina online
kataloga, podrava eksplicitno kraenje sufiksa kljunih rijei, to nigdje ne navode u
20

Vidi, npr., tutoriale Nacionalne medicinske knjinice (NLM LocatorPlus help, tutorials and FAQs),
URL: http://locatorplus.gov/help.html

77

uputama pa korisnik nije svjestan mogunosti. Pokazalo se da bi korisnici voljeli da


ih katalog uputi kada je poeljna koja vrsta pretraivanja i da uz svaku vrstu
pretraivanja stoji uputa.
C. Borgman (1996) tvrdi da korisnici online kataloga trebaju vie pomoi s
konceptualnim aspektima pretraivanja, a da je danas pomo pri koritenju online
kataloga uglavnom usmjerena na tehnike vjetine, ostavljajui sa strane one
vjetine u kontekstu semantikog, a jo manje konceptualnog znanja. Upute za
korisnike trebale bi osigurati pomo u smislu kako mogu prevesti svoje ideje na
pojmove koritene u katalogu, kao i upute o tehnikim vjetinama, npr. kako se
provodi samo pretraivanje. Posebno je vano (Hildreth 1995) osigurati pomo ako
na upit nema odgovora, bilo da se korisnik usmjeri openito na to kako oblikovati
upit, ili kako proiriti upit. ak i ako na upit postoji odreen broj odgovora, dobro je
osigurati pomo jer dobiveni zapisi moda ne zadovoljavaju korisnikove
informacijske potrebe.
U tom smislu C. Long (2000, str. 172) preporuuje sljedee:
1. Potrebno je osigurati online kontekstualne upute o nainu provoenja
pretraivanja po kljunim rijeima i predmetnim odrednicama.
2. Upute za pretraivanje po kljunim rijeima i predmetnim odrednicama
trebale bi, osim postupaka pretraivanja, obuhvatiti konceptualne aspekte
pronalaenja.
3. Pomo je potrebno ponuditi kada nema pronaenih zapisa.
4. Pomo je potrebno ponuditi i ako je odreen broj zapisa pronaen.

7.3. Vrste korisnikih suelja


Korisniko suelje toka je komunikacije sustava s korisnikom. Openito bi
korisniko suelje trebalo osigurati pristup informaciji na jednostavan, razumljiv i
fleksibilan nain, kako korisnici ne bi trebali troiti vrijeme na upoznavanje sa
sustavom.
Iako se dananji online katalozi znatno razlikuju po svojim mogunostima,
vie ili manje osiguravaju barem dvije vrste suelja, komandno i ono s izbornicima.
78

Komandno suelje moe se smatrati sueljem u kojem je korisnik osnovni pokreta i


voditelj, dok je u suelju s izbornicima to sustav. esto postoje dvije inaice suelja
s izbornicima, jedno za poetnike, a drugo za napredne korisnike. Komandno
suelje danas koriste uglavnom knjiniari i informacijski strunjaci.
Komandno suelje prva je vrsta suelja koritena u online katalozima. Ovim
sueljem danas se slue uglavnom iskusni korisnici i informacijski strunjaci jer je
potrebno poznavati naredbe. Sustavu korisnik daje naredbu na koju sustav odgovara,
a svaka se naredba sastoji od operatora, koji govori o kojoj se vrsti naredbe radi, i
operanda, rijei koja se trai u zapisima ili dokumentima (npr. u upitu SU rivers, SU
(SUbject) je operator koji oznaava da se radi o predmetnom pretraivanju, a rivers
je operand, tj. upit trai rije rivers u nekom od informacijskih sustava). Problem je
taj to gotovo svaki sustav ima vlastite operatore, ak i u Sjedinjenim Amerikim
Dravama, unato injenici to je 1992. donesen standard o zajednikom
komandnom jeziku (ANSI/NISO Z39.58-1992).
Suelje s izbornicima predoava korisniku mogunosti koje mu stoje na
raspolaganju i iz kojih moe birati. U ovom su suelju naredbe skrivene od
korisnika pa korisnici ne moraju poznavati operatore za pojedine funkcije. Starije
vrste suelja s izbornicima zahtijevale su navigaciju uz pomo tipkovnice i pritisak
od dvije ili tri tipke istodobno radi odabira eljenog izbora. Razvojem grafikih
korisnikih suelja (graphical user interface GUI), u kojima se u prozoru otvaraju
izbornici, omogueno je da se miem odabere ili aktivira eljeni izbor. Manje
iskusni korisnici radije se slue ovim sueljem, iako su mogunosti esto
nedovoljno objanjene i jasne (Olson, Bol 2001, str. 280). Korisnici esto ne
razlikuju predmetne odrednice od kljunih rijei i klasifikacijskih oznaka,
primjerice. U izbornicima treba postojati mogunost hijerarhijskog prebiranja, bez
obzira kojom pristupnicom korisnik zapoinje pretraivanje. Za izradu ovakvih
uputa i za jasan i pristupaan dizajn nedostaju standardi. Za iskusna korisnika u
suelju s izbornicima potrebno je osigurati kratice, odnosno mogunosti koje
mogu odmah odabrati, a ne moraju ii korak po korak.
Jedna inaica suelja s izbornicima je suelje s kuicama za unos rijei (fillin form), kakvo je u WebPAC-ima najee. Sastoji se od kuica ili praznina u koje
korisnik unosi traenu informaciju (operand), bilo da se ta kuica nalazi uz
unaprijed odreeno polje, npr. za naslov, ili se uz kuicu nalazi padajui izbornik u
kojem korisnik odreuje operator (naslov, kljuna rije i sl.), a ove se kuice esto
79

mogu povezati Booleovim operatorima ili njihovim opisnim inaicama (npr. sve
rijei, bilo koja rije, i, ili, je, nije). Grafiko suelje korisniku omoguava da vidi
popis predmetnih odrednica ili tezaurus istodobno kao i rezultate pretraivanja, to
je vrlo vano pri oblikovanju pretraivanja.
U dananjem sve globalnijem informacijom okruenju potrebno je osigurati
suelja koja e biti pristupana svima, neovisno o fizikim, kognitivnim,
emocionalnim i kulturolokim razliitostima, ukljuujui viejezina suelja
(Marchionini 1992, str. 162).
Pitanje koje se postavlja jest je li mogue definirati skup globalnih strategija
za pretraivanje, a da je svaka prikladna za odreeni stereotip korisnika? Sustav
mora zadovoljiti golemu raznolikost osobnih karakteristika korisnika, njihove
kognitivne sposobnosti i zadatke koje imaju. Za njihove zadatke nije potrebna samo
prikladna informacija koja se trai i pronalazi, ve i podrka za donoenje odluka pri
pretraivanju. U strunoj literaturi nalazi se na dva rjeenja: oblikovanje razliitih
suelja za razliite razine znanja korisnika (npr. za osnovno i napredno
pretraivanje), te oblikovanje individualiziranih suelja za svakog korisnika.
Oblikovanje individualiziranih suelja smanjuje korisnikov napor u odabiru
relevantnih jedinica grae u promjenjivom informacijskom okruenju. Stalno
auriranje suelja, uz pomo korisnikove povratne informacije, dozvoljava sustavu
da prati promjene u interesima i informacijskoj potrebi (Cunningham, Witten, Littin
1999, str. 373). Idealno bi bilo individualizirano suelje prilagoeno potrebama
svakog korisnika i ekspertni sustav koji ui kako korisnik pretrauje i njemu se
prilagoava. Teko je predvidjeti kada bi takvi sustavi mogli postati realnost, no
suelja s izbornicima moda e biti zamijenjena sueljima koja se temelje na drugim
vrstama veza, a izrastaju iz jezika za oznaavanje poput HTML-a, SGML-a i XMLa (Olson, Boll 2001, str. 203-204).

7.4. Viejezinost
O viejezinosti u online katalozima, kao o jednom od kljunih pitanja u globalnom
informacijskom povezivanju, provode se mnogobrojna istraivanja, no u ovome e

80

se radu problematizirati samo o segmentu potrebnom za upotpunjavanje slike o


predmetnom pretraivanju u WebPAC-ima.
E. Svenonius (2000, str. 197) tvrdi da je potrebno razvijati viejezina
suelja za pretraivanje, to je jedna od sastavnica u ostvarivanju univerzalne
bibliografske kontrole. Osim viejezinih suelja, viejezinost se moe osigurati i
pri postavljanju upita, prevoenjem korisnikog upita na jezik baze koja se
pretrauje, za to je potrebno da suelje omogui obradu upita na vie od jednoga
jezika i pristup viejezinim rjenicima (Vickery, Vickery 1993, str. 137).
Kada se radi o viejezinim sueljima, problem je relativno jednostavan jer
je oblikovati nekoliko istih suelja na razliitim jezicima prilino jednostavno.
Dananje web-trailice nastoje podravati viejezinost i to uspijevaju do razliitih
stupnjeva (vidi, npr. Chan, Lin, Zeng 2000). Ono to bi WebPAC-i od njih mogli
preuzeti je prepoznavanje domene za dravu iz koje korisnik pristupa katalogu i
automatsko prikazivanje suelja na jeziku te drave.
Preduvjet za prihvaanje upita na jednom jeziku i pretraivanje na drugom
jest prevoenje termina uz pomo viejezinih rjenika, to povlai nekoliko
problema: pojam predstavljen jednom rijeju u jednom jeziku nema uvijek
ekvivalent od jedne rijei u drugom jeziku (isto vrijedi i za pojmove izraene s dvije
ili vie rijei); jednoznana rije u jednom jeziku moe u drugom biti vieznana pa
su potrebni posebni postupci za odabir prikladnog znaenja; te, postoje i rijei iz
upita koje nemaju ekvivalenta u drugom jeziku ili u rjeniku koji koristi odreeni
sustav (Vickery, Vickery 1993, str. 137). Jedno od predloenih rjeenja prevoenja
upita jest prevoenje oznaka iz opeg klasifikacijskog sustava poput UDK, koji
pokriva sva podruja znanja, na termine iz tezaurusa na vie jezika (Francu 2002).
Za pitanje vieznanosti vezan je problem pisama. Ovaj se problem u
knjininim katalozima rjeava najee transliteracijom. Meutim, ne koriste svi
knjinini softveri iste standarde za transliteraciju, niti su standardi za sve vrste
pisama doneseni. Primjerice, Kongresna knjinica koristi vlastiti standard (Library
of Congress Romanization), koji neka slova irilice prikazuje kao dva znaka, dok
standardi ISO koriste jedan, pa korisnik koji poznaje standard ISO nee dobiti
rezultate jer ne zna da Kongresna knjinica transliterira drukije (Chroust 2001, str.
47). Iako danas postoji meunarodni Unicode standard za kodiranje znakova
ISO/IEC 10646, mnogi zapisi i dokumenti i dalje se izrauju u standardima za jedan
jezik ili pismo, pa ak i u lokalnim inaicama (Borgman 2000, str. 219). to se tie
81

pretraivanja na izvornom pismu, Britanska knjinica, na primjer, omoguuje takvo


pretraivanje na terminalima putem zaslona osjetljivog na dodir (touch screen) na
kojem su prikazane tipkovnice s traenim pismima (Butcher 1993, str. 169).

7.5. Pristupanost suelja WebPAC-a


Osobe koje zbog potrebe ili elje koriste tekstualne web-preglednike (browsers),
samo e djelomino moi koristiti suelja s grafikom. Softveri za sintezu govora jo
uvijek dobro itaju jedino tekst, te slijepe i slabovidne osobe mogu koristiti samo
tekstualne informacije. Problem predstavljaju suelja na kojima je sama grafika
(npr. ikona) osnovni nositelj informacije, kada je potrebno u njenoj neposrednoj
blizini uvrstiti tekst s objanjenjem (Web Content Accessibility Guidelines 1.0). U
obzir treba uzeti potrebu korisnika s motorikim oteenjima koji znatno lake
barataju sueljima koja u manjoj mjeri zahtijevaju pomicanje sadraja na zaslonu
(scroll) te bi stoga idealno bilo kada bi sadraj jedne stranice stao na zaslon
(Edwards, Van Mele, Verheust, Spaepen 1997). S obzirom na navedeno, C. Long
(2000, str. 171) daje tri smjernice za dostupnost WebPAC-a:
1. Potrebno je osigurati i tekstualno suelje.
2. Potrebno je izbjegavati grafiku u funkciji pretraivanja.
3. Web-suelje potrebno je oblikovati i za osobe s posebnim potrebama.
U obzir svakako valja uzeti i specifian nain informacijskog pretraivanja
osoba s posebnom potrebama. Projekt NoVA (Non-Visual Access to the Digital
Library) (Craven, Brophy 2003) podnio je opseno izvjee o nainu na koji slijepe
i slabovidne osobe pretrauju i snalaze se u digitalnom svijetu, koje moe posluiti
kao temelj za smjernice za oblikovanje suelja digitalnih knjinica. Osnovni
problem slijepim i slabovidnim osobama je taj to pomone tehnologije kojima se
one slue podravaju jedino tzv. linearno pregledavanje digitalnih izvora, tj. itanje
rije po rije pa je navigacija po kompleksno organiziranim mrenim stranicama,
primjerice s puno tzv. frameova (okvira), ovim osobama oteana. Ovakva

82

istraivanja potrebno je provesti i za ostale skupine osoba s posebnim potrebama i


prirediti smjernice za izradu svima pristupanih suelja za pretraivanje.

7.6. Dizajn suelja


Dizajn treba osigurati da mogunosti za pretraivanje na zaslonu budu jasne i da
navode korisnike na koritenje funkcija koje e olakati njihovo pretraivanje. Dobri
sustavi mogu biti nefunkcionalni ukoliko im je dizajn lo.
Ovo je podruje kojem je potrebno pristupiti interdisciplinarno, ukljuujui
saznanja iz semantike koja se bavi istraivanjem komunikacije, iz grafikog dizajna
i web-dizajna, ponaanja korisnika pri pretraivanju i interakcije s raunalom, i
drugoga.
IFLA-ina Sekcija za informacijsku tehnologiju (IFLA Section on
Information Technology) 1995. pokrenula je projekt izrade standardnog skupa ikona
za bibliografske informacijske sustave, u okviru kojeg je napravljen prijedlog za
standardizaciju sliica na sueljima bibliografskih baza podataka21, koji, meutim,
nije naiao na vei odjek. Godine 1999. IFLA je izradila Smjernice za suelje
OPAC-a (Guidelines for OPAC displays), ali su one povuene te je u tijeku izrada
novih.
U literaturi se, vezano uz dizajn suelja online katalog, preporuuje sljedee:
okupljanje srodnih bibliografskih polja, pozicioniranje oznaka s desne strane tako da
je oznaka u blizini poetka polja u kojem su prikazani podaci, prikazivanje oznaka
koje u sebi sadre razmake (npr. signatura) sa tim razmacima, uporaba punih rijei
za nazive polja, a ne kratica, koritenje laikih naziva polja, a ne strunih, te
uporaba jasnih i preciznih naziva polja (Cherry 1998, str. 132).
Postoji niz online kataloga koji su se svojim posebnim multimedijskim
dizajnom nastojali pribliiti korisnicima (Onion Patch(sm) 2000). IRCAM
Multimedia Library22 je multimedijska knjinica Instituta za istraivanje akustike i
glazbe (Institut de Recherche et de Coordination Acoustique/Musique - IRCAM), u
kojoj je omoguena navigacija i pretraivanje koritenjem tlocrta knjinice.
21
22

Bibiliographic standard GUI icon set, URL: http://www.scran.ac.uk/iconstd/


URL: http://mediatheque.ircam.fr/index-e.html

83

Korisnici mogu prebirati po policama i pridruenim klasifikacijskim oznakama,


pronai kataloni zapis za odabrane jedinice grae, pa i samu jedinicu ukoliko je
dostupna online. Ovaj katalog takoer omoguuje navigaciju i prebiranje u
trodimenzionalnoj virtualnoj stvarnosti. U Informatikoj knjinici Sveuilita u Oslu
(Informatikkbiblioteket Universitetet i Oslo) razvijao se projekt za osmiljavanje
pretraivanja online kataloga koritenjem tlocrta knjinice. Njihov specijalni
klasifikacijski sustav Udruenja za raunalnu tehnologiju (Association of
Computing Machinery ACM) moe se prebirati pritiskom na odreeni dio na
tlocrtu koji u opisu sadri mjesto djela u toj klasifikacijskoj shemi. Uz pojedine
skupine u klasifikacijskoj shemi prikazuju se postojei naslovi iz knjinice. Slino
suelje razvijano je na Windsorskom sveuilitu (Univeristy of Windsor) u Kanadi,
pod nazivom VRML to Navigate Information Space, u kojem se na temelju
dobivenih rezultata prikazuje graa na policama, a temelji se na Klasifikaciji
Kongresne knjinice. Speakable OPAC, razvijan u Sveuilinoj knjinici Sjeverne
Karoline (North Carolina State University Library), prototip je sustava za itanje
odabranih sadraja online kataloga. Uz prikladni softver, Speakable OPAC prihvaa
odreene izgovorene naredbe i na glas ita autora, naslov, signaturu i status
dostupnosti jedinice grae.

84

8. Online katalozi tree generacije - WebPAC-i

8.1. Okapi
Okapi (Online Keyword Access to Public Information) razvija se od 1982. godine
na dananjem Sveuilitu Westminster (Westminster University), a od 1989. na
Gradskom sveuilitu (City University) u Londonu. Obiljeja Okapia po kojima se
ubraja u kataloge tree generacije ukljuuju korisniki pristupano grafiko suelje,
mogunost postavljanja upita na prirodnom jeziku, ispravljanje pogreki u pisanju,
uputnice

za

preoblikovanje

sinonime,
upita

koritenje

(automatic

tezaurusa
query

pretraivanju,

expansion

AQE),

automatsko
interaktivno

preoblikovanje upita (interactive query expansion - IQE) i rangiranje rezultata po


relevantnosti.
Cilj Okapia bio je nainiti sustav koji bi bio jednostavan za koritenje nekom
tko uope ne poznaje online kataloge, ali da istodobno prua mogunosti potrebne
iskusnim korisnicima. Razvijao se u nekoliko stadija.
U Okapiu '84 omoguen je unos upita na prirodnom jeziku. Primijenjena je
tehnika najboljeg rezultata (best match), to je predstavljalo znaajan napredak u
odnosu na tadanje sustave utemeljene na Booleovim operatorima, u kojima su se
rezultati dobivali jedino ako su u potpunosti odgovarali upitu. Rezultati
pretraivanja rangirani su zatim prema stupnju u kojem odgovaraju upitu.
U Okapiu '86 omogueno je ispravljanje pogreki u pisanju i kraenje, te su
uvedene uputnice za sinonime, sa ciljem smanjivanja broja neuspjelih pretraivanja.
Budui da je vrednovanje Okapia '84 pokazalo da korisnici ele vie predmetnih
pretraivanja, bibliografskim datotekama dodano je polje MARC-a 651 za
predmetne odrednice s potpoljima za tematske, zemljopisne i formalne
pododrednice.
Pogreke u pisanju provjeravale su se tako to su se rijei koje sustav nije
mogao provjeriti usporeivale s indeksom iz kojeg su korisniku ponuene
alternative kao zamjena. Kasnije istraivanje pokazalo je da korisnici ne vole
svojstvo Okapia da automatski ispravlja pogreke u pisanju.
Indeksirane kljune rijei i rijei iz upita se krate, to poveava vjerojatnost
pronalaenja traenih jedinica grae. Koriteno je tzv. slabo i jako kraenje. Slabo
85

kraenje je uklanjanje uobiajenih sufiksa za plural i drugih gramatikih sufiksa


poput -ing i ed. Jako kraenje obuhvaa uklanjanje derivacijskih sufiksa poput
ent, -ence, -ision, za koje se pokazalo da vraa previe neoekivanih rezultata te da
se treba izbjegavati.
Za sinonime je koritena tablica koja je sadravala istoznanice i
bliskoznanice, kratice, akronime, parove imenica/pridjev (npr. Wales/Welsh),
nepravilne mnoine (npr. wife, wives), i alternativne naine pisanja (npr. tsar, tzar,
czar, csar). Pokazalo se da tablica za sinonime nije ni posebno korisna ni tetna za
pretraivanje, ali je korisniku pomogla da se ne mora sam dosjeati drugih
sinonima. Meutim, uvijek postoje trokovi odravanja ovakvog sustava uputnica
koje je potrebno razmotriti u odnosu na korisnost odreenog obiljeja.
U Okapiu '88 uvedena je tehnika preoblikovanja upita (query expansion),
koja se temelji na korisnikovom sudu o relevantnosti pronaenih jedinica grae.
Tehnika se sastojala od prikupljanja termina iz dobivenih zapisa koje korisnik
smatra relevantnima, dodavanja tih termina postojeim terminima iz upita, te
izraunavanja teine svakog termina. Nakon toga, katalog se pretraivao na
temelju esnaest najerelevantnijih termina. Ispis rezultata bio je rangiran, a temeljio
se na tri vrste pridruenih vrijednosti ili teina. Teina svakog zapisa odreivala
se u odnosu prema maksimalnoj teini, tj. onoj koja se pridruuje zapisu sa svim
rijeima iz upita. Za zapise koji su imali dvije treine od maksimalne teine
smatralo se da dobro odgovaraju korisnikom upitu, a za one koji su imali pola od
maksimalne teine smatralo se da manje odgovaraju. Zapisi koji su imali manje
od jedne treine maksimalne teine odreeni su kao oni koji odgovaraju upitu, ali
ne dovoljno.
Vrednovanjem se pokazalo da je vrlo mali postotak pretraivanja bio
neuspjean i da je preoblikovanje upita uinkovito u pronalaenju specifinijih
predmeta ili u mijenjanju naglaska pretraivanja. Takoer se pokazalo uinkovitim u
sluajevima kada prvo pretraivanje nije bilo uspjeno. U sljedeem istraivanju
kojim se detaljnije eljela utvrditi korisnost preoblikovanja upita provedeno je 1990.
Pokazalo se da je vrlo mali broj neuspjenih pretraivanja, svega 3,9% u odnosu na
prijanjih 40% u sustavu za potpuno preklapanje rezultata s upitom (best match).
Otkrilo se da su korisnici preoblikovanje upita najee koristili kada rezultati
pretraivanja prvoga upita nisu bili dobri ili kada je Okapi pronaao samo dio
rezultata. Pokazalo se da je samo jedna treina korisnika rabila preoblikovanje upita,
86

ali gotovo u pola pretraivanja u kojima je koriteno preoblikovanje upita, pronaen


je jo barem jedan zapis.
Idui projekt, Okapi '93, uveo je dvije razliite vrste preoblikovanja upita,
automatsko i interaktivno. Automatsko preoblikovanje upita (automatic query
expansion - AQE) je ono u kojem sustav sam izdvoji rijei iz relevantnih zapisa te ih
zajedno s rijeima iz upita prikae korisniku. Interaktivno preoblikovanje upita
(interactive query expansion - IQE) je ono u kojem sustav izdvoji termine iz
relevantnih jedinica grae i prikae ih korisniku koji sam odabere eljene termine.
Ove tehnike vrednovane su u eksperimentima Okapi '94, u kojima se pokazalo da
davanje korisnicima vie nadzora nad ukljuivanjem novih rijei i izraza nije uvijek
bilo korisno te da su samo rijetki odabrali interaktivno preoblikovanje upita.
Idui projekt pod nazivom Enquire Okapi s novim sueljem, ispitivao je
kako najbolje kombinirati AQE i IQE s traenjem po tezaurusu, a da se dobije
maksimalno od korisnikovih procjena o relevantnosti za poboljanje pretraivanja.
Pokazalo se da je AQE uinkovitiji alat za pretraivanje nego prebiranje po
zapisima u blizini relevantnog zapisa u klasificiranom slijedu, te, ponovno, da je to
vrlo uspjena tehnika pretraivanja. Ova istraivanja u suprotnosti su s negativnim
rezultatima istraivanja tehnike preoblikovanja upita o kojima se ranije pisalo
(Hancock-Beaulieu, Walker 1992).
Takoer se pokazalo da i eksplicitno i implicitno koritenje tezaurusa moe
biti korisno pri oblikovanju upita. Iako sustav moe pronai korisne termine iz
tezaurusa za preoblikovanje upita, najvredniji su termini koje korisnici sami
odaberu.
Glavno obiljeje suelja Enquire Okapi jest da pretraivanje ukljuuje
procjenjivanje relevantnosti i termina i jedinica grae, ime je poboljan i stupanj
interakcije (Hancock-Beaulieu 1997).
Tzv. Okapi-Pack je inaica Okapia koja se moe dobiti od Centra za
istraivanje interaktivnih sustava (Centre for Interactive Systems Research) na
Gradskom sveuilitu u Londonu, za potrebe istraivanja.

87

8.2. Chesire II
Online katalog Chesire II razvijen je sredinom 1990-ih na Kalifornijskom
sveuilitu (University of California) u Berkeleyu, sa ciljem da postane sljedea ili
trea generacija online kataloga koritenjem naprednih tehnika za predmetno
pretraivanje iz podruja informacijskog pretraivanja.
Cheshire II ima mogunost unosa upita na prirodnom jeziku. Podrava
nekoliko tehnika prevoenja termina iz korisnikog upita na rjenik koriten u bazi
kataloga: stop-listu, pretvorbu i raspored rijei iz upita po odreenim poljima iz
zapisa, algoritme za kraenje sufiksa i pretvaranje, npr., iz oblika u mnoini u oblik
u jednini, te preslikavanje rijei iz upita u standardizirani oblik kakav postoji u
rjeniku i tezaurusu.
Dok se u online katalozima klasifikacijska oznaka openito tretira kao samo
jo jedna kljuna rije u zapisu, u ovom projektu klasifikacijske su oznake
ekstrahirane iz MARC zapisa da bi se poveao broj termina vezanih uz pojedini
zapis, i dodani su termini analogni s uputnicama use ili RT iz tezaurusa, upuujui
korisnika na kontrolirani rjenik pojmova prikazanih klasifikacijskim oznakama. Na
taj nain tzv. class clusters (skupine klasifikacijskih oznaka) funkcioniraju poput
tezaurusa (O'Brien 1994, str. 227, 230).
Korisnikov se upit, dakle, usporeuje s odreenim klasifikacijskim
skupinama (classification clusters) iz kataloga, tako da su skupine (clusters)
prikazuju u opadajuem slijedu prema vjerojatnoj relevantnosti za korisnikov upit.
To korisniku olakava odluku o predmetu koji ga zanima. Probabilistika metoda
rangiranja temelji se na algoritmu za koji se pokazalo da postie izvrsne rezultate u
pretraivanju potpunog teksta sustava za informacijskog pretraivanja.
Sustav je uveo metodu rangiranja rezultata koja se temelji na dvije paralelne
trailice, iji su rezultati implementirani u jednom algoritmu. Ovako korisnici mogu
iskoristiti prednosti eksplicitnog pretraivanja Booleovim operatorima, najkorisnijeg
za usko definirana pretraivanja, i probabilistikog pronalaenja, korisnog u
sluajevima kada korisnici ne poznaju rjenik za oznaivanje koriten za opis
traenih jedinica. Osim toga, nije dokazano da je jedan od ovih algoritama za
pretraivanje bolji za sve vrste pretraivanja (Larson, McDonough, O'Leary, Kuntz,
Moon 1996).
88

8.3. WebPAC-i danas


Sve vea prisutnost Mree, popularnost grafikog okruenja i opa prihvaenost
standarda Z39.50 doveli su do radikalnih promjena u suelju kataloga za korisnike.
Nadalje, sve vea brzina, snaga, sofisticiranost i pouzdanost raunalne tehnologije
omoguili su naine pretraivanja kakvi su ranije bili dostini jedino u
eksperimentalnim katalozima. Katalozi druge generacije (Hildreth 1984) uveli su
poboljanja poput veeg broja pristupnica, viestrukog naina pristupa pretraivanju
i puno vie informacija kada su zapisi pronaeni. Svojstva koja je C. Hildreth naveo
kao napredna svojstva tree generacije online kataloga, poput rangiranja po
relevantnosti, danas postaju dostupna. Osobit potencijal online katalozi imaju u
poboljanju pretraivanja i prebiranja. WebPAC-i zbog koritenja HTML-a imaju
posebnu mogunost ostvarivanja veza u katalogu koje olakavaju pretraivanje i
otvaraju razne mogunosti za prebiranje. Sami korisnici ovih kataloga brojniji su i
raznolikiji jer se katalozima moe pristupiti preko Mree.
Kao to je ranije prikazano, mreno okruenje online katalozima omoguava
implementaciju mnogih funkcija koje poboljavaju predmetno pretraivanje,
poevi od pristupanijeg suelja i jednostavnijeg koritenja uz pomo izbornika. Za
razliku od komandnih suelja ili funkcijskih tipki u prvim online katalozima, danas
korisnici ne moraju pamtiti pravila sloene sintakse i suelja su intuitivna. Osim
korisniki pristupanog suelja, hiperveze pretraivanje ine posebno fleksibilnim,
omoguavajui odabir termina iz kontroliranog popisa za prebiranje, iz dobivenih
zapisa i sl. Zatim su tu mogunosti zadravanja strategija i rezultata prethodnih
pretraivanja i kombiniranja pojedinih rezultata, te rangiranje rezultata po
relevantnosti. Posebno su vane mogunosti raunalne obrade prirodnog jezika u
predmetnom pretraivanju, poput kraenja, utvrivanja sinonima te interaktivno
preoblikovanje upita.
Meutim, istraivanja pokazuju da su dananji WebPAC-i negdje izmeu
prve i druge generacije online kataloga i da su ak njihove telnet ili mjesno dostupne
inaice sofisticiranije ili fleksibilnije (Oritz-Repiso, Moscoso 1999) te da uglavnom
nisu uvrstili prednosti mrenog okruenja i mogunosti koje postoje za predmetno
pretraivanje (Long 2000, str. 178). Neka druga istraivanja pokazala su
optimistiniju sliku, poput britanskih visokokolskih knjinica (Babu, O'Brien
2000), gdje postoji navigacija po hipervezama, razraen sustav uputnica koji moe
89

biti automatiziran i mogunost pretraivanja po kljunim rijeima iz predmetnih


odrednica ukoliko postoje u zapisu.
WebPAC-i se esto u literaturi usporeuju s web-trailicama, pri emu se
naglaava jednostavnost koritenja web-trailica i upuuje se da bi knjinini
katalozi trebali biti jednako intuitivni. Web-trailice prihvaaju upite na prirodnom
jeziku, temelje se na vieznanoj logici i rangiraju rezultate po vjerojatnoj
relevantnosti. Takoer neke web-trailice podravaju preoblikovanje upita na
temelju dodatnih termina. Npr. AltaVista korisnicima nakon unesenog upita ponudi
popis srodnih termina po kojima mogu pretraivati. Google, danas najpopularnija
web-trailica, omoguava dobivanje rezultata bez potrebe za oblikovanjem upita
koritenjem sloene sintakse. Osim toga, Google oponaa nain na koji ljudi
vrednuju tiskane i druge informacije u realnom svijetu: prvo evaluira strukturu
hiperveza na odreenoj stranici (to ima vie hiperveza na odreenu stranicu, to je
vea vanost stranice), a zatim se vrednuje sadraj dane stranice putem
sofisticiranog algoritma. Veina korisnika vjeni su poetnici i dok su na Internetu
nemaju na raspolaganju informacijskog strunjaka, ve su preputeni sami sebi.
Zato je vano i kataloge tako oblikovati. Veina online kataloga sloena je za
koritenje i ne podrava napredne funkcije poput preoblikovanja upita i postavljanja
upita na prirodnom jeziku (Borgman 1996).
C. Khoo (1999) opisuje E-Referencer, posredni sustav za pretraivanje
online kataloga na Mrei. E-Referencer pretvara online kataloge koji se temelje na
Booleovim operatorima u sustave za pretraivanje s mogunostima kakve imaju
web-trailice. Obrauje upite koje korisnik unese u prirodnom jeziku, preslikava ih
na predmetne odrednice Kongresne knjinice i upit alje knjininom sustavu. Na
temelju korisnikove povratne informacije o dobivenim rezultatima odabire se
strategija za poboljanje rezultata pretraivanja. E-Referencer temelji se na
protokolu Z39.50. Baza znanja preslikava kljune rijei na termine LCSH, sadri
strategije pretraivanja koje se koriste za pretvaranje upita korisnika na prirodnom
jeziku u primjeren upit s Booleovim operatorima, strategije za preoblikovanje upita
radi poboljanja rezultata na temelju prethodno dobivenih rezultata i povratne
informacije od korisnika, strategije za suavanje ili preoblikovanje upita, te pravila
za odabiranje prikladne strategije za pretraivanje. Baza znanja koja preslikava
kljune rijei u LCSH sadri informacije o tome koje su predmetne odrednice
Kongresne knjinice povezane s pojedinom kljunom rijeju. Svakoj predmetnoj
90

odrednici tada je pridruena vrijednost jednaka broju naslova pridruenih


predmetnoj odrednici. Ove vrijednosti zatim se normiraju na temelju dijeljenja s
najviom vrijednou (vrijednost za najeu predmetnu odrednicu). Takve
normirane vrijednosti odraavaju koliko je svaka predmetna odrednica povezana s
kljunom rijei.
Softveri za knjinine sustave su komercijalni. Neke od njih, koji podravaju
napredne funkcije pretraivanja, navodi E. Rasmussen (1999, str. 410-412):
Endeavor Information Systems ima trailicu koja podrava upite na prirodnom
jeziku i rangiranje rezultata po relevantnosti (korisnik u upitu naznai koji su
termini esencijalni, a koji vani); Innovative Interfaces podrava rangiranje rezultata
po relevantnosti, to vrijedi i za pretraivanje po potpunom tekstu na temelju
AltaVista-inog algoritma; EOS International takoer omoguava postavljanje upita
na prirodnom jeziku, preoblikovanje upita na temelju rjenika, pretraivanje na
temelju vieznane logike i rangiranje rezultata po relevantnosti. Neki sustavi za
online kataloge razvijani su, meutim, radi istraivanja i implementacije u
akademskim knjinicama, poput Okapia i Cheshire II, kojima je cilj bio razviti
online kataloge tree generacije.

91

9.

Istraivanje

WebPAC-a

britanskih

hrvatskih

sveuilinih knjinica

9.1. Uvod u istraivanje


Predmetno pretraivanje online knjininih kataloga vrlo je vano znanstvenom i
nastavnom osoblju te studentima koji vre istraivanja na odreenu temu. Zbog toga
je istraivanje u okviru ovoga rada usmjereno prvenstveno na sveuiline knjinice.
Korisnici sveuilinih knjinica razliitih su znanja i iskustava, od dodiplomskih
studenata s malim ili nikakvim iskustvom u pretraivanju informacijskih izvora, do
znanstvenika s bogatim iskustvom, pa suelja trebaju podravati ove razliitosti.
Istraivanjem se eljela utvrditi raznolikost i kvaliteta predmetnog
pretraivanja informacija u WebPAC-ima sveuilinih knjinica Velike Britanije i
Hrvatske. Knjinice Velike Britanije odabrane su iz razloga to su se tamo
implementirali i ispitivali eksperimentalni katalozi poput Okapia s naprednim
funkcijama tree generacije online kataloga. Osim toga, istraivanja visokokolskih
knjininih kataloga u Velikoj Britaniji pokazala su postojanje naprednih svojstava
kataloga tree generacije (Babu, O'Brien 2000). Istraivanje je obuhvatilo
mogunosti prebiranja i pretraivanja po rijeima, odnosno oznakama, prirodnog i
kontroliranog jezika i mogunosti oblikovanja sloenih upita.
Osnovna hipoteza istraivanja jest da sveuiline knjinice Velike Britanije i
Hrvatske djelomino podravaju predmetno pretraivanje svojstveno katalozima
tree generacije online kataloga.

9.2. Uzorak istraivanja


Uzorak se sastoji od etrdeset engleskih sveuilinih knjinica odabranih prema
sluajnom uzorku, te etiriju hrvatskih sveuilinih knjinica koje imaju online
katalog (vidi Prilog 1). Izbor engleskih knjinica izvren je na temelju popisa P.
Scotta (2003). Nacionalna i sveuilina knjinica u Zagrebu te Gradska i sveuilina

92

knjinica u Osijeku knjinice su s dvojnom funkcijom, koje, meutim, nisu jasno


razdvojene u smislu kataloga pa jesu obuhvaene istraivanjem, zajedno sa
Sveuilinom knjinicom Rijeka i Sveuilinom knjinicom u Splitu.

9.3. Metodologija istraivanja


Istraivanje se temeljilo na popisu provjernih toaka (check list), koji je veim
dijelom pripremljen na osnovi smjernica C. Longa (2000, str. 164-165), slinih
istraivanja (Babu, O'Brien 2000; Cherry, Williamson, Jones-Simmons, Gu 1994) i
prijedloga H. Olson i J. Bolla (2001, str. 193-196). Pitanja obuhvaaju prebiranje i
pretraivanje po kljunim rijeima, pretraivanje po predmetnim odrednicama te
oblikovanje sloenih upita, a sastoje se od strukturiranih i nestrukturiranih pitanja. U
okviru seminarskog rada na Poslijediplomskom studiju iz informacijskih znanosti,
kolegij Indeksni jezici, autorica je provela slino istraivanje na uzorku od petnaest
europskih sveuilinih knjinica koje je ovome posluilo kao pilot istraivanje, na
temelju kojeg je popis provjernih toaka promijenjen i prilagoen. Popis se sastojao
od ukupno 49 pitanja podijeljenih u pet osnovnih skupina: openita pitanja o
suelju, prebiranje, oblikovanje upita, sintaksa i rezultati pretraivanja (vidi Prilog
2).
Iako se veina provjernih toaka mogla istraiti pregledavanjem razliitih
suelja, otvaranjem izbornika i jednostavnih upita, za neke je sluajeve bilo
potrebno oblikovati sloene upite. To se odnosi na kataloge u kojima nije bilo
mogue bez postavljanja upita razluiti o tome kako se odreuje prednost pojedinih
operatora te da li se koristi implicitni operator ili se rijei iz upita obrauju kao
izraz. U prvom sluaju postavljali su se sljedei upiti: London AND Glasgow OR
Edinburgh i London AND (Glasgow OR Edinburgh), a za drugo pitanje London
Glasgow i London AND Glasgow, nakon ega je uslijedila usporedba rezultata i
donoenje zakljuka.
Istraivanje je provedeno u razdoblju od 1. do 15. oujka 2003. godine
koritenjem preglednika Microsoft Internet Explorer 6.0.

93

9.4. Analiza rezultata

9.4.1. Openita pitanja o suelju


to se tie openitih pitanja o suelju za pretraivanje, dvadeset i etiri engleska
kataloga imaju dva ili vie suelja s razliitim mogunostima pretraivanje,
prilagoenih razliitim znanjima korisnika (npr. osnovno suelje i napredno suelje
ili jednostavno suelje i sloeno suelje) (pitanje 1.). Isto tako hrvatski katalozi23
imaju dva razliita suelja, jedno za jednostavno, a drugo za sloeno pretraivanje.
Ostali engleski katalozi imaju nekoliko zasebnih suelja za pretraivanje po
pojedinom polju (npr. suelje za predmetne odrednice, suelje za naslov) i po dva
polja istodobno (npr. suelje za autora i naslov, suelje za naslov i kljunu rije).
Na poetnoj stranici za pretraivanje obje mogunosti pretraivanja, i po
kljunim rijeima i po predmetnim odrednicama, ima dvadeset i etiri engleske
knjinice, a hrvatski katalozi na poetnom suelju imaju mogunost pretraivanja
samo po kljunim rijeima (pitanje 2.).

9.4.2. Prebiranje
Mogunost prebiranja po deskriptorima iz tezaurusa ne postoji niti u jednom
katalogu obuhvaenom istraivanjem (pitanja 3., 3.1., 3.2.).
Prebiranje po predmetnim odrednicama koje je odreeno kao takvo postoji u
petnaest engleskih kataloga, meutim, u okviru pretraivanja po rijeima ili
kljunim rijeima iz predmetnih odrednica na nekom drugom suelju (a koje se
izriito ne odreuje kao prebiranje), postoji jo petnaest drugih kataloga, koji
omoguuju prebiranje po popisu predmetnih odrednica nakon upisa rijei (pitanja 4.,
4.1., 9.2.). U veini kataloga nije bilo mogue utvrditi o kojem se popisu predmetnih
odrednica radi (moe se samo nagaati da se radilo o vlastitom popisu), a od onih u
kojima se moglo ustvrditi, u tri kataloga bili su to popisi LCSH, u jednom LCSH i
23

S obzirom da svi online katalozi hrvatskih sveuilinih knjinica imaju isto suelje i mogunosti,
dovoljno je koristiti sintagmu hrvatski katalozi.

94

MeSH, a u jednom katalogu LCSH, MeSH i jedan popis specifian za zbirku (East
Midlands Collection). Od kataloga koji omoguuju prebiranje popisa predmetnih
odrednica preko suelja za pretraivanje, jedan katalog koristi prijevode
klasifikacijskih oznaka, etiri ih ima LCSH, jedan ima LCSH i MeSH, a jedan
LCSH i Predmetne odrednice iz paleografije (Paleography Subject Headings).
Hrvatski katalozi ne omoguuju prebiranje po predmetnim odrednicama.
Svi katalozi koji na neki nain omoguavaju pregledavanje popisa
predmetnih odrednica, hipervezom povezuju predmetne odrednice sa zapisima koji
tu predmetnu odrednicu sadre (pitanje 4.2.).
Prebiranje po oznakama klasifikacijskog sustava ima deset kataloga,
meutim, kao to je to sluaj i s predmetnim odrednicama, postoje katalozi u kojima
se dozvoljava prebiranje nakon upisa oznake preko suelja za pretraivanje
(dodatnih 16) (pitanje 5). Takoer u veini kataloga nije navedeno koji se
klasifikacijski sustav koristi, a od onih koji su navedeni, postoje dva kataloga s
Klasifikacijom

Kongresne

knjinice,

jedan

Deweyevom

decimalnom

klasifikacijom, jedan s Blissovom bibliografskom klasifikacijom, a jedan s pet


razliitih klasifikacijskih sustava (s Klasifikacijom Kongresne knjinice i
Klasifikacijom Medicinske knjinice (NLM), s dvije vlastite klasifikacije i
prijevodima klasifikacijskih oznaka). Od klasifikacijskih oznaka koje se mogu
prebirati preko suelja za pretraivanje jesu jedna knjinica s Deweyevom
decimalnom klasifikacijom, jedna s Deweyevom decimalnom klasifikacijom i
Klasifikacijom

Kongresne

knjinice,

jedna

Deweyevom

decimalnom

klasifikacijom i vlastitom klasifikacijom, jedna s Deweyevom decimalnom


klasifikacijom, Klasifikacijom Kongresne knjinice, Blissovom bibliografskom
klasifikacijom i vlastitom klasifikacijom, jedna s Klasifikacijom Kongresne
knjinice i vlastitom klasifikacijom, a jedna s Deweyevom decimalnom
klasifikacijom i Klasifikacijom Medicinske knjinice (pitanje 5.1.). U hrvatskim
katalozima mogunost prebiranja po klasifikacijskim oznakama ne postoji.
Od kataloga koji kroz jedno od suelja omoguuju prebiranje po oznakama
klasifikacijskog sustava, svi osim jednog imaju izravnu hipervezu na zapise
oznaene tim klasifikacijskim oznakama (pitanje 5.2.).
etiri engleska kataloga omoguuju prebiranje po signaturi, a jo tri imaju
mogunost prebiranja popisa signatura nakon unosa upita u suelju koje nije
posebno predvieno za prebiranje (pitanje 6). Za dva je popisa signatura bilo
95

mogue sa sigurnou utvrditi da se temelje na klasifikacijskim sustavima, i to na


istima (Klasifikacija Kongresne knjinice, Deweyeva decimalna klasifikacija,
Nacionalna medicinska klasifikacija i nekoliko drugih) (pitanje 6.1.). Svi ovi
katalozi imaju izravnu vezu iz popisa signatura sa zapisima kojima su te signature
pridruene (pitanje 6.2.). U hrvatskim sveuilinim knjinicama prebiranje po
signaturi nije mogue.
Prebiranje po ostalim poljima preko suelja za prebiranje ima devetnaest
engleskih kataloga i svi nude barem dva dodatna polja (pitanje 7.). Polja najee
ponuena na izbor za prebiranje su sljedea: autor (osamnaest kataloga), naslov
(osamnaest kataloga), nakladnika cjelina (etrnaest kataloga), naslov asopisa
(osam kataloga), izdava (tri kataloga), mjesto izdavanja (dva kataloga) ili sva
navedena polja odjednom (sedam kataloga) (pitanje 7.1.). Osim ovih kataloga,
postoje tri kataloga obuhvaena istraivanjem u kojima se pri pretraivanju
oblikovanjem upita nakon upisane rijei ponudi popis s hipervezama (pitanje 7.2.).
Od ovih kataloga njih osamnaest ima izravno hiperveze na zapise koji sadre
odabrane termine. Hrvatski katalozi nemaju mogunost prebiranja.

9.4.3. Oblikovanje upita


Pretraivanje po deskriptorima iz tezaurusa ne postoji ni u jednom od kataloga
obuhvaenih istraivanjem (pitanja 8., 8.1., 8.2.).
Pretraivanje po predmetnim odrednicama postoji u trideset i dva engleska
kataloga (pitanje 9.). Za veinu nije bilo mogue sa sigurnou utvrditi koji se popis
predmetnih odrednica koristi, a u ostalim je sluajevima situacija sljedea: u pet
kataloga LCSH, u jednom LCSH i MeSH odjednom, u jednom LCSH i Predmetne
odrednice iz paleografije, a u jednom LCSH i MeSH (pitanje 9.1.). Nakon
upisivanja rijei iz predmetne odrednice u okvir za pretraivanje, od ova trideset i
dva kataloga, njih osamnaest prikazuje dio popisa predmetnih odrednica u kojem se
nalazi traena rije (pitanje 9.2.). U hrvatskim katalozima postoji pretraivanje po
rijeima iz (nekoliko vrsta) predmetnih odrednica, pri emu se koristi vlastiti sustav
predmetnih odrednica (Gradska i sveuilina knjinica Osijek izrauje vlastite
predmetne odrednice za svoju lokalnu bazu, Sveuilina knjinica Rijeka izrauje
96

vlastite normirane predmetne odrednice za svoju lokalnu bazu, Sveuilina knjinica


Split preuzima normirane predmetne odrednice koje izrauje Nacionalna i
sveuilina knjinica prema vlastitome pravilniku). Nakon upisivanja rijei, dobiva
se popis naslova, a ne popis oblinjih predmetnih odrednica.
Mogunost pretraivanja po klasifikacijskim oznakama postoji u dvadeset i
tri engleska kataloga (pitanje 10.). Od sustava koji su se sa sigurnou mogli
utvrditi, svi koriste barem dvije vrste sustava. Jedan katalog koristi Deweyevu
decimalnu klasifikaciju i Klasifikaciju nacionalne medicinske knjinice, jedan
katalog koristi Klasifikaciju Kongresne knjinice i vlastitu klasifikaciju, jedan
Blissovu

bibliografsku

klasifikaciju,

Deweyevu

decimalnu

klasifikaciju,

Klasifikaciju Kongresne knjinice i vlastitu klasifikaciju, jedan Blissovu


bibliografsku klasifikaciju, a jedan Deweyevu decimalnu klasifikaciju, Klasifikaciju
Kongresne knjinice i vlastitu klasifikaciju (pitanje 10.1.). Nakon upisivanja
klasifikacijske oznake u okvir za pretraivanje, od ova dvadeset i tri kataloga njih
sedamnaest prikazuje dio popisa klasifikacijskih oznaka u kojem se nalazi traena
oznaka (pitanje 10.2.). U hrvatskim katalozima pretraivanje po klasifikacijskim
oznakama ne postoji.
Pretraivanje po signaturama omogueno je u etiri engleska kataloga, a ne
postoji u hrvatskima (pitanje 11.)
Pretraivanje po rijeima ili kljunim rijeima postoji u svim katalozima
obuhvaenima istraivanjem (pitanje 12.). Polja koja stoje na raspolaganju navedena
su u trideset i devet engleskih kataloga, bilo da su polja ponuena na izbor ili su u
Pomoi navedena da se automatski pretrauju.
Kada postoji samo pretraivanje po kljunim rijeima (osam kataloga), u
uputama ili Pomoi navedeno je koja se polja pretrauju: naslov (osam kataloga), u
jednom katalogu naslov i predmetne odrednice, a u jednom naslov, napomena o
sadraju, napomena o disertaciji i predmetne odrednice.
Polja koje stoje na raspolaganju da se po njima moe pretraivati po
pojedinim rijeima ili kljunim rijeima najea su: po naslovu (dvadeset i osam
kataloga), po autoru (dvadeset i sedam kataloga), po predmetu koji obuhvaa sve
predmetne odrednice (dvadeset i est kataloga), po nakladnikoj cjelini (petnaest
kataloga), po naslovu asopisa (devet kataloga), po izdavau (osam kataloga), po
napomenama (est kataloga), te sva navedena polja istodobno (dvadeset kataloga)
(pitanje 12.1.).
97

U hrvatskim katalozima korisnik moe birati u suelju za jednostavno


pretraivanje birati kljune rijei, autora, naslov, rijei iz naslova i jezik, standardne
brojeve te specifian tzv. NSK-UNIN broj, a u suelju za sloeno pretraivanje rije
iz naslova, rije iz bilo kojeg imena, rije iz bilo koje predmetnice, rije iz vlastitog
imena, rije iz imena korporativnog tijela, rije iz obiteljskog imena, rije iz
jedinstvenog stvarnog naslova, rije iz tematske odrednice te rije iz zemljopisne
odrednice. U suelju za jednostavno pretraivanje nije objanjeno to spada pod
kljune rijei.
Mogunost istodobnog, kombiniranog pretraivanja po dva ili vie polja
postoji u trideset i devet engleskih kataloga obuhvaenih istraivanjem te u
hrvatskim katalozima (pitanje 13.).
Prebiranje ili pretraivanje po integriranim kontroliranim rjenicima
omogueno je u etiri kataloga, od ega su u tri kataloga pri pretraivanju po
predmetnicama uz njih prikazane i odgovarajue klasifikacijske oznake, a u jednom
katalogu se pri odabiru naredbe all subjects pod prebiranjem dobije popis koji
obuhvaa i MeSH i LCSH. U hrvatskim katalozima ovo svojstvo ne postoji (pitanje
14.).

9.4.4. Sintaksa
Od zahvaenog uzorka trideset i devet kataloga koristi operatore (pitanje 15.). Svih
trideset i devet kataloga koristi operatore AND i OR, trideset koriste NOT uz jo tri
koja koriste AND NOT, sedam ih koristi i XOR (bilo koji od dva termina, ali ne
smiju oba), tri ih koriste NEAR (rijei jedna do druge), dva koriste WITHIN N (N=
maksimalan broj rijei koliko mogu biti udaljene), a jedan koristi i %N pri emu je
N maksimalan broj rijei koji moe stajati izmeu rijei povezanih ovim
operatorom, i !N, prema kojem redoslijed rijei mora biti isti kao u upitu (pitanje
15.1.).
Slijed izvoenja operacija u etrnaest kataloga odreen je zagradama, u
etrnaest ovisi o redoslijedu unosa upita i odabira padajuih izbornika, sedam ih ne
razumije zagrade i ima operator OR jai od operatora AND (pitanje 15.2.).

98

Hrvatski katalozi koriste Booleove operatore, pri emu se razmak rabi


umjesto operatora AND, + umjesto OR, a umjesto NOT. Operatori se izvravaju
prema redoslijedu kojim su uneseni. Ako se rijei u upitu posebno ne poveu
operatorima, sustav ih automatski obrauje kao da je izmeu njih AND (jer ionako
razmak stoji umjesto AND). Mogunost pretraivanja po izrazu ne postoji. Hrvatski
katalozi podravaju kraenje, i to tako to se znak * rabi za desno kraenje, a ? se
primjenjuje u sredini nizova znakova (povezuje i rijei, ne samo unutar rijei).
Ukupno trideset i est kataloga rijei unesene bez operatora automatski
provodi kao da izmeu njih postoji neki operator ili ih obrauje kao izraz (pitanje
16.). U trideset i dva kataloga koristi se operator AND, pri emu se u dva kataloga
AND povezuje samo rijei u istom polju, a u jednom od njih operator AND
zamjenjuje se operatorom OR ukoliko operatorom AND nisu pronaeni nikakvi
rezultati. etiri kataloga upit koji se sastoji samo od rijei automatski prevode na
pretraivanje po izrazu (pitanje 16.1.).
Pretraivanje po izrazu podravaju dvadeset i dva kataloga (pitanje 17). Od
toga etiri kataloga imaju pretraivanje po izrazu tako to se ne unose nikakvi drugi
operatori, u tri kataloga izraz se odreuje navodnicima, a u preostalih petnaest
kataloga postoji mogunost odabira na suelju za pretraivanje po izrazu (exact,
search for a phrase) (pitanje 17.1.).
U trideset i sedam kataloga postoji mogunost kraenja, od ega se u jednom
automatski krati sufiks, a u ostalima je kraenje eksplicitno (pitanje 18.). Trideset i
est kataloga primjenjuje kraenje sufiksa, pri emu pojedini katalozi koriste
znakove *, ? i $. Sedamnaest ih omoguuje zamjenu znakova u sredini rijei, za to
pojedini katalozi takoer koriste znakove *, ? i $. Jedanaest ih podrava kraenje
poetka rijei, a znakovi koje katalozi koriste su ? i * (pitanje 17.1.). Od ostalih
preciznijih mogunosti pojedini sustavi koriste * za sufikse od jedan do pet znakova,
a ** za neogranien broj znakova (tri kataloga), a neki i sljedee: # trai jedan ili
dva znaka, a ! jedan znak. U hrvatskim katalozima koristi se * za desno kraenje, a ?
u sredini nizova znakova, koji povezuje i rijei (nije da vrijedi samo unutar rijei).

99

9.4.5. Rezultati pretraivanja


Svojstvo da dobiveni zapisi sadre predmetne odrednice koje su hipervezom
povezane s ostalim zapisima s istim predmetnim odrednicama posjeduje dvadeset i
dva engleska kataloga. Rijei iz korisnikog upita posebno su istaknute u petnaest
kataloga. Rezultate prethodnih pretraivanja prikazuje osamnaest kataloga, a tijek
prethodnih pretraivanja dvadeset i jedan. Hrvatski katalozi od ova etiri svojstva
podravaju povezivanje predmetnih odrednica hipervezom iz zapisa (pitanja 19.,
20., 22., 23.).
Mogunost preoblikovanja upita poput proirivanja ili suavanja ili drukijeg
mijenjanja bez ponovnog upisivanja itavog upita omogueno je u dvadeset i tri
kataloga, a ne postoji u hrvatskim katalozima (pitanje 21.).
Mogunost ograniavanja upita podrava trideset i est kataloga (pitanje 24).
Najei kriteriji za ograniavanje su sljedei: godina izdanja (trideset i est
kataloga), vrsta grae (trideset i etiri kataloga), knjinica ili lokacija (trideset i
jedan katalog), jezik (dvadeset i etiri kataloga), vrsta publikacije (osam kataloga),
izdava (pet kataloga) i nain posudbe (etiri kataloga). U hrvatskim katalozima
podrano je ograniavanje po sljedeim kriterijima: jezik, bibliografska razina, vrsta
grae, vrsta publikacije i godina (pitanje 24.1.).
Sortiranje rezultata podrava dvadeset i sedam engleskih knjinica
obuhvaenih istraivanjem, od ega veinom po sljedeim kriterijima: dvadeset i
sedam knjinica omoguuju sortiranje po godini, dvadeset i etiri po autoru,
dvadeset i tri po naslovu, pet po relevantnosti, etiri po vrsti grae (pitanja 25.,
25.1.). Hrvatske knjinice ne podravaju sortiranje rezultata.

100

Tablica 1. Prikaz rezultata za strukturirana pitanja (za ostalo vidi tekst pod analizom
rezultata). Gornji rezultat odnosi se na engleske, a donji na hrvatske kataloge.

Redni
broj
Pitanje
pitanja
1. Postoje li dva ili vie suelja s razliitim mogunostima
predmetnog pretraivanja (vrste pristupnica, nain
postavljanja upita) namijenjenih razliitim znanjima i
vjetinama korisnika?
2. Postoje li na poetnoj stranici za pretraivanje obje
mogunosti pretraivanja, i po kljunim rijeima i po
predmetnim odrednicama?
3. Postoji li mogunost prebiranja po deskriptorima iz
tezaurusa?

Broj
kataloga

24/40

60

4/4

100

24/40

60

0/4

0/40

0/4

4. Postoji li mogunost prebiranja po rijeima iz popisa 30/40


predmetnih odrednica?
0/4
4.2. Postoje li hiperveze na bibliografske zapise koji sadre 30/40
odabrane predmetne odrednice?
0/4
li mogunost
5. Postoji
klasifikacijskog sustava?

prebiranja

po

oznakama 26/40
0/4

5.2. Postoje li hiperveze na bibliografske zapise koji sadre 25/40


odabrane oznake?
0/4
6. Postoji li mogunost prebiranja po signaturama?

75
0
65
0
62,5
0
17,5

0/4

0
17,5
0

22/40

55

0/4

7.2. Postoje li hiperveze na bibliografske zapise koji sadre 21/40


odabrane termine?
0/4
8. Postoji li mogunost pretraivanja po deskriptorima iz 0/40
tezaurusa?
0/4
9. Postoji li mogunost pretraivanja po rijeima iz popisa 32/40
predmetnih odrednica?
4/4
101

7/40

6.2. Postoje li hiperveze na bibliografske zapise koji sadre 7/40


odabrane signature?
0/4
7. Postoji li mogunost prebiranja po drugim poljima?

75

52,5
0
0
0
80
100

Redni
Broj
Pitanje
broj
kataloga
pitanja
9.2. Prikazuje li se dio popisa predmetnih odrednica u kojem se 18/40
nalaze rijei iz upita nakon izvrenja upita?
0/4
10. Postoji li mogunost
klasifikacijskog sustava?

pretraivanja

po

oznakama 23/40
0/4

10.2. Prikazuje li se dio klasifikacijskog sustava u kojem se nalazi 17/40


oznaka iz upita?
0/4
11. Postoji li mogunost pretraivanja po signaturama?
12. Postoji li mogunost pretraivanja po kljunim rijeima?
li
mogunost
istodobnog,
13. Postoji
pretraivanja po razliitim poljima?

%
45
0
57,5
0
42,5
0

4/40

10

0/4

40/40

100

4/4

100

kombiniranog 39/40
4/4

14. Postoji li mogunost prebiranja ili pretraivanja po 4/40


integriranim kontroliranim rjenicima ako se u katalogu
0/4
koristi vie od jednog kontroliranog rjenika?
15. Postoji li mogunost koritenja operatora u oblikovanju 39/40
upita?
4/4

97,5
100
10
0
97,5
100

16. Koristi li se implicitni operator ili sustav rijei iz upita 36/40


razumijeva kao izraz?
4/4

100

17. Postoji li mogunost pretraivanja po izrazu?

22/40

55

0/4

37/40

92,5

4/4

100

18. Postoji li mogunost kraenja?

19. Sadre li dobiveni zapisi hiperveze s predmetnim 22/40


odrednicama na ostale zapise s istim predmetnim
4/4
odrednicama?
20. Jesu li rijei iz korisnikovog upita posebno istaknute u 15/40
dobivenim zapisima?
0/4
21. Postoji li mogunost proirivanja i suavanja rezultata 23/40
dodavanjem novih termina bez ponovnog upisivanja itavog
0/4
upita?
22. Prikazuje li sustav rezultate prethodnih pretraivanja?
18/40
23. Prikazuje li sustav tijek prethodnih pretraivanja?
24. Postoji li mogunost ograniavanja rezultata?
25. Postoji li mogunost sortiranja rezultata?

102

90

55
100
37,5
0
57,5
0
45

0/4

21/40

52,5

0/4

36/40

90

4/4

100

27/40

67,5

0/4

9.5. Zakljuak istraivanja


Osnovna hipoteza istraivanja da sveuiline knjinice Velike Britanije i Hrvatske
djelomino podravaju predmetno pretraivanje svojstveno katalozima tree
generacije online kataloga potvrena je.
Na temelju analize rezultata istraivanja dolazi se do zakljuka da online
katalozi engleskih sveuilinih knjinica podravaju vei broj naprednih funkcija
predmetnog pretraivanja, no to je to u hrvatskim online katalozima sveuilinih
knjinica.
to se tie opih obiljeja suelja, postojanje razliitih suelja prilagoenih
potrebama i vjetinama razliitih skupina korisnika hrvatske sveuiline knjinice
imaju, kao i veina engleskih knjinica. Smjernica za koju se zalae C. Long (2000,
str. 164) da na poetnom suelju postoje obje opcije za predmetno pretraivanje, i
po kljunim rijeima i predmetnim odrednicama, hrvatske knjinice nemaju (postoji
samo opcija za kljune rijei), a veina engleskih knjinica ima obje mogunosti na
poetnom suelju.
Velika razlika izmeu hrvatskih i engleskih knjinica jest u mogunostima
prebiranja. Dok veina engleske knjinica omoguava prebiranje po predmetnim
odrednicama, klasifikacijskim oznakama i drugim poljima iz katalonog zapisa,
hrvatske knjinice ne podravaju prebiranje niti po jednom polju. Iako hrvatske
knjinice omoguavaju pretraivanje po predmetnim odrednicama, nakon
provoenja upita dobije se, kao i pri pretraivanju po ostalim poljima, odmah popis
naslova, za razliku od engleskih kataloga, gdje se, u veini, nakon postavljanja upita
dobiva dio popisa ili indeksa termina ili oznaka u kojem se nalazi rije ili oznaka iz
upita, hipervezom povezana na naslove koji ih sadre. Manje od 25% engleskih
knjinica ima prebiranje po signaturi. Niti jedna hrvatska ni engleska knjinica od
kontroliranih rjenika ne podravaju pretraivanje po deskriptorima iz tezaurusa.
Ono u emu su hrvatski i engleski katalozi vrlo slini jest to to velika veina
engleskih i svi hrvatski katalozi podravaju pretraivanje po kljunim rijeima i
predmetnim odrednicama i mogunost kombiniranog pretraivanja po razliitim
poljima.
Slino je i s uporabom operatora. Veina engleskih i svi hrvatski katalozi
zahvaeni istraivanjem podravaju oblikovanje upita uz pomo Booleovih
operatora, a ukoliko se rijei ne povezuju eksplicitnim operatorima, sustav ih
103

povezuje implicitnim operatorom AND. Mogunosti kraenja postoje takoer u


veini engleskih kataloga i u hrvatskima.
to se tie rezultata pretraivanja, veina engleskih i svi hrvatski katalozi
zahvaeni istraivanjem omoguavaju izravno povezivanje predmetnih odrednica iz
dobivenog zapisa na ostale zapise s istim predmetnim odrednicama te ograniavanje
rezultata po odreenim kriterijima. Veina engleskih kataloga za razliku od
hrvatskih omoguava nakon dobivenih rezultata preoblikovanje upita bez potrebe za
ponovnim upisivanjem itavog upita, prikazuje tijek prethodnih pretraivanja i
omoguava sortiranje rezultata po odreenim kriterijima. Takoer, za razliku od
hrvatskih kataloga, 37,5% engleskih u dobivenim zapisima ima posebno istaknute
rijei iz upita, a 45% prikazuje i rezultate prethodnih pretraivanja.

104

Zakljuak
Namjera ovoga rada bila je osvrnuti se na problematiku predmetnog pretraivanja u
knjininim katalozima s web-sueljem, koje je, prema istraivanjima, najei i
ujedno najneuspjeniji nain pretraivanja ovih kataloga. Nastojali su se izdvojiti
elementi i metodologija oblikovanja predmetnog pretraivanja primjerenog
korisnicima WebPAC-a u hrvatskoj akademskoj zajednici.
U prvome poglavlju raspravljalo se o predmetnom pretraivanju kao zadai
knjininog kataloga, o vanosti predmetnog pretraivanja te o pretpostavkama za
predmetno pretraivanje u bazi podataka raunalnog kataloga. Predmetno
pretraivanje je, kao zadau knjininog kataloga, prvi u 19. stoljeu odredio C.
Cutter, a brojna istraivanja potvruju vanost ove zadae, posebice u online
okruenju, gdje je, pokazalo se, veina pretraivanja koje korisnici provede upravo
predmetna. Predmetno pretraivanje kao zadau kataloga potrebno je, kao i ostale
zadae kataloga, prilagoditi online okruenju kako bi se iskoristili svi potencijali
raunalnog okruenja. Ova problematika razraena je u IFLA-inoj studiji
Funkcionalni zadaci bibliografskih zapisa (FRBR), prema kojoj se katalog vie ne
promatra kao niz bibliografskih zapisa, ve kao mrea povezanih informacija, a
model opisan u ovoj studiji temelji se na naelima oblikovanja relacijskih baza
podataka.
Baza podataka online kataloga danas se sastoji od nekoliko datoteka, od
kojih su za predmetno pretraivanje posebno vane bibliografska datoteka, datoteka
predmetnih preglednih katalonih jedinica i uputnica, te invertirana datoteka. Sam
format MARC, iako sadri dovoljan broj polja za predmetni pristup informacijama
(za termine i oznake kontroliranog rjenika, za napomene i za naslov), linearne je i
krute strukture, prenesene iz papirnog okruenja, i kao takav sprjeava razvoj
strukture vorova i hiperveza svojstvene mrenom okruenju. Budunost e
pokazati hoe li se format MARC samo mijenjati i prilagoavati, ili e ga knjinina
zajednica potpuno napustiti i zamijeniti nekim fleksibilnijim formatom, poput
XML-a.
Na razvoj predmetnog pretraivanja u online katalozima i prednosti online
kataloga u odnosu na tradicionalne kataloge osvrnuli smo se u drugome poglavlju.
105

Dok se u katalogu na listiima okupljanje i pronalaenje jedinica grae na istu temu


postie u stvarnim katalozima, u online okruenju za predmetno pretraivanje
postoji jo nekoliko mogunosti, poput veeg broja pristupnica (npr. kljunih rijei
iz svakog pojedinog polja), kombiniranja ili koordinacije podataka iz razliitih polja
u trenutku pretraivanja raznim operatorima, koritenja tehnika kraenja i suavanja
opsega pretraivanja. Iako su prednosti online kataloga nad katalozima na listiima
mnogobrojne, ta su svojstva u dananjim katalozima samo djelomino iskoritena,
to se posebno odnosi na interaktivnost, tehnike pretraivanja kakve se koriste u
drugim sustavima za informacijsko pretraivanje, pa ak i na predviena svojstva
polja za predmetni pristup informacijama formata MARC koja se gotovo uope ne
koriste. Za razliku od kataloga na listiima, postoji vea mogunost pogreki u
pisanju pri unoenju upita, ali isto tako i pri oblikovanju zapisa, zbog ega je
potrebno osigurati mogunosti prebiranja i mehanizam prepoznavanja pogreaka.
Isto tako, korisnici u online okruenju nemaju na raspolaganju pomo knjiniara pa
upute trebaju biti sofisticirane i interaktivne.
Razvoj online kataloga u literaturi se dijeli na tri osnovna razdoblja, odnosno
na tri generacije, pri emu su katalozi tree generacije oni s naprednim svojstvima,
kakva bi trebali imati katalozi s web-sueljem. Meutim, i dananji su katalozi,
pokazalo se, utemeljeni na katalozima na listiima, odnosno nisu prilagoeni
mrenom okruenju, i ne uzimaju u obzir korisniko ponaanje pri pretraivanju
informacija. Stoga se zakljuuje da dananji katalozi vie ili manje jo uvijek
pripadaju drugoj generaciji online kataloga.
U treemu poglavlju problematizirala su se pitanja predmetnog pretraivanja
identificirana u istraivanjima od 1983. godine do danas i njihova predloena
rjeenja. Zbog posebno prisutnog problema prevoenja upita na jezik sustava,
odnosno pronalaenja prikladne predmetne odrednice ili drugog kontroliranog
termina koji koristi sustav, predlae se datoteka predmetnih preglednih katalonih
jedinica i uputnica, mogunost pretraivanja po rijeima iz predmetnih odrednica ili
drugog abecednog sustava, mogunost prebiranja, pomo pri prevoenju rijei iz
upita na jezik koriten u katalogu te pomo i upute o preoblikovanju upita. Kao
rjeenje ovoga problema u eksperimentalnim katalozima Okapi i Cheshire
predloeno je analiziranje korisnikog upita na prirodnom jeziku po leksikim,
sintaktikim i semantikim svojstvima, kao i eksploatiranje statistikih odnosa
106

izmeu rijei iz naslova i predmetnih odrednica Kongresne knjinice (Library of


Congress Subject Headings). to se tie obogaivanja zapisa predmetnim
pristupnicama, pokazalo se da su, osim poveanja broja predmetnih odrednica radi
poveanja specifinosti u oznaivanju i pretraivanju, poeljne i pristupnice poput
stranica sa sadrajem, tekstova s knjinih ovitaka, predgovora i pogovora. Takoer
je prebiranje i pretraivanje potrebno omoguiti i po nazivima ili opisima
klasifikacijskih oznaka. Uz signature bi trebalo navesti i popis knjiga na policama
radi mogunosti prebiranja. Zbog estih pogreki u pisanju i pravopisnih pogreaka
predlae se uvoenje mogunosti prebiranja po raznim poljima i mehanizam
ispravljanja pogreki. Osim toga, pokazalo se da korisnici ne razumiju suelje
kataloga, od samih uputa o pretraivanju, koritenja operatora, do razlike izmeu
pojedinih datoteka i polja. Stoga je potrebno poboljati izgled samoga suelja,
primjerice, na osnovnom suelju pojednostaviti terminologiju, npr. koristiti naslov
umjesto kljuna rije iz naslova te osigurati jasne i interaktivne upute.
Osnovni zakljuak etvrtog poglavlja, u kojem se raspravlja o nainima na
koje korisnici provode predmetno pretraivanje online kataloga, jest da online
katalozi nisu oblikovani na znanjima o ponaanju korisnika pri predmetnom
pretraivanju, ve su zapravo preslikani model kataloga na listiima. C. Borgman
razlikuje tri razine znanja potrebnih za pretraivanje online kataloga: konceptualno
(prevoenje informacijske potrebe na upit za pretraivanje), semantiko (odluka o
odabiru mogunosti koje sustav nudi) i tehniko (poznavanje sintakse oblikovanja
upita i temeljne raunalne vjetine). Dananji sustavi nedovoljno podravaju ova
znanja, a posebno se malo panje posveuje oblikovanju uputa za konceptualno
znanje. Osnovni problem predmetnog pretraivanja je taj to je za postavljanje upita
potrebno opisati informaciju koja se ne posjeduje. Stoga je potrebno omoguiti
mehanizme preoblikovanja upita i razne alate koji e korisniku pomoi da osvijesti i
izrazi svoju informacijsku potrebu. U online katalozima takoer se ne uzima u obzir
injenica da korisnici upit oblikuju postepeno, ve dizajnom odraavaju stajalite da
korisnici oblikuju upit koji je fiksan cilj pretraivanja i da je svaka sesija
pretraivanja samostalna. Meutim, online katalozi trebali bi osigurati to je vie
mogue razliitih strategija za pretraivanje. S obzirom na raznolikost znanja i
potreba korisnika jednoga sustava, katalozi bi trebali omoguiti personalizaciju
suelja, prilagoenih svakom pojedinome korisniku.
107

U petom poglavlju opisane su razliite vrste predmetnih pristupnica i


predstavljena obiljeja prirodnih i kontroliranih jezika za oznaivanje i pretraivanje
te njihov utjecaj na predmetno pretraivanje. Osvrnuli smo se i na tehnike
pretraivanja iz podruja informacijskog pretraivanja (information retrieval), poput
raunalne obrade prirodnog jezika, koje se nedostatno primjenjuju u predmetnom
pretraivanju WebPAC-a.
Raunalno okruenje omoguava da svaka rije iz svakog polja pojedinog
zapisa bude pristupnica. Zbog toga se danas i gubi razlika izmeu predmetnih i
ostalih vrsta pristupnica, kao i razlika izmeu opisnih podataka, za traenje
korisniku poznatih jedinica, i predmetnih podataka, za traenje korisniku poznatih
ili nepoznatih jedinica na danu temu.
Posebno korisne u predmetnom pretraivanju su kljune rijei iz
kontroliranih termina, pri emu za najbolje rezultate valja koristiti operatore i
kraenje. to se tie dodatnih pristupnica poput stranica sa sadrajem i saecima,
ija je izrada skupa i dugotrajna, preporua se iskoristiti prednost umreenog
okruenja i ove podatke preuzimati iz postojeih zapisa online knjiara ili
nakladnika.
Razlika izmeu popisa predmetnih odrednica i tezaurusa u raunalnim
katalozima gubi se iz dva osnovna razloga. Prvi je taj to se svakoj jedinici grae
dodjeljuje vei broj predmetnih odrednica koje ne oznauju vie samo glavni
predmet dokumenta, ve i pojedine aspekte, za to su ranije sluili iskljuivo
deskriptori. Drugi razlog je taj to se popisi predmetnih odrednica i tezaurusi stapaju
u jedan kontrolirani sustav, pri emu do izraaja dolaze prednosti obiju ovih vrsta
sustava za oznaivanje i pretraivanje. Osim toga, nastoje se integrirati i
klasifikacijski sustavi. Razvoj tehnologija poput XML-a pospjeuje pristup
razliitim kontroliranim rjenicima putem jednog suelja, to predstavlja
jednostavnije rjeenje u odnosu na izradu integriranog kontroliranog sustava. U
svakom je sluaju integrirano koritenje razliitih sustava, poput klasifikacijskih,
abecednih i prirodnih, poeljno jer svaki od njih omoguava predmetni pristup
informaciji s razliitih aspekata. Upravo je najvea prednost online okruenja ta to
se pretraivanje moe provoditi istodobno po razliitim sustavima, npr. po
abecednom i klasifikacijskom sustavu te po kljunim rijeima. Sve se vie govori i o

108

razvoju neverbalnih sustava za pretraivanje i omoguavanje pristupa neverbalnim


vrstama grae ili njihovoj integraciji u online kataloge.
Kataloge je potrebno oblikovati i tako da se korisnike uputi s rijei koju
unese na odobreni termin ili oznaku u kontrolirani termin, bilo da se osigura
datoteka predmetnih preglednih katalonih jedinica i uputnica, tezaurus ili/i
prebiranje po kontroliranim sustavima. Za povezivanjem i usklaivanjem razliitih
informacijskih sustava, koji koriste razliite kontrolirane sustave za oznaivanje i
pretraivanje, tezaurusi su se pokazali najboljim alatom jer su u njima precizno
odreeni odnosi ekvivalentnosti, srodnosti i hijerarhije.
Tzv. operatori odnosa u kontroliranim sustavima poput sintaktikih,
klasifikacijskih i predmetnih sustava omoguuju postkoordinirano pretraivanje
prekoordiniranih termina i oznaka, iako se ove mogunosti danas u online
katalozima rijetko koriste. Mijenja se podjela postkoordiniranih i prekoordiniranih
sustava jer se prekoordinirani termini i oznake u raunalnom okruenju mogu
pretraivati po svojim sastavnim elementima.
Poseban se naglasak u predmetnom pretraivanju i oblikovanju sustava za
oznaivanje stavlja na fasetnost zbog jednostavnog pristupa pojedinim fasetama u
raunalnom okruenju. Fasete mogu biti meusobno neovisne ili povezane
preciznim sintaktikim pravilima, dostupne pri predmetnom pretraivanju po bilo
kojem redoslijedu, po hijerarhijskim ili abecednim kriterijima, po obliku,
vremenskom razdoblju ili drugim obiljejima. Primjeri fasetnih sustava su
Klasifikacija s dvotokom, Blissova bibliografska klasifikacija, MeSH, PRECIS i
Tezaurus za umjetnost i arhitekturu.
Klasifikacijski sustavi u online katalozima trebali bi biti pretraivi po
nazivima oznaka, a ne po oznakama samima. Ukoliko se pretraivanje provodi po
samim klasifikacijskim oznakama, valja osigurati dodatne mogunosti pretraivanja,
poput kraenja oznake, prebiranja po hijerarhijskim strukturama i pretraivanje po
svakom, a ne samo po prvom elementu klasifikacijske oznake, to je potrebno
osigurati i pri oblikovanju oznaka. Ove mogunosti danas su rijetko iskoritene, iako
formati MARC to doputaju. Iako ova vrsta pretraivanja ne spada u ono to bi
svakodnevni, usputni korisnik trebao, trebalo bi je omoguiti za potrebe iscrpnih i
temeljitih predmetnih pretraivanja.
Osim samih sustava za oznaivanje i pretraivanje, na pretraivanje posebno
utjee tonost, iscrpnost, specifinost i konzistentnost oznaivanja. Konzistentnost
109

je obrnuto proporcionalna s iscrpnou i specifinou jer visoka razina iscrpnosti ili


visoka razina specifinosti dovode do niske razine konzistentnosti.
U posljednje vrijeme istraivanja sustava za oznaivanje i pretraivanje bave
se sueljem, poboljanjem pretraivanja na temelju prirodnog jezika, ili
hipertekstom, dok se nedovoljno raspravlja o uinkovitosti termina za prikaz
pojmova iz dokumenata ili samih dokumenata. Takva su istraivanja potrebna jer je
u doba kada je nastala veina kontroliranih sustava koja se danas koristi okruenje
uglavnom bilo papirno.
Uporaba prirodnog jezika u predmetnom pretraivanju poveava odziv, ali
smanjuje preciznost, dok je s kontroliranim jezicima obrnuto. Metode i tehnike
pretraivanja poput kraenja, Booleovih i drugih operatora, rangiranja po
relevantnosti i ekspertnih sustava, koje se koriste s nekontroliranim sustavima mogu
djelomino zamijeniti kontrolirane sustave. Prijedlozi da se raunalna obrada
prirodnog jezika iskoristi kao metoda za unapreenje uspjenog predmetnog
pretraivanja temelje se na injenici da rijei u korisnikom upitu pripadaju jeziku te
da kao takve imaju odreena morfoloka ili sintaktika obiljeja, na temelju kojih se
mogu utvrditi i pronalaziti semantike informacije. Stoga postoje tri osnovne razine
raunalne obrade prirodnog jezika, leksika, sintaktika i semantika. No, istraivai
iz podruja raunalne obrade prirodnog jezika danas se vie ili manje bave prvim
dvjema razinama i jo su daleko od semantike razine. Ipak, odreene tehnike iz
ovoga podruja, poput kraenja, ispravljanja pogreaka ili postavljanja upita na
prirodnom jeziku, ve se primjenjuju u WebPAC-ima.
esto poglavlje obrauje interakciju korisnika s katalogom, pri emu je
naglasak na sintaksi postavljanja upita, to obuhvaa razne operatore, oblike
kraenja, oblikovanje upita, prebiranje i rangiranje rezultata. Uobiajeni postupci
rjeavanja problema prirodnog jezika, tj. raznih morfolokih oblika rijei,
sinoniminosti i homoniminosti u jeziku pri predmetnom pretraivanju jesu
kraenje i operatori. Razliiti operatori koriste se ovisno o vrsti upita i o tome je li
naglasak na odzivu ili preciznosti. Najprecizniji je operator blizine i njegove inaice,
a najvei odziv dobiva se operatorom OR. Operatori u online katalozima mogu biti
eksplicitni i implicitni (najee AND i ADJ). Pokazalo se da korisnici imaju velikih
problema s razumijevanjem operatora i nepoznavanjem sintakse oblikovanja upita.

110

Potrebno je oblikovati intuitivne sustave koji e zahtijevati minimalnu obuku


korisnika.
Prije su postojali samo sustavi ije je koritenje zahtijevalo precizan unos
rijei u upitu, jer su vraali samo one rezultate koji u potpunosti odgovaraju upitu.
Druga vrsta sustava koja se danas koristi jesu probabilistiki sustavi, u kojima je
poeljno da dokumenti dobiveni pretraivanjem budu rangirani. Rangiranje prema
procijenjenoj slinosti s upitom omoguava korisniku da sam odlui u kojem
trenutku prestati s pregledavanjem rezultata, jer nema potrebe da ih pregledava sve.
Rangiranje rezultata olakava ponavljanje pretraivanja na temelju povratne
informacije od korisnika, prema onome to korisnik odabere kao relevantne
dokumente, te korisniku omoguava da promijeni dodavanjem ili izbacivanjem
termina iz upita.
U sedmom poglavlju prikazana su pitanja vezana uz oblikovanje suelja
online knjininog kataloga za predmetno pretraivanje, u koja se ubrajaju pitanja
oblikovanja suelja za razliite korisnike, pa tako i pristupanosti i viejezinosti, te
pitanja dizajna i osiguravanja pomoi i uputa.
Korisnik mora imati nadzor nad postupcima koje sustav provodi, to se
posebno odnosi na napredne funkcije WebPAC-a poput algoritma za prevoenje
rijei iz upita na termine kontroliranog sustava, automatskog kraenja ili implicitnih
operatora. Za ispravljanje pogreaka i ujednaavanje pravopisnih varijanti najbolje
je osigurati softvere, i to tako da se temelje na standardima. Treba postojati
mogunost pregleda provedenih pretraivanja, kao i mogunost ponavljanja istih
upita na drugom sustavu. Budui da korisnici ne razumiju razliku izmeu
kontroliranog sustava i kljunih rijei, potrebno je osigurati detaljne upute uz svaku
opciju za predmetno pretraivanje (npr. koja se polja pretrauju po kljunim
rijeima, pri emu valja osigurati pretraivanje po elementima kontroliranih
termina), kako bi korisnici mogli odabrati ono to im najbolje odgovara. Jedno je od
najkorisnijih svojstava koja suelja WebPAC-a mogu pruati jest dodavanje
hiperveza u dobivenim zapisima na ostale zapise koji sadre relevantne predmetne
odrednice, kao i na deskriptore kada se unese nedeskriptor, te na ire, ue i srodne
deskriptore. Posebno oznaivanje traenih pojmova (npr. bojom) u dobivenom
zapisu moe pomoi pri odreivanju relevantnosti dobivene jedinice.

111

Raunalno okruenje omoguava oblikovanje vrlo korisne interaktivne


pomoi i tzv. context-sensitive uputa. Upute je potrebno osigurati kada provedeni
upit nije dao rezultata, kao i o preoblikovanju upita openito. Upute o predmetnom
pretraivanju trebaju obuhvatiti i konceptualne aspekte pretraivanja.
Zbog

velike

raznolikosti

korisnika

dananjem

sve

globalnijem

informacijom okruenju, potrebno je osigurati suelja koja e biti pristupana


svima, neovisno o fizikim, kognitivnim, emocionalnim i kulturolokim
razliitostima, bilo da se oblikuju razliita suelja za razliite razine znanja
korisnika (npr. za osnovno i napredno pretraivanje), ili individualizirana suelja za
svakog korisnika. S obzirom na razliita znanja korisnika, online katalozi vie ili
manje osiguravaju barem dva razliita suelja, jedno s izbornicima, a drugo
komandno. Komandno suelje danas koriste uglavnom knjiniari i informacijski
strunjaci. esto postoje dvije inaice suelja s izbornicima, jedno za poetnike, a
drugo za napredne korisnike. U WebPAC-ima je najea ona inaica suelja s
izbornicima, na kojem postoje kuice za unos rijei (fill-in form). Potrebno je
oblikovati suelja koja e biti pristupana osobama s posebnim potrebama, koje se
pri koritenju raunala i Interneta slue raznim pomonim tehnologijama s
ogranienim mogunostima pregledavanja digitalnih sadraja.
Globalno informacijsko povezivanje i dostupnost kataloga na Mrei, osim
raznolikosti korisnika, trai i osiguravanje viejezinosti. Najjednostavnije je
ostvariti viejezinost suelja, za razliku od prevoenja korisnikog upita na jezik
baze koja se pretrauje, za to je potrebno da suelje omogui obradu upita na vie
od jednoga jezika i pristup viejezinim rjenicima. Uz viejezinost vee se i
problem transliteracije i razliitih standarda koji se u tu svrhu danas koriste u
svijetu.
Dizajn treba osigurati da mogunosti za pretraivanje na zaslonu budu jasne i
da navode korisnike na koritenje funkcija koje e olakati njihovo pretraivanje.
Dobri sustavi mogu biti nefunkcionalni ukoliko im je dizajn lo. U literaturi se,
izmeu ostalog, posebno preporuuje okupljanje srodnih bibliografskih polja,
uporaba punih rijei za nazive polja (a ne kratica) te uporaba laikih naziva polja (a
ne strunih).
U

osmom

poglavlju

obraeni

su

WebPAC-i,

naglaskom

na

eksperimentalne WebPAC-e Okapi i Cheshire II, koji su implementirali


112

najnaprednije funkcije predmetnog pretraivanja. Okapi (Online Keyword Access to


Public Information) se razvija od 1982. godine u Londonu, a obiljeja po kojima se
ubraja u kataloge tree generacije jesu korisniki pristupano grafiko suelje,
mogunost postavljanja upita na prirodnom jeziku, ispravljanje pogreki u pisanju,
uputnice

za

preoblikovanje

sinonime,
upita

koritenje

(automatic

tezaurusa
query

pretraivanju,

expansion

AQE),

automatsko
interaktivno

preoblikovanje upita (interactive query expansion - IQE) i rangiranje rezultata po


relevantnosti. Cheshire II podrava nekoliko tehnika prevoenja termina iz
korisnikog upita na rjenik koriten u bazi podataka, koristi probabilistike tehnike
pronalaenja najboljeg rezultata koje se temelje na algoritmu za koji se pokazalo da
postie izvrsne rezultate u pretraivanju potpunog teksta sustava za informacijskog
pretraivanja.
Mreno okruenje online katalozima omoguava implementaciju mnogih
funkcija koje poboljavaju predmetno pretraivanje, poevi od pristupanijeg
suelja i jednostavnijeg koritenja uz pomo izbornika. Osim korisniki
pristupanog

suelja,

hiperveze

pretraivanje

ine

posebno

fleksibilnim,

omoguavajui odabir termina iz kontroliranog popisa za prebiranje, iz dobivenih


zapisa i sl. Zatim su tu mogunosti zadravanja strategija i rezultata pretraivanja i
kombiniranja pojedinih rezultata, te rangiranje rezultata po relevantnosti. Posebno
su vane mogunosti raunalne obrade prirodnog jezika u predmetnom
pretraivanju, poput kraenja i utvrivanja sinonima, te interaktivno preoblikovanje
upita.
Meutim, istraivanja pokazuju da su dananji WebPAC-i negdje izmeu
prve i druge generacije online kataloga te da vie ili manje nisu uvrstili prednosti
mrenog okruenja i mogunosti koje postoje za predmetno pretraivanje.
WebPAC-i se esto u literaturi usporeuju s web-trailicama, pri emu se
naglaava jednostavnost koritenja web-trailica i upuuje se da bi knjinini
katalozi trebali biti jednako intuitivni. Web-trailice prihvaaju upite na prirodnom
jeziku, temelje se na vieznanoj logici i rangiraju rezultate po vjerojatnoj
relevantnosti. Takoer neke web-trailice podravaju preoblikovanje upita na
temelju dodatnih termina.
U devetom poglavlju opisano je istraivanje svojstava predmetnog
pretraivanja u WebPAC-ima britanskih i hrvatskih sveuilinih knjinica. Pokazalo
113

se da, dok i hrvatski i britanski katalozi podravaju odreena svojstva kataloga tree
generacije, britanski katalozi imaju vie takvih obiljeja. Istraivanjem se nastojalo
ukazati na nedostatke postojeih WebPAC-a u Hrvatskoj i podastrijeti smjernice
oblikovanja obiljeja predmetnog pretraivanja WebPAC-a za potrebe hrvatske
akademske zajednice.

114

Bibliografija
1. Aitchinson, T. M.; Gilchrist, A. Thesaurus construction. 2nd ed. London :
Aslib, 1987. Citirano prema: Rowley, J. The controlled versus natural
indexing languages debate revisited : a perspective on information retrieval
practice and research. // Journal of information science. 20, 2(1994), str.
108-119.
2. Aitchinson, J.; Gilchirst, A.; Bawden, D. Thesaurus construction and use : a
practical manual. 4th ed. London : Aslib, 2000.
3. AltaVista.
http://www.altavista.com (13.02.2003)
4. ANSI/NISO Z39.58-1992 : Common command language for online
interactive information retrieval.
5. Ayres, F. H. Time for change : a new approach to cataloguing concepts. //
Cataloging and classification quarterly. 28, 2(1999), str. 3-16.
6. Ayres, F. H.; Nielsen, L. P. S.; Ridley, M. J. BOPAC2 : a new concept in
OPAC design and bibliographic control. // Cataloging and classification
quarterly. 28, 2(1999), str. 17-44.
7. Babu, B. R.; O'Brien, A. Web OPAC interfaces : an overview. // The
electronic library. 18, 5(2000), str. 316-327.
8. Barbari, A. Javno dostupni knjinini raunalni katalozi nastanak i
razvitak : magistarski rad. Zagreb, 2002.
9. Bates, M. J. Building controlled vocabulary. // 65th ASIS&T SIG/CR
Classification

Research

Workshop,

Philadelphia,

2002.

Biljeke

predavanja.
10. Bates, M. J. The design of browsing and berrypicking techniques for the
online search interface. // Online review. 13, 5(1989a), str. 407-424.
11. Bates, M. J. Rethinking subject cataloging in the online environment. //
Library resources and technical services. 33, 4(1989b), str. 401-412.
12. Bawden, D. Tezaurusi : nova postignua. // Vjesnik bibliotekara Hrvatske.
44, 1-4(2001), str. 182-187.
13. Belkin, N. J.; Oddy, R. N.; Brooks, H. M. ASK for information retrieval :
part I : background and theory. // Journal of documentation, 38, 2(1982), str.
61-71.
115

14. Bibliographic standard GUI icon set. 2001.


http://www.scran.ac.uk/iconstd/ (24.03.2003.)
15. BOPAC2.
http://www.bopac2.comp.brad.ac.uk/~bopac2/ (12.01.2003.)
16. Borgman, C. L. All users of information retrieval systems are not created
equal : an exploration into individual differences. // Information processing
and management. 25, 3(1989), str. 237-251.
17. Borgman, C. L. From Gutenberg to the global information infrastructure :
access to information in the networked world. Cambridge, Mass.; London :
MIT Press, 2000.
18. Borgman, C. L. Why are online catalogs still hard to use? // Journal of the
American Society for Information Science. 47(7), 1996, str. 493-503.
19. Borgman, C. L.; Case, D. O.; Meadow, C. T. The design and evaulation of a
front end user interface for energy researchers. // Journal of the American
Society for Information Science. 40, 1989, str. 86-98. Citirano prema:
Borgman, C. L. Why are online catalogs still hard to use? // Journal of the
American Society for Information Science. 47(7), 1996, str. 493-503.
20. Borgman, C. L.; Hirsh, S. G.; Hiller, J. Rethinking online monitoring
methods for information retrieval systems : from search product to search
process. // Journal of the American Society for Information Science. 47,
1996, str. 568-583.
21. Broughton, V. Klasifikacija za 21. stoljee : naela i struktura Blissove
bibliografske klasifikacije. // Vjesnik bibliotekara Hrvatske. 44, 1-4(2001),
str. 38-51.
22. BUBL information service.
http://bubl.ac.uk/ (24.03.2003.)
23. Butcher, R. Multi-lingual OPAC developments in the British Library. //
Program. 27, 2 (1993), str. 165-171.
24. Buzina, T. Zadaci bibliografskog zapisa prema modelu entitet-odnos. //
Vjesnik bibliotekara Hrvatske. 43, 1-2(2000), str. 30-37.
25. Chan, L. M.; Lin, X.; Zeng, M. L. Structural and multilingual approaches to
subject access on the Web. // IFLA journal. 26, 3(2000), str. 187-197.
26. Chaudiron, S.; Ihadjadene, M.; Role, F. Authorial index browsing in an
XML digital library. // Proceedings of the Seventh International ISKO
116

Conference, 10-13 July 2002, Granada, Spain / edited by Maria J. LopezHuertas. Str. 358-363.
27. Chen, Y.; Lin, S. C.; Chen, S. An application practice of the IFLA FRBR
model : a metadata case study for the National Palace Museum in Taipei. //
Proceedings of the 65th Annual Meeting of the American Society for
Information Science and Technology, Philadelphia, 2002 / editor Elaine G.
Toms. Str. 181-185.
28. Cherry, J. M. Bibliographic displays in OPACs and Web catalogs : how well
do they comply with display guidelines? // Information technology and
libraries. September (1998), str. 124-137.
29. Cherry, J. M.; Williamson, N. J.; Jones-Simmons, C. R.; Gu, X. OPACs in
twelve Canadian academic libraries : an evaluation of functional capabilities
and interface features. // Information technology and libraries. September
(1994), str. 174-195.
30. Cheshire II project home page.
http://cheshire.lib.berkeley.edu/ (23.02.2003.)
31. Chroust, D. Z. Slavic-language material in OCLC and the search for
matching records : reconsidering and overlooked problem. // Slavic and East
European information resources. 1, 4(2001), str. 41-67.
32. Cochrane, P. The future of classification. // 65th ASIS&T SIG/CR
Classification

Research

Workshop,

Philadelphia,

2002.

Biljeke

predavanja.
33. Cousins, S. A. Enhancing subject access to OPACs : controlled vocabulary
versus natural language. // Journal of documentation. 48, 3(1992), str. 291309.
34. Craven, J.; Brophy, P. Non-Visual Access to the Digital Library (NoVA) :
the use of the digital library interfaces by blind and visually impaired people.
http://www.mmu.ac.uk/h-ss/cerlim/projects/nova.html (22.02.2003.)
35. Crawford, W. Starting over : current issues in online catalog user interface
design. // Information technology and libraries. 11, 1(1992), str. 62-76.
36. Cunningham, S. J.; Witten, I. H.; Littin, J. Applications of machine learning
in information retrieval. // Annual review of information science and
technology. 34, 1999, str. 341-384.

117

37. Cutter, C. A. Rules for a dictionary catalog. 4th ed. London : Library
Association, 1948. Citirano prema: Svenonius, E. The intellectual foundation
of information organization. London ; Cambridge, Mass. : The MIT Press,
2001.
38. Dahlberg, I. Naela klasifikacijske strukture : istraivanja, iskustva,
zakljuci. // Vjesnik bibliotekara Hrvatske 44, 1-4(2001), str. 26-37.
39. Danskin, A. UNIMARC, ONIX and the future. // IFLA Council and General
Conference, August 16-25, 2001.
http://www.ifla.org/IV/ifla67/papers/008-188e.pdf (11.10.2002.)
40. DESIRE : Development of a European Service for Information on Research
and Education. 1999.
http://www.lub.lu.se/desire (22.02.2003.)
41. Drabenstott, K. M.; Weller, M. S. Failure analysis of subject searches in a
test of a new design for subject access to online catalogs. // Journal of the
American Society for Information Science. 47, 7(1996a), str. 519-537.
42. Drabenstott, K. M.; Weller, M. S. The exact display approach for online
catalog subject searching. // Information processing and management. 32,
6(1996b), str. 719-745.
43. Dubois, C. P. R. Free text versus controlled vocabulary : a reassessment. //
Online review. 11, 10(1987), str. 243-253. Citirano prema: Rowley, J. The
controlled versus natural indexing languages debate revisited : a perspective
on information retrieval practice and research. // Journal of information
science. 20, 2(1994), str. 108-119.
44. Edwards, K.; Van Mele, I.; Verheust, M.; Spaepen, A. Evaluation of user
interface design to optimize access to library databases for people who are
motor-impaired. // Information technology and libraries. 16, 4(1997), str.
175-180. Citirano prema: Long, C. E. Improving subject searching in Webbased OPACs : evaluation of the problem and guidelines for design. //
Internet searching and indexing : the subject approach / Alan R. Thomas,
James R. Shearer, editors. New York ; London ; Oxford : Haworth
Information Press, 2000. Str. 159-195.
45. Endeavor Information Systems.
http://www.endinfosys.com (23.02.2003.)

118

46. EOS International.


http://www.eosintl.com (23.02.2003.)
47. Fattahi, R. A comparison between the online catalog and the card catalog. //
Library review. 44, 2(1995), str. 44-58.
48. Fidel, R. Writing abstracts for free-text searching. // Journal of
documentation. 42, 1(1986), str. 11-21. Citirano prema: Hjorland, B.;
Nielsen, L. K. Subject access points in electronic retrieval. // Annual review
of information science and technology. 35, 2001, str. 249-298.
49. Foskett, A. C. The subject approach to information. 5th ed. London : Library
Association Publishing, 1997.
50. Francu, V. Language-independent structures and multilingual information
access. // Proceedings of the Seventh International ISKO Conference, 10-13
July 2002, Granada, Spain / edited by Maria J. Lopez-Huertas. Str. 404-411.
51. Functional requirements for bibliographic records : final report / IFLA Study
Group on the Functional Requirements for Bibliographic Records. Mnchen
: K. G. Saur, 1998.
52. Google.
http://www.google.com (20.02.2003)
53. Green, B. ONIX, a new product information standard. // IFLA Council and
General Conference, August 16-25, 2001.
http://www.ifla.org/IV/ifla67/papers/008-188e.pdf (11.10.2002.)
54. Hancock-Beaulieu, M. A comparative transaction log analysis of browsing
and search formulation in online catalogues. // Program. 27, 3(1993), str.
269-280.
55. Hancock-Beaulieu, M. Experiments on interfaces to support query
expansion. // Journal of documentation. 53, 1(1997), str. 8-19.
56. Hancock-Beaulieu, M.; Fieldhouse, M.; Do, T. An evaluation of interactive
query expansion in an online library catalogue with a graphical user
interface. // Journal of documentation. 51, 3(1995), str. 225-243.
57. Hancock-Beaulieu, M. User friendliness and human-computer interaction in
online library catalogs. // Program. 26, 1(1992), str. 29-37.
58. Hancock-Beaulieu, M.; Walker, S. An evaluation of automatic query
expansion in an online library catalog. // Journal of documentation. 48,
4(1992), str. 406-421.
119

59. HighWire Press.


http://www.highwire.org (20.02.2003.)
60. Hildreth, C. R. OPAC research : laying the groundwork for future OPAC
design. // The online catalogue : development and directions / C. R. Hildreth
(ed.). London : The Library Association, 1989. Str. 1-24.
61. Hildreth, C. R. Pursuing the ideal : generations of online catalogs. // Online
catalogs, online reference : converging trends : proceedings of a Library and
Information Technology Association Preconference, June 23-24, 1983, Los
Angeles / edited by Brian Aveney and Brett Butler. Chicago : American
Library Association, 1984. Str. 31-56. Citirano prema: Rasmussen, E. M.
Libraries and bibliographical systems. // Modern information retrieval / ed.
Ricardo Baeza-Yates; Berthier Ribero-Neto. New York : ACM Press, 1999.
Str. 397-414.
62. Hildreth, C. R. The GUI OPAC : approach with caution. // The public access
computer systems review. 6, 5(1995).
http://info.lib.uh.edu/pr/v6/n5/hild6n5.html (12-01-2002).
63. Hildreth, C. R. The use and understanding of keyword searching in a
university online catalog. // Information technology and libraries. June
(1997), str. 52-62.
64. Hjorland, B.; Nielsen, L. K. Subject access points in electronic retrieval. //
Annual review of information science and technology. 35, 2001, str. 249298.
65. Hodges, P. R. Keyword in title indexes. // Special libraries. 74, 1(1983), str.
56-60. Citirano prema: Hjorland, B.; Nielsen, L. K. Subject access points in
electronic retrieval. // Annual review of information science and technology.
35, 2001, str. 249-298.
66. Information retrieval. // Harrod's librarians' glossary and reference book : a
directory of over 9600 terms. 9th ed. Aldershot ; Hants : Gower Publishing
Company, 2000.
67. Innovative Interfaces.
http://www.iii.com (23.02.2003.)
68. IRCAM Multimedia Library.
http://mediatheque.ircam.fr/index-e.html (12.02.2003.)

120

69. ISO 5963-1985 : Documentation methods for examining documents,


determining their subjects, and selecting index terms.
70. Kati, T. Funkcionalni zadaci bibliografskih zapisa i UNIMARC format :
strukturiranje strojno itljivog zapisa za staru knjigu. // Mogunosti suradnje
u okruenje globalne informacijske infrastrukture : zbornik radova / 4.
seminar Arhivi, knjinice, muzeji ; uredile Mirna Willer i Tinka Kati.
Zagreb : Hrvatsko knjiniarsko drutvo, 2001. Str. 81-94.
71. Khoo, C. S. G. Transforming Boolean OPACs to Web search engines. // 65th
IFLA Council and General Conference, Bangkok, August 20-28, 1999.
http://www.ifla.org/IV/ifla65/papers/010-143e.htm (12.12.2002.)
72. Knjinice grada Zagreba.
http://www.kgz.hr (12.02.2003.)
73. Koch, T. Distributed digital library. Privatni razgovor. (16.11.2002.)
74. Koch, T. Quality-controlled subject gateways : definitions, typologies,
empirical overview. 2000.
http://www.lub.lu.se/~traugott/OIR-SBIG.txt (24.03.2003.)
75. Komlodi, A.; Soergel, D. Attorneys interacting with legal information
systems : tools for mental model building and task integration. //
Proceedings of the 65th Annual Meeting of the American Society for
Information Science and Technology, Philadelphia, 2002 / editor Elaine G.
Toms. Str. 152-163.
76. Lancaster, F. W. Vocabulary control for information retrieval. 2nd ed.
Arlington : Information Resources Press, 1986.
77. Large, A.; Beheshti, J. OPACs : a research review. // Library and
information science research. 19, 2(1997), str. 111-133.
78. Larson, R. L. Evaluation of advanced retrieval techniques in an experimental
online catalog. // Journal of the American Society for Information Science.
43, 1(1992), str. 34-53.
79. Larson, R. R.; McDonough, J.; O'Leary, P.; Kuntz, L.; Moon, R. Cheshire II
: design and evaluation of a next-generation online catalog system. 1996.
http://sherlock.berkeley.edu/asis_paper/paper.html (21.02.2003)
80. Le Loarer, P. OPAC : opaque or open, public, accessible and co-operative? :
some developments in natural language processing. // Program. 27, 3(1993),
str. 251-268.
121

81. Lempel, R.; Moran, S. Introducing regulated bias into co-citation ranking
schemes on the Web. // Proceedings of the 65th Annual Meeting of the
American Society for Information Science and Technology, Philadelphia,
2002 / editor Elaine G. Toms. Str. 425-435.
82. Lei, J.; Cvita, M. Sadrajna obrada dokumenata temeljem UDK-a u
raunalnom katalogu Knjinice Hrvatske akademije znanosti i umjetnosti. //
Vjesnik bibliotekara Hrvatske 44, 1-4(2001), str. 96-109.
83. Lewis, D. D. Learning in intelligent information retrieval. // Proceedings of
the 8th International Workshop on Machine Learning, 1991 June, Evanston
IL. San Mateo, Calif. : Morgan Kaufmann, 1991. Str. 235-239. Citirano
prema: Cunningham, Sally Jo; Witten, Ian H.; Littin, James. Applications of
machine learning in information retrieval. // Annual review of information
science and technology. 34, 1999, str. 341-384.
84. Light, R. Online thesauri and information engineering. // UK museums and
the Web, 2001.
http://flood.nhm.ac.uk/mcg/talks/rl/ (06.03.2003.)
85. Lombardo, S. V.; Condic, K. Empowering users with a new online catalog. //
Library hi tech. 18, 2(2000), str. 130-141.
86. Long, C. E. Improving subject searching in Web-based OPACs : evaluation
of the problem and guidelines for design. // Internet searching and indexing :
the subject approach / Alan R. Thomas, James R. Shearer, editors. New York
; London ; Oxford : Haworth Information Press, 2000. Str. 159-195.
87. Lopez-Pujalte, C.; Guerrero, V. P. B.; de Moya-Anegon, F. Evaluation of the
applications of genetic algorithms to relevance feedback. // Proceedings of
the Seventh International ISKO Conference, 10-13 July 2002, Granada,
Spain / edited by Maria J. Lopez-Huertas. Str. 422-428.
88. MARC 21 concise format for classification data. 2002.
http://www.loc.gov/marc/classification/eccdhome.html (12.02.2003.)
89. Marchionini, G. Interfaces for end-user information seeking. // Journal of the
American Society for Information Science. 43, 2(1992), str. 156-163.
90. Marchionini, G. Information seeking in electronic environments. 2nd ed.
New York : Cambridge University Press, 1997. Citirano prema: Caro Castro,
C.; Travieso, R. C. Ariadne's thread : knowledge structures for browsing in

122

OPACs. // Proceedings of the Seventh International ISKO Conference, 10-13


July 2002, Granada, Spain / edited by Maria J. Lopez-Huertas. Str. 437-442.
91. Markey, K.; Atherton, P.; Newton, C. An analysis of controlled vocabulary
and free text search statements in online searches. // Online review. 4,
September (1980), str. 225-236. Citirano prema: Olson, H. A.; Boll, J. J.
Subject analysis in online catalogs. Englewood : Libraries Unlimited, 2001.
92. Markey, K. Subject searching in library catalogs : before and after the
introduction of online catalogs. Dublin, Ohio : OCLC, 1984. Citirano prema:
Cherry, J. M. Bibliographic displays in OPACs and Web catalogs : how well
do the comply with display guidelines? // Information technology and
libraries. September (1998), str. 124-137.
93. Markey, K. Thus spake OPAC user. // Information technology and libraries.
2, 4 (1983), str. 381-87.
94. Matthews, J. R. Time for new OPAC initiatives : an overview of landmarks
in the literature and introduction to WordFocus. // Library hi tech. 15, 12(1997), str. 111-122.
95. McIllwaine, I. C. Prilagodba UDK-a mrenom svijetu. // Vjesnik
bibliotekara Hrvatske 44, 1-4(2001), str. 52-67.
96. Mikai, M. Teorijske osnove sustava za izradbu predmetnog kataloga :
doktorska disertacija. Zagreb, 1990.
97. Mikai, M. Teorijske osnove sustava za predmetno oznaivanje. Zagreb :
Hrvatsko bibliotekarsko drutvo, 1996.
98. Mitev, N. N.; Venner, G. M.; Walker, S. Designing an online public access
catalogue : Okapi, a catalogue on a local area network. // Library and
information report 39. London : The British Library, 1985.
99. NLM LocatorPlus help, tutorials and FAQs.
http://locatorplus.gov/help.html (15.03.2003.)
100.

O'Brien, A. Online catalogs : enhancements and developments. //

Annual review of information science and technology. 29, 1994, str. 219241.
101.

Okapi-Pack. 2001.
http://www.soi.city.ac.uk/~andym/Okapi-PACK/index.html
(23.02.2003.)

123

102.

Olson, H. A.; Boll, J. J. Subject analysis in online catalogs.

Englewood : Libraries Unlimited, 2001.


103.

OMNI : the UK's gateway to high quality Internet resources in health

and medicine.
http://omni.ac.uk/ (24.03.2003.)
104.

Onion Patch(sm) : New Age OPACs, innovative public access

systems. 2000.
http://www.public.iastate.edu/~CYBERSTACKS/Onion.htm (21.02.2003.)
105.

Online Public Access Catalog. // Harrod's librarians' glossary and

reference book : a directory of over 9600 terms. 9th ed. Aldershot ; Hants:
Gower Publishing Company, 2000.
106.

Oritz-Repiso, V.; Moscoso, P. Web-based OPACs : between tradition

and innovation. // Information technology and libraries. 18, 2(1999).


http://www.lita.org/ital/1802_moscoso.html (12.03.2002.)
107.

Pavlinui, D. NN : pretraiva za hrvatski jezik. 2002.

http://nn.rot13.org/~dpavlin/nn.html. (15.02.2003.)
108.

Peters, T. A.; Kurth, M. Controlled and uncontrolled vocabulary

searching in an academic library online catalog. // Information technology


and libraries. 27, 1991, str. 201-211.
109.

Pinto, M.; Lancaster, F. W. Abstracts and abstracting in knowledge

discovery. // Library trends. 48, 1(1999), str. 234-248.


110.

Prirunik za UNIMARC : bibliografski format. 2. hrv. izd. Zagreb :

Nacionalna i sveuilina knjinica ; Hrvatsko knjiniarsko drutvo, 1999.


111.

Pu, H.-T. Discovery of user-oriented class associations for enriching

library classification schemes. // Proceedings of the 65th Annual Meeting of


the

American

Society

for

Information

Science

and

Technology,

Philadelphia, 2002 / editor Elaine G. Toms. Str. 194-205.


112.

Rasmussen, E. M. Libraries and bibliographical systems. // Modern

information retrieval / ed. Ricardo Baeza-Yates ; Berthier Ribero-Neto. New


York : ACM Press, 1999. Str. 397-414.
113.

Riesthuis, G. J. A.; Zumer, M. The functional requirements for

bibliographic records and knowledge organization. // Proceedings of the


Seventh International ISKO Conference, 10-13 July 2002, Granada, Spain /
edited by Maria J. Lopez-Huertas. Str. 165-172.
124

114.

Rowley, J. The controlled versus natural indexing languages debate

revisited : a perspective on information retrieval practice and research. //


Journal of information science. 20, 2(1994), str. 108-119.
115.

Scott, P. LIBDEX : the library index.


http://www.libdex.com/ (16-02-2003)

116.

Seal, A. The development of online catalogs. // Introducing the online

catalogue / edited by Alan Seal. Bath : Centre for Catalogue Research, Bath
University Library, 1984. Str. 54-57. Citirano prema: O'Brien, A. Online
catalogs : enhancements and developments. // Annual review of information
science and technology. 29, 1994, str. 219-241.
117.

Slavi, A. Automatsko predmetno oznaivanje : od raunalno

potpomognutog predmetnog oznaivanja do znalakih sustava. // Predmetna


obrada : ishodita i smjernice : zbornik radova / uredile Jadranka LasiLazi, Jelica Lei, Jasna Petric. Zagreb : Hrvatsko knjiniarsko drutvo,
1998. Str. 98-115.
118.

Slavi, A.; Turkulin, B. Predgovor. // Vjesnik bibliotekara Hrvatske.

44, 1-4(2001). Str. xix-xxii.


119.

Slone, D. J. Encounters with OPAC : on-line searching in public

libraries. // Journal of the American Society for Information Science. 51,


8(2000), str. 757-773.
120.

Smeaton, A. F. Information retrieval : still butting heads with natural

language processing? 1997.


http://www.math.utah.edu/pub/tex/bib/lncs1997a.ps.gz (20.12.2002.)
121.

SOSIG : social science information gateways.


http://www.sosig.ac.uk/ (24.03.2003.)

122.

Svenonius,

E.

The

intellectual

foundation

of

information

organization. Cambridge, Mass. ; London : MIT Press, 2000.


123.

Tenopir, C; Ro, J. S. Full text databases. New York : Greenwood

Press, 1990. Citirano prema: Hjorland, B.; Nielsen, L. K. Subject access


points in electronic retrieval. // Annual review of information science and
technology. 35, 2001, str. 249-298.
124.

Text Retreival Conference (TREC).


http://trec.nist.gov. (23.01.2003.)

125.

Thomson ISI.
125

http://www.isinet.com (23.01.2003.)
126.

Tversky, A.; Kahneman, D. Judgments under uncertainty : heuristics

and biases. // Science. 185(1974), str. 1124-1131. Citirano prema: Borgman,


C. L. Why are online catalogs still hard to use? // Journal of the American
Society for Information Science. 47(7), 1996, str. 493-503.
127.

Vickery, B.; Vickery, A. Online search interface design. // Journal of

documentation. 49, 2 (1993), str. 103-187.


128.

Vizine-Goetz, D. Online classification : implications for classifying

and document[-like object] retrieval. // Knowledge organization and change :


proceedings of the 4th International ISKO Conference, 15-18 July 1996,
Washington, D.C., / Rebecca Green, ed. Frankfurt: INDEKS Verlag.
Dostupno na: http://staff.oclc.org/~vizine/isko/dvgisko.htm (12.01.2003.)
129.

Voorbij, H. J. Title keywords and subject descriptors : a comparison

of subject search entries of books in the humanities and social sciences. //


Journal of documentation. 54, 4(1998), str. 466-476. Citirano prema:
Hjorland, B.; Nielsen, L. K. Subject access points in electronic retrieval. //
Annual review of information science and technology. 35, 2001, str. 249298.
130.

Wasylenko, L. W. Oh say, can we see? See also? Subject referencing

possibilities in OPACs : highlights of the ALCTS CCS Subject Analysis


Committee program. // Library collections, acquisitions, and technical
services. 24, 2000, str. 267-350.
131.

Web Content Accessibility Guidelines 1.0 : W3C recommendation 5-

May-1999.
http://www.w3.org/TR/WCAG10/ (19.01.2002.).
132.

Wilkes, A.; Nelson, A. Subject searching in two online catalogs :

authority control vs. non-authority control. // Cataloging and classification


quarterly. 20, 4(1995), str. 57-79.
133.

Willer, M. Formati i katalona pravila : katalogiziranje elektronike

grae. // Vjesnik bibliotekara Hrvatske. 43, 1-2(2000), str. 9-22.


134.

Yahoo!
http://www.yahoo.com/ (20.01.2003.)

126

135.

Yee, M. M. System design and cataloging meet the user : user

interfaces to online public access catalogs. // Journal of the American


Society for Information Science. 42, 2(1991), str. 78-89.
136.

Zumer, M.; Zeng, L. Comparison and evaluation of OPAC end-user

interfaces. // Cataloging and classification quarterly. 19, 2 (1994), str. 67-98.

127

Saetak
Polazita su ovome radu dosadanja istraivanja, problemi i spoznaje koje upuuju
na to da se korisnici knjininih kataloga najee oslanjaju na predmetna
pretraivanja, odnosno kljune rijei, pojmove iz predmetnih sustava i tezaurusa, a
da su takva pretraivanja, sa stajalita zadovoljstva korisnika dobivenim rezultatima,
nedovoljno uspjena. Iako svojstva WebPAC-a (Web-based Online Public Access
Catalogs knjinini katalozi s web-sueljem), koji pripadaju tzv. treoj generaciji
online knjininih kataloga, obuhvaaju velike mogunosti pretraivanja, te su
mogunosti danas uglavnom neiskoritene pa se korisnici i nadalje, unato stalnom
unaprjeivanju sustava za predmetno pretraivanje, susreu s mnogim problemima,
kao to su problemi vezani uz vjetinu prevoenja zahtjeva odnosno misaonih
koncepata pojedinca na jezik kataloga, sustave upuivanja koji se za njih prireuju i
sl.
Predmetni pristup u online knjininim katalozima moe se osigurati putem
razliitih pristupnica. U tu svrhu rabe se tzv. prirodni i umjetni jezici za oznaivanje,
a svaki meu njima ima odreene prednosti i nedostatke. Oznaivanje prirodnim
jezikom obavlja se raunalom, tako da se iz odreenih polja bibliografskog zapisa
automatski preuzimaju sve rijei. Kontrolirani jezici za oznaivanje indeksni su
jezici u kojima odabir i pridruivanje pojmova dokumentima nadzire ovjek. To
mogu biti klasifikacijski sustavi, tezaurusi, popisi predmetnih odrednica i drugi
predmetni sustavi. Tijekom 1970-ih godina ope je prihvaeno miljenje da se
najbolje pretraivanje postie usporednim koritenjem jezika za oznaivanje. Osim
jezika za pretraivanje, potrebno je poznavati ponaanje korisnika pri pretraivanju,
a pri oblikovanju suelja za pretraivanje uzeti u obzir znanje i vjetine korisnika,
osigurati upute, pomo i povratnu informaciju na svakom koraku tijekom
pretraivanja.
Cilj istraivanja bio je utvrditi raznolikost i kvalitetu predmetnog pristupa
informacijama u WebPAC-ima britanskih sveuilinih knjinica, od mogunosti
pretraivanja po rijeima, odnosno oznakama, prirodnog i kontroliranog jezika,
mogunosti prebiranja (browsing) do oblikovanja jednostavnih i sloenih upita kako
bi se zakljuilo o dosadanjim postignuima, ponuenim modelima i koritenim
metodama, te provela usporedna analiza na WebPAC-ima hrvatskih sveuilinih
knjinica.
128

Kljune rijei: britanske sveuiline knjinice, hrvatske sveuiline knjinice,


korisniko suelje, online knjinini katalozi, ponaanje korisnika pri pretraivanju,
predmetne pristupnice, predmetno pretraivanje, sustavi za oznaivanje i
pretraivanje, WebPAC-i.

129

Summary
Title: Subject retrieval in web-based library catalogs
This thesis has been motivated by past research, problems and realizations that
online library catalog users frequently perform subject searches using keywords,
subject headings and descriptors and these searches have yielded unsatisfactory
results. Web-based catalogs or WebPACs (Web-based Online Public Access
Catalogs), belonging to the so-called third generation of online catalogs and
providing a wide variety of search options, remain largely underutilized despite the
continuous advancement of information retrieval systems. Users still encounter a
number of problems, such as those related to translating their concepts to the
language of the catalogs system and cross-references prepared to this purpose.
Subject access in online library catalogs can be provided through different
access points. To that purpose natural and controlled indexing and retrieval
languages are used, and each among them has its advantages and downsides.
Natural language indexing is performed by the computer, in which process words
from defined fields are automatically extracted. Controlled indexing languages are
those in which selection of terms to be assigned to documents is manually
performed. These are, for example, classification systems, subject heading
languages and thesauri. During the 1970s, a consensus was reached that the best
retrieval results are gained when using both types of indexing languages
simultaneously. Apart from indexing languages, it is necessary to take into account
user search behavior; and while designing user interface one has to allow for the
users skills and knowledge - ensuring instruction, help and feedback information at
every step of the retrieval process.
The aim of the research was to determine the variety and quality of subject
access to information in WebPACs of British university libraries, including
searching by words or classification marks, natural and controlled languages,
browsing options, and forming simple and complex queries in order to conclude
about existing advancements, offered models and employed methods and compare
them to WebPACs of Croatian university libraries.

130

Keywords: British university libraries, Croatian university libraries, indexing and


retrieval systems, online library catalogs, subject access points, subject retrieval,
user interface, user search behavior, WebPACs

131

ivotopis
Roena sam 1975. godine u akovcu. U rodnom gradu zavravam osnovnu i
srednju kolu. Godine 1994. upisujem studij engleskog jezika s knjievnou i
informatolgije. Studij uspjeno privodim kraju obranom diplomske radnje iz
podruja sintakse engleskoga jezika u srpnju 2000. godine.
Od 1999. do 2001. radim kao knjiniar katalogizator u Nacionalnoj i
sveuilinoj knjinici.
Godine 2000. upisujem poslijediplomski studij informacijskih znanosti
smjer bibliotekarstvo.
Od veljae 2001. godine radim kao znanstvena novakinja na Katedri za
bibliotekarstvo Odsjeka za informacijske znanosti Filozofskog fakulteta u Zagrebu.
U sklopu studija bibliotekarstva vodim Vjebe iz Sustava za oznaivanje i
pretraivanje.

132

Prilog 1. Popis knjinica i URL-a njihovih kataloga


obuhvaenih istraivanjem

133

a) engleske knjinice i katalozi


1. Aston University Learning and Information Services
http://library.aston.ac.uk/
2. Bournemouth University Library
http://talis.bournemouth.ac.uk/www-bin/www_talis32
3. Brunel University Library
http://library.brunel.ac.uk:8080/uhtbin/webcat
4. Cambridge University Library
http://newton.lib.cam.ac.uk:7703/
5. Coventry University Library
http://libwww.coventry.ac.uk:8000/
6. Durham University Library
http://library.dur.ac.uk/
7. John Rylands University Library of Manchester
http://rylibweb.man.ac.uk/catalogue/
8. Keele University Information Services
http://opac.keele.ac.uk/
9. Kingston University Library
http://opac.kingston.ac.uk/www-bin/www_talis32
10. Lancaster University Library
http://cat.lib.lancs.ac.uk/
11. Leeds University Library
http://lib.leeds.ac.uk/
12. London Guildhall University Library
http://library.lgu.ac.uk/search
13. Loughborough University Library
http://opac.lboro.ac.uk/
14. Manchester Metropolitan University Library
http://opac.library.mmu.ac.uk/talis
15. Middlesex
University
Library
and
Information
http://www.ilrs.mdx.ac.uk/lib/index.htm (knjinini URL)
16. Newcastle University Library
http://fulltext.ncl.ac.uk:8000/

134

Services

17. Oxford University Libraries


http://library.ox.ac.uk/
18. Reading University Library
http://vlsirsi.rdg.ac.uk/uhtbin/cgisirsi/9OocMm7O3x/0/57/49
19. South Bank University Library
http://136.148.1.170/webclient.html
20. Staffordshire University Library and Learning Resources Services
http://thomlib052.staffs.ac.uk/ipac-cgi/ipac.exe
21. University College London Library Services
http://library.ucl.ac.uk/
22. University of Bath Library and Learning Centre
http://www.bath.ac.uk/library/webcat/
23. University of Bradford Learning Support Services
http://www.brad.ac.uk/library/news/catalogue.php
24. University of Bristol Information Services
http://www.lib.bris.ac.uk/ALEPH
25. University of East Anglia Library
http://www.lib.uea.ac.uk/ (knjinini URL)
26. University of Exeter Library and Information Service
http://lib.ex.ac.uk/
27. University of Hertfordshire Learning and Information Services
http://voyager.herts.ac.uk/cgi-bin/Pwebrecon.cgi?DB=local&PAGE=First
28. University of Huddersfield Computing and Library Services
http://webcat.hud.ac.uk/
29. University of Hull Library
http://library.hull.ac.uk/
30. University of Kent at Canterbury - Templeman Library
http://opac.ukc.ac.uk/cgi-bin/Pwebrecon.cgi?DB=local&PAGE=First
31. University of Leicester Library
http://library.le.ac.uk/uhtbin/cgisirsi/F9AIXsRfGM/41930101/60/58/X
32. University of Liverpool Library
http://library.liv.ac.uk/
33. University of London Library
http://193.63.81.240/search~b1o1c1i1r1/

135

34. University of Nottingham Library


http://aleph.nottingham.ac.uk:4505/ALEPH
35. University of Sheffield Library
http://library.shef.ac.uk/www-bin/www_talis32?
36. University of Southampton Library
http://www-lib.soton.ac.uk/
37. University of Sunderland Information Services
http://webcatalogue.sunderland.ac.uk/
38. University of Sussex Library
http://catalogue.sussex.ac.uk/home
39. University of Warwick Library
http://opac.warwick.ac.uk/www-bin/www_talis32
40. University of York Library
http://libcat0.york.ac.uk/F

b) hrvatske knjinice i katalozi


1. Gradska i sveuilina knjinica Osijek
http://baza.gskos.hr/anew/asearch.html
2. Nacionalna i sveuilina knjinica
http://www.nsk.hr/opac-crolist/uvod.html
3. Sveuilina knjinica Rijeka
http://161.53.149.10/
4. Sveuilina knjinica u Splitu
http://libar.svkst.hr/anew/asearch.html

136

Prilog 2. Upitnik

137

I. Openita pitanja o suelju


1. Postoje li dva ili vie suelja s razliitim mogunostima predmetnog pretraivanja
(vrste pristupnica, nain postavljanja upita) namijenjenih razliitim znanjima i
vjetinama korisnika?
2. Postoje li na poetnoj stranici za pretraivanje obje mogunosti pretraivanja, i po
kljunim rijeima i po predmetnim odrednicama?
II. Prebiranje
3. Postoji li mogunost prebiranja po deskriptorima iz tezaurusa?
3.1. kojeg tezaurusa?
3.2. postoje li hiperveze na bibliografske zapise koji sadre odabrane
deskriptore?
4. Postoji li mogunost prebiranja po rijeima iz popisa predmetnih odrednica?
4.1. kojeg sustava predmetnih odrednica?
4.2. postoje li hiperveze na bibliografske zapise koji sadre odabrane
predmetne odrednice?
5. Postoji li mogunost prebiranja po oznakama klasifikacijskog sustava?
5.1. kojeg klasifikacijskog sustava?
5.2. postoje li hiperveze na bibliografske zapise koji sadre odabrane
oznake?
6. Postoji li mogunost prebiranja po signaturama?
6.1. na kojem se sustavu temelje signature?
6.2. postoje li hiperveze na bibliografske zapise koji sadre odabrane
signature?
7. Postoji li mogunost prebiranja po drugim poljima?
7.1. po kojim poljima?
7.2. postoje li hiperveze na bibliografske zapise koji sadre odabrane
termine?
III. Oblikovanje upita
8. Postoji li mogunost pretraivanja po deskriptorima iz tezaurusa?
8.1. kojeg tezaurusa?
8.2. prikazuje li se dio tezaurusa u kojem se nalazi deskriptor iz upita?
9. Postoji li mogunost pretraivanja po rijeima iz popisa predmetnih odrednica?
9.1. kojeg sustava predmetnih odrednica?
9.2. prikazuje li se dio popisa predmetnih odrednica u kojem se nalaze rijei
iz upita nakon izvrenja upita?

138

10. Postoji li mogunost pretraivanja po oznakama klasifikacijskog sustava?


10.1. kojeg klasifikacijskog sustava?
10.2. prikazuje li se dio klasifikacijskog sustava u kojem se nalazi oznaka iz
upita?
11. Postoji li mogunost pretraivanja po signaturama?
12. Postoji li mogunost pretraivanja po kljunim rijeima?
12.1. koja su polja ponuena na izbor?
13. Postoji li mogunost istodobnog, kombiniranog pretraivanja po razliitim
poljima?
14. Postoji li mogunost prebiranja ili pretraivanja po integriranim kontroliranim
rjenicima ako se u katalogu koristi vie od jednog kontroliranog rjenika?
IV. Sintaksa
15. Postoji li mogunost koritenja operatora u oblikovanju upita?
15.1. kojih operatora?
15.2. o emu ovisi slijed izvoenja operacija?
16. Koristi li se implicitni operator ili sustav rijei iz upita razumijeva kao izraz?
16.1. koji operator ili izraz?
17. Postoji li mogunost pretraivanja po izrazu?
17.1. kako se odreuje da se pretrauje po izrazu?
18. Postoji li mogunost kraenja?
18.1. koje vrste?
V. Rezultati pretraivanja
19. Sadre li dobiveni zapisi hiperveze s predmetnim odrednicama na ostale zapise s
istim predmetnim odrednicama?
20. Jesu li rijei iz korisnikovog upita posebno istaknute u dobivenim zapisima?
21. Postoji li mogunost proirivanja i suavanja rezultata dodavanjem novih
termina bez ponovnog upisivanja itavog upita?
22. Prikazuje li sustav rezultate prethodnih pretraivanja?
23. Prikazuje li sustav tijek prethodnih pretraivanja?
24. Postoji li mogunost ograniavanja rezultata?
24.1. po kojim kriterijima?
25. Postoji li mogunost sortiranja rezultata?
25.1. po kojim kriterijima?

139

Prilog 3. Primjeri naprednih svojstava predmetnog


pretraivanja u WebPAC-ima

140

Primjer 1. Lanano kazalo u WebPAC-u.

141

Primjer 2. Istodobno prebiranje po popisima predmetnih odrednica LCSH i


MeSH.

142

Primjer 3. Pronalaenje rijei iz naslova koritenjem automatskog kraenja.

143

Primjer 4. Hipertekstualna povezanost podataka iz zapisa s ostalim zapisima


koji sadre iste podatke.

144

Primjer 5. Pregled prethodno provedenih pretraivanja.

145

Primjer 6. Nakon to katalog nije pronaao traenu rije u naslovu, dobiva se


hipertekstualni popis slinih rijei.

146

Primjer 7. Filtriranje dobivenog skupa rezultata na temelju razliitih kriterija.

147

Primjer 8. Sortiranje rezultata po razliitim kriterijima.

148

Primjer 9. Razraene mogunosti pretraivanja i prebiranja MeSH-a.

149

Primjer 10. Razraeni sustav uputnica i ostalih informacija o jednom


deskriptoru u MeSH-u.

150

Prilog 4. Prijedlog smjernica za osiguravanje mogunosti


predmetnog pretraivanja u knjininim katalozima
visokokolskih knjinica s web-sueljem

151

Vrste i obiljeja predmetnih pristupnica


1. Osigurati mogunost pretraivanja i prebiranja po svakom polju iz zapisa.
2. Osigurati mogunost pretraivanja po pojedinim rijeima iz svakog polja u
zapisu.
3. Osigurati mogunost istodobnog pretraivanja i prebiranja po svim
postojeim poljima i po pojedinim rijeima iz svakog polja u zapisu.
4. Osigurati mogunost pretraivanja i prebiranja po predmetnim odrednicama
i rijeima iz predmetnih odrednica.
5. Osigurati mogunost pretraivanja i prebiranja po klasifikacijskim oznakama
i pojedinim elementima klasifikacijske oznake, uz prikaz njihovih naziva
(opisa).
6. Osigurati

mogunost

pretraivanja

prebiranja

po

prijevodima

klasifikacijskih oznaka.
7. Osigurati mogunost pretraivanja i prebiranja po signaturi.
8. Osigurati mogunost istodobnog pretraivanja i prebiranja po svim popisima
predmetnih odrednica koji se koriste u knjinici.
9. Pri oznaivanju predmetnim odrednicama ili deskriptorima, potrebno je
napraviti razliku izmeu glavnih i sporednih predmetnih odrednica, kako bi
se sauvala mogunost pristupa po glavnom predmetu, a ne bi se
onemoguio pristup po sporednim predmetima.
10. Osigurati

mogunost

istodobnog

pretraivanja

prebiranja

po

klasifikacijskim sustavima koji se koriste u knjinici.


11. Osigurati povezivanje kontroliranih sustava i mogunost integriranog
pretraivanja i prebiranja po kontroliranim sustavima koji se koriste u
knjinici, ukljuujui signature.
12. Koristiti kontrolirane sustave koji se temelje na fasetama i meu terminima
odnosno oznakama imaju izgraene odnose svojstvene tezaurusima.
13. U kontroliranim sustavima prebiranje valja omoguiti i po hijerarhijskim
odnosima. U klasifikacijskom sustavu treba imati mogunost odlaska s
glavnih skupina na podskupine do najue oznake, s pridruenim prijevodima
oznaka, kao i u obrnutom smjeru.

152

14. Koristan bi bio ekspertni sustav koji bi automatski za sintetiziranu signaturu


pokazao sve hijerarhijske popise za pojedine elemente signature.
15. Za kontrolirane sustave osigurati datoteku predmetnih preglednih katalonih
jedinica i uputnica, povezanu s bibliografskom datotekom.
16. Pri pretraivanju pomou sloenog upita po rijeima iz termina ili po
dijelovima oznaka kontroliranih sustava, potrebno je omoguiti prikaz
pojedinanih termina odnosno oznaka s pripadajuim prijevodima, zajedno s
brojem bibliografskih zapisa uz svaki pojedinaan termin ili oznaku.
17. Ako pretraivanje poinje s rijeju, sustav bi trebao prikazati i popis
predmetnih odrednica i klasifikacijske tablice i tezaurus, ostavljajui
korisniku da sam napravi izbor.
18. Predmetno

pretraivanje

pospjeiti

obogaivanjem

zapisa

dodatnim

predmetnim pristupnicama poput saetka iz online knjiara i nakladnikih


kua.
19. Bez obzira na to na kojem se stadiju pretraivanja nalazi, korisnik uvijek
treba biti u mogunosti ograniiti pretraivanje po godini, jeziku, zemlji
izdavanja i ostalim vanim kriterijima.
20. Potrebno je implementirati algoritme za raunalnu obradu prirodnog jezika
koji na temelju morfolokih ili sintaktikih obiljeja rijei iz upita
omoguuju pronalaenje semantiki relevantnih jedinica grae. U tom
sluaju osigurati uputu o tome kako sustav obrauje upit.
21. Za ispravljanje pogreaka u pisanju i ujednaavanje pravopisnih varijanti
potrebno je implementirati softver, koji e korisnika uputiti na ispravnu
odnosno koritenu varijantu, ili e se automatski provesti pretraivanje, pri
emu treba osigurati uputu o provedenom postupku.
22. Ukoliko postoji mogunost pretraivanja po potpunom tekstu jedinica grae,
primjenjivati tehnike citatnog oznaivanja i pretraivanja.
23. Ukoliko katalog obuhvaa digitalne netekstualne jedinice grae poput slika,
glazbenih melodija, kemijskih formula i geografskih koordinata, osigurati
mogunost predmetnog pretraivanja i ovih vrsta grae.

153

Rezultati pretraivanja
24. Potrebno je osigurati rangiran prikaz rezultata pretraivanja, i to po
relevantnosti, po godini odnosno datumu izdavanja ili nastanka, abecedno po
autoru, abecedno po naslovu i po ostalim vanim kriterijima.
25. Termine ili oznake kontroliranih rjenika u dobivenim zapisima potrebno je
hipertekstualno povezati s ostalim zapisima koji sadre iste termine ili
oznake.
26. Ukoliko traeni termin ili oznaka ne postoji, rezultat pretraivanja treba biti
ispis najbliih termina ili oznaka u abecednoj i hijerarhijskoj strukturi, s
pojanjenjem toga rezultata.
27. Traene rijei, termine ili oznake iz upita u dobivenim zapisima treba
istaknuti.
28. Potrebno je uspostaviti mehanizme za povratnu informaciju o relevantnosti
dobivenih jedinica grae radi preoblikovanja upita.
29. Nakon dobivenog skupa rezultata, potrebno je ponuditi hipertekstualni popis
kontroliranih termina ili prijevode oznaka koji odgovaraju rijeima iz upita, i
to iz svih kontroliranih sustava koji se koriste u knjinici.
30. Potrebno je osigurati mogunost pregledavanja prolih pretraivanja.
31. Potrebno je osigurati mogunost iskoritavanja dijelova prolih pretraivanja
pri oblikovanju novog upita.

Sintaksa predmetnog pretraivanja


32. Potrebno je osigurati mogunost kraenja, i to implicitnog, ali tako da se
moe iskljuiti, te eksplicitnog. Ovo vrijedi i za termine kontroliranog
sustava, i prirodnog jezika.
33. Potrebno je osigurati koritenje Booleovih operatora i operatora blizine, i to
implicitnih, ali tako da se mogu promijeniti, te eksplicitnih. Ovo vrijedi i za
termine kontroliranog sustava, i prirodnog jezika.

154

Suelje
34. Potrebno je osigurati barem dvije vrste suelja, jedno za poetnike, a drugo
za napredne korisnike i informacijske strunjake. Na naprednom suelju
potrebno je osigurati razraene mogunosti pretraivanja, a na poetnikom
one najvanije i najjednostavnije.
35. Potrebno je oblikovati individualizirana suelja prilagoena potrebama
svakog korisnika.
36. Potrebno

je

osigurati

viejezina

suelja

osigurati

mehanizam

prepoznavanja domene za dravu iz koje korisnik pristupa katalogu te


automatskog prikazivanja suelja na jeziku te drave.
37. Poeljno je osigurati i mogunost prevoenja korisnikog upita na jezik baze
koja se pretrauje.
38. Potrebno je koristiti meunarodni standard za kodiranje znakova Unicode
ISO/IEC 10646.
39. Suelje WebPAC-a potrebno je oblikovati na nain da bude pristupano
osobama s posebnim potrebama i osobama koji koriste starije tehnologije.

Pomo i upute
40. Potrebno je osigurati pomo pri predmetnom pretraivanju, i to s
konceptualnim aspektima pretraivanja, poput prevoenja korisnikovih
pojmova na termine koritene u katalogu, semantikim, poput odabira
najprikladnijih mogunosti, kao i s tehnikim aspektima pretraivanja, poput
sintakse upita.
41. Upute je potrebno osigurati pri svakom koraku u pretraivanju (tzv.
kontekstualne upute). Potrebno je osigurati i pomo koja se poziva na
zahtjev.
42. Potrebno je osigurati upute o tome kada je poeljna koja vrsta pretraivanja,
a uz svaku opciju pretraivanja treba stajati uputa.
43. Upute uz pojedine mogunosti pretraivanja trebaju jasno opisati koja se
vrsta pretraivanja provodi.
155

44. Upute je potrebno osigurati kada na upit nema odgovora, bilo da se korisnik
usmjeri openito na to kako oblikovati upit, ili kako preoblikovati postojei
upit.
45. Upute je potrebno osigurati i ako na upit postoji odreen broj odgovora, jer
dobiveni zapisi moda ne zadovoljavaju korisnikove informacijske potrebe.
46. Upute trebaju biti detaljne, precizne, jasne i na laikom jeziku.

156

Sadraj
Uvod ................................................................................................................. 1

1. Osnovne pretpostavke predmetnog pretraivanja u online knjininim


katalozima......................................................................................................... 7
1.1. Predmetno pretraivanje kao zadaa knjininog kataloga................... 7
1.2. Organizacija i struktura baze podataka.................................................. 9
2. Razvoj i pristupi problematici predmetnog pretraivanja online knjininih
kataloga........................................................................................................... 13
2.1. Prednosti i nedostaci online kataloga u odnosu na kataloge na listiima
u predmetnom pretraivanju ....................................................................... 13
2.2. Razvoj predmetnog pretraivanja u online katalozima ....................... 14
3. Pristupi problematici predmetnog pretraivanja u online katalozima........ 17

4. Problematika korisnikih pristupa pri predmetnom pretraivanju............. 22

5. Predmetni pristup informacijama u online knjininim katalozima .......... 29


5.1. Vrste predmetnih pristupnica............................................................... 29
5.2. Vrste sustava za oznaivanje i pretraivanje ....................................... 32
5.2.1. Podjela sustava za oznaivanje i pretraivanje prema prethodnom i
naknadnom oznaivanju.......................................................................... 35
5.3. Kontrolirani sustavi u predmetnom pretraivanju ............................... 36
5.3.1. Klasifikacijski sustavi ................................................................... 40
5.3.2. Popisi predmetnih odrednica......................................................... 47
5.3.3. Oznaivanje na temelju kontroliranih sustava .............................. 49
157

5.3.3.1. Automatizacija oznaivanja na temelju kontroliranih sustava51


5.4. Prirodni sustavi u predmetnom pretraivanju...................................... 52
5.5. Prirodni sustavi naspram kontroliranih i mogunosti pretraivanja.... 54
5.6. Raunalna obrada prirodnog jezika u predmetnom pretraivanju....... 58
6. Provoenje predmetnog pretraivanja........................................................ 65
6.1. Operatori .............................................................................................. 65
6.2. Kraenje ............................................................................................... 67
6.3. Oblikovanje upita................................................................................. 69
6.4. Rangiranje i prikaz rezultata................................................................ 71
7. Korisniko suelje za predmetno pretraivanje ......................................... 74
7.1. Oblikovanje suelja za predmetno pretraivanje................................. 74
7.2. Pomo i upute ...................................................................................... 77
7.3. Vrste korisnikih suelja...................................................................... 78
7.4. Viejezinost........................................................................................ 80
7.5. Pristupanost suelja WebPAC-a ........................................................ 82
7.6. Dizajn suelja....................................................................................... 83
8. Online katalozi tree generacije - WebPAC-i ............................................ 85
8.1. Okapi.................................................................................................... 85
8.2. Chesire II ............................................................................................. 88
8.3. WebPAC-i danas ................................................................................. 89
9. Istraivanje WebPAC-a britanskih i hrvatskih sveuilinih knjinica ....... 92
9.1. Uvod u istraivanje .............................................................................. 92
9.2. Uzorak istraivanja .............................................................................. 92
9.3. Metodologija istraivanja .................................................................... 93
9.4. Analiza rezultata .................................................................................. 94
9.4.1. Openita pitanja o suelju ............................................................. 94
158

9.4.2. Prebiranje ...................................................................................... 94


9.4.3. Oblikovanje upita.......................................................................... 96
9.4.4. Sintaksa ......................................................................................... 98
9.4.5. Rezultati pretraivanja ................................................................ 100
9.5. Zakljuak istraivanja........................................................................ 103
Zakljuak ...................................................................................................... 105
Bibliografija.................................................................................................. 115
Saetak.......................................................................................................... 128
Summary....................................................................................................... 130
ivotopis....................................................................................................... 132
Prilog 1. Popis knjinica i URL-a njihovih kataloga obuhvaenih
istraivanjem................................................................................................. 133
Prilog 2. Upitnik ........................................................................................... 137
Prilog 3. Primjeri naprednih svojstava predmetnog pretraivanja u WebPACima ................................................................................................................ 140
Prilog 4. Prijedlog smjernica za osiguravanje mogunosti predmetnog
pretraivanja u knjininim katalozima visokokolskih knjinica

s web-

sueljem........................................................................................................ 151

159

You might also like