You are on page 1of 27

1. Što je to indeksiranje?

INDEKSIRANJE (označivanje) = dodjeljivanje oznaka (indeksa) dokumentu, kojima se omogućuje


njegovo pronalaženje u skupu drugih dokumenata.
Te su oznake najčešće vezane uz sadržaj dokumenta, a dodjeljuju se ručno ili automatski. Ručnim se
indeksiranjem dokumenata najčešće odabiru pojedine riječi znakovite za njegov sadržaj, a one mogu
biti ključne riječi (ako su slobodno izabrane) ili deskriptori (ako su odabrane iz tezaurusa).

Indeksni jezik = kontrolirani rječnik.

Indeksni jezici

Abecedni Sistematski

Predmetni
Tezaurusi Klasifikacije
sustavi

Postkoordinirani Prekoordinirani Prekoordinirani

1
INDEKSNI JEZICI mogu biti:

 kontrolirani
 polukontrolirani i
 nekontrolirani.

Indeksni jezici:
a) ABECEDNI - tezaurusi > postkoord.
predmetni sust. > prekoord.

b) SISTEMATSKI – klasifikacije > prekoord.

(tj., prema načinu koordinacije pojmova dijele se na


prekoordinirane i postkoordinirane sustave)

TEZAURUSI, rječnici kontroliranih izraza/odrednica, koriste se za predmetno označivanje. Tako je terminologija


KONZISTENTNA (POSTOJANA) i uvijek se koriste isti termini, bez obzira na to kakvu terminologiju koriste autori!

TEZAURUS je vrsta rječnika (sakuplja nazive i organizira ih!).

2. Indeksiranje kao TRIpartivna mreža?

Proces indeksiranja moguće je predstaviti tripartitnom mrežom koja se sastoji od:

1. indeksera (osoba koja indeksira)


2. informacijskog izvora
3. metode predstavljanja znanja.

INDEKSER je autor, korisnik ili profesionalni indekser. Svaki indekser drugačije postupa i ističe različite karakteristike izvora.
Autor ukoliko samostalno indeksira koristi ključne riječi, statističku obradu teksta i citatno pretraživanje. Korisnik koristi
autorove i korisnikove pojmovi, a stručnjaci /profesionalci koriste sustave za organizaciju znanja (tezauruse i klasifikaccije).
Ono što informacijskog stručnjaka razlikuje od krajnjeg korisnika jest osvještenost o jezičnim fenomenima i njihovom
utjecaju na pretraživanje. Oni moraju voditi računa o korekciji pogrešaka u pisanju, razrješenju dvoznačnosti, uspostavi
istoznačnosti kod sinonima, leksikalizaciji, istaknuti važno, a nevažno zanemariti

3. Što su to prekoordinirani, a što postkoordinirani sustavi? Opiši razliku u


načinu povezivanja pojmova između PREkoordiniranih i
POSTokoordiniranih sustava.

2
PREkoordinirani sustavi su sustavi s PRETHODNIM
POVEZIVANJEM.

Kod PREKOORDINIRANIH SUSTAVA pojmovi se


slažu/KOORDINIRAJU prije samog početka procesa
pretraživanja.

Prekoordinaciju provodi katalogizator/predmetni


stručnjak PRIJE POČETKA PRETRAŽIVANJA.

Pojmovi se slažu prema pravilima, tj. prema


definiranoj sintaksi, a veze su gramatičke.

Dokument se označuje čitavim izrazom i pri


pretraživanju izraz se mora jednako oblikovati (npr.
„povijest filozofije“).

Kod ovakvog pretraživanja preciznost je VEĆA!!

Vrste:
 bibliotečno-bibliografske KLASIFIKACIJE i
 PREDMETNI sustavi (knjižnični katalozi).

POSTkoordinirani sustavi su sustavi s NAKNADNIM DESKRIPTOR1 = RIJEČ ili GRUPA RIJEČI iz


povezivanjem. dokumentacijskog jezika.

Kod POSTKOORDINIRANIH SUSTAVA pojmovi se DESKRIPTOR se koristi za indeksiranje


slažu/KOMBINIRAJU tijekom procesa pretraživanja. dokumenata. Te su riječi normirane riječi –
jednoznačno određeni termini odabrani iz
Postkoordinaciju provodi korisnik kada pretražuje
prirodnog jezika.
(sve je na njemu jer on sam mora povezivati).

Postkoordinirani jezik nema sintaksu, pojmovi se ne TEZAURUSI, rječnici kontroliranih


povezuju u složene izraze tijekom označavanja, već izraza/odrednica, koriste se za predmetno
se koriste pojedinačni pojmovi s Booleovim označivanje. Tako je terminologija
operaterima. (npr. filozofija AND povijest) KONZISTENTNA (POSTOJANA) i uvijek se
koriste isti termini, bez obzira na to kakvu
Veze su logičke, a odaziv je VEĆI!!! terminologiju koriste autori!

Vrste: TEZAURUS je vrsta rječnika (sakuplja


 ključne riječi/tagovi nazive i organizira ih!).
 deskriptori i
 tezaurusi (popularni u online okruženju).

4. Kakva je RELEVANTNOST prekoordiniranih/postkoordiniranih sustava


(tj. uloga u pretraživanju)?

1
Definicija preuzeta iz Dizdar, S. Od podataka do metapodataka.
3
PREkoordinirani sustavi su sustavi s PRETHODNIM POVEZIVANJEM.

- potrebni su i danas jer složene predmetne odrednice čuvaju kontekst značenja


analiziranog sadržaja dokumenta, olakšavaju pretraživanje, preciziraju pronalaženje
- gramatičkom sintaksom u prekoordiniranim sustavima moguće je izraziti prirodne
relacije (subjekt i objekt radnje)
- intelektualno značenje ovisi o redu riječi ili odnosima koji nisu obuhvaćeni
postkoordiniranim kombinacijama Booleovih operatora

- brže zastarijeva (složeni pojmovi u odnosu na jednostavne), javlja se mogućnost


prebiranja (browsing)

POSTkoordinirani sustavi su sustavi s NAKNADNIM povezivanjem.

- Booleovi operateri ne mogu sve riješiti (npr. krivi logički spojevi) – potrebna
KOMBINACIJA

5. Zašto danas govorimo o paradigmi PREDMETNOG PRISTUPA?

Pojavom GOOGLE-a i tražilica ljudi su se počeli služiti ključnim riječima i tagovima za pretraživanje, više ne pretražuju po
AUTORU i NASLOVU, a time se promijenio način pretraživanja.

Fokus je došao na PREDMETNO PRETRAŽIVANJE preko ključnih riječi, ne više prema autoru i naslovu.

Teorijski je problem - Postaje li bilo koja vrsta dodane informacije suvišna?

Može li dodatna informacija povećati odziv/preciznost? (npr. ŽIDOVI – dokument o ŽIDOVIMA čiji autor

zastupa nacistička gledišta nije dovoljno indeksirati kao dokument o Židovima – VAŽNO istaknuti

nacističko gledište koje je tema – to možemo SAMO intelektualno – logičkim razmišljanjem)

-------------------------------------------------------------------------------------------------------------------------------------------------------------

Razlika između deskriptora ili predmetnih odrednica?

mogu biti samostalne pojedinačne u predmetnim se odrednicama


riječi PREDMETNE
opisuje GLAVNI PREDMET
DESKRIPTOR DOKUMENT
opisuju se POJEDINI ASPEKTI ODREDNICE
PREDMETA DOKUMENTA
obično se dodjeljuje 1 do 2
obično se dodjeljuje od 5 do 25 predmetne odrednice
deskriptora

4
6. Kako se KLASIFICIRAJU PREDMETNE PRISTUPNICE?

KLASIFIKACIJA PREDMETNIH PRISTUPNICA

A) Predmetne pristupnice klasificirane prema stvaratelju:

Autorski generirane: ključne riječi

naslov

sažetak

(moguće je provesti predmetno pretraživanje)

1. KOJE PREDMETNE PRISTUPNICE GENERIRA AUTOR/ NASTAJU NA TEMELJU


POJMOVA KOJE JE KORISTIO AUTOR. KAKVO JE PRETRAŽIVANJE MOGUĆE
PROVESTI NA TEMELJU TAKVIH PRISTUPNICA

(Autorsko generirane predmetne pristupnice su KLJUČNE RIJEČI, NASLOV, SAŽETAK.)

S dodanom vrijednošću:

izdavač ili urednik: naziv časopisa, izdavača, podaci na naslovnici

informacijski stručnjak/indekser: klasifikacijske oznake, deskriptori/predmetne oznake (opisnici)

čitatelji/recenzenti: recenzije, statistike uspješnica (bestselleri), korisničke oznake…

(oni daju recenzije, lajkove itd.)

B) Predmetne pristupnice klasificirane prema vrsti:

a) verbalne (ključne riječi, predmetnice, deskripori) /neverbalne (klasifikacijske oznake ne temelje na prirodnom
jeziku)

b) dugi oblici ( sažeci) / kratki oblici (ključne riječi)

c) kontrolirani (izrađuje bibliotekar) / nekontrolirani (izrađuje korisnik)

d) izvedene (uzimaju iz dokumenta) / dodijeljene (dodjeljuje indekser iz rječnika kontroliranog jezika)

e) prekordinirani /postkordinirani

f) ručno/ automatski5 generirani


predstavljaju pred.prist., ali to je krajnji efekt.

7. Opiši proces indeksiranja (označavanja)!

INDEKSIRANJE (označivanje) = dodjeljivanje oznaka (indeksa) dokumentu, kojima se omogućuje njegovo pronalaženje u
skupu drugih dokumenata.

Te su oznake najčešće vezane uz sadržaj dokumenta, a dodjeljuju se ručno ili automatski. Ručnim se indeksiranjem
dokumenata najčešće odabiru pojedine riječi znakovite za njegov sadržaj, a one mogu biti ključne riječi (ako su slobodno
izabrane) ili deskriptori (ako su odabrane iz tezaurusa). 

INDEKSER (eng. indexer) osoba koja se bavi indeksiranjem dokumenata.

Sam postupak indeksiranja podijeljen je u 3 operacije:

1) ANALIZU DOKUMENTA u cilju selekcije pojmova koji prema mišljenju indeksera mogu biti od interesa za korisnike
indeksa (kazala)

2) "PREVOĐENJE" ODABRANIH POJMOVA, sadržaja ili riječi u neki kontrolirani ili standardizirani dokumentacijski jezik

3) ODABIR I SLAGANJE INDEKSNIH OZNAKA prema pravilima dokumentacijskog jezika.

Postoje dva osnovna načina indeksiranja:

a) slobodno (kada se neposredno iz teksta dokumenta biraju ključne riječi bez obzira na njihovu formu i semantičke
odnose), i

b) kontrolirano (kada se za pretraživanje koriste samo oni termini koji su unaprijed određeni dokumentacijskim jezikom).

Najbolje rezultate pretraživanja daje metoda koordiniranog indeksiranja (metoda koja u fazi indeksiranja koristi indeksne
termine na istoj razini, tako da se u fazi pretraživanja može koristiti bilo koja kombinacija termina). Ova metoda dobiva
široku primjenu 1950-tih godina, uvođenjem Uniterm sistema, ali i sistema za automatsko pretraživanje (v. automatsko
indeksiranje).

8. Što je to sadržajno označivanje/indeksiranje?

SADRŽAJNO OZNAČIVANJE / INDEKSIRANJE

Sadržajno označivanje / indeksiranje


- omogućuje pristup dokumentu preko predmeta o kojima se u dokumentu govori (tj. njegova sadržaja)
- predstavljanje sadržaja dokumenta u odabranom indeksnom jeziku ili predstavljanje interpretacije sadržaja
dokumenta

Sustave za označivanje i pretraživanje sadržaja čine:

klasifikacije

predmetni sustavi

tezaurusi

ontologije (u zadnje
6
vrijeme)
9. Navedi metode sadržajnog označivanja:

a) Sažimanje i indeksiranje/označivanje:
- prema količini proizvedenog konteksta, obje metode su subjektivne u razlikovanju važnog od nevažnog,
odabiru pojmova i broja pojmova
- obje se metode nadopunjuju
- funkcija filtriranja

a) Automatska vs. intelektualna obrada (automatska obrada: korištenje orginalnog dokumenta za osnovu sadržajnog
označivanja, a analiza se vrši pomoću računalnih programa; intelektualna obrada: predmetni stručnjak pojmove
sam (ručno) doznačuje dokumentu.)
b) Verbalna i stručna/sistemska obrada (informacijski će stručnjak nastojati predstaviti dokument jezgrovitim
pojmovima kako bi omogućio pronalaženje dokumenata.)

10. Objasni kritiku uvriježenih/tradicionalnih pristupa sadržajnom


označivanju?

Sadržajno označivanje je omogućavanje pristupa dokumentu preko predmeta o kojima se u dokumentu govori, tj. njegova
sadržaja.

(odgovor iz maila)

KRITIKA tradicionalnih pristupa sadržajnom označivanju… proizlazi iz predstavljanja sadržaja dokumenata uz interpretaciju
sadržaja dokumenata koja je subjektivna, a indeksiranje mora biti objektivno i tu dolazi do raskoraka jer indeksiranje u sebi
sadrži neodređenosti pojma SADRŽAJ koji je okosnica postupka označivanja i nepreciznosti opisivanja postupka označivanja
koji u sebi sadrži interpretaciju.

11. Koji su KORACI u označivanju? (PROCES OZNAČIVANJA)

Sam postupak indeksiranja podijeljen je u 3 operacije:

1) ANALIZU sadržaja DOKUMENTA u cilju selekcije pojmova koji prema mišljenju indeksera mogu biti od interesa za
korisnike indeksa (kazala) = o čemu je dokument (aboutness/očemnost, tema i predmet)??

2) "PREVOĐENJE" ODABRANIH POJMOVA, sadržaja ili riječi u neki kontrolirani ili standardizirani dokumentacijski jezik =
nakon što vidimo o čemu govori dokument, provjerimo je li pojedini izraz, srodni izraz ili sl. zastupljen u rječniku!

3) ODABIR I SLAGANJE INDEKSNIH OZNAKA prema pravilima dokumentacijskog jezika.

I. Postupke označivanja dugo je provodio isključivo čovjek

II. U novije vrijeme nastoje se izgraditi sustavi u kojima analizu teksta i označivanje provodi računalo

III. Unatoč specifičnostima, i automatsko i manualno označivanje podrazumijeva iste korake

12. STANDARDIZACIJA I KRITIKA U PODRUČJU INDEKSIRANJA

7
Standardizacija

- želi se standardizirati praksa indeksiranja kako bi ustanove koje indeksiraju mogle razmijeniti zapise
- praksa indeksiranja ne može se do kraja standardizirati, tj. možemo standardizirani način na koji ćemo izraziti
analizirano, ali ne i samu analizu

Postupak standardizacije počinje s pristupom usmjerenim na dokument:

- prednosti pristupa usmjerenih na dokument su reprezentacija dokumenta, koja će se temeljiti na stabilnim


karakteristikama dokumenta, koje se neće mijenjati tijekom vremena

- ALI - teško je predvidjeti kako će se dokument koristiti u budućnosti te ga je bolje indeksirati s obzirom na to što on
stvarno predstavlja

Kritika standardizacije

- kritika standardizacije zalaže se za to da odluka o indeksnoj oznaci bude utemeljena na promišljanju o tome kako
će korisnici tražiti knjigu

13. Što je to OČEMNOST?


Očemnost (aboutness)

1) pojam OČEMNOSTI je u knjižničarstvu među prvima popularizirao Hutchins 70-ih godina


2) Hutchins je ukazao na to da je potrebno ukloniti EPISTEMOLOŠKI PROBLEM koji se javljaju kod definiranja
pojmova sadržaj/predmet
(npr. na satu književnosti treba odrediti temu – učenici su subjektivni – TOGA NE SMIJE BITI U OVOM SLUČAJU)
3) pojam očemnosti odgovara na pitanje „O čemu je neki dokument“ (on je u ŽARIŠTU ANALIZE, ne sadržaj) === na
taj se način želi osigurati objektivan pristup označivanju kako bi različite osobe dokument prepoznale na isti
način
4) u OČEMNOSTI je važan korisnik (on na kraju procjenjuje) i moramo imati na umu za koga indeksiramo!!!

- želi se osigurati objektivnost postupka:

DOKUMENT (za razliku od sadržaja) sadrži određene elemente (npr. naslov, sažetak, sadržaj) – oni su objektivni i
jednoznačni jer će ih različiti informacijski stručnjaci prepoznati na isti način

SADRŽAJ DOKUMENTA - svaki indekser ga interpretira na svoj način (subjektivnost)

Berghtol ili Hutchins

- drže da je dio očemnosti urođen dokumentu i ZATO OBJEKTIVAN, no da je dio očemnosti određen svrhom korištenja
dokumenta, PA SAMIM TIME SUBJEKTIVAN

8
14. KOJA JE RAZLIKA IZMEĐU TEORIJSKIH POJMOVA SADRŽAJ
I OČEMNOST?

Dokument, naime, za razliku od sadržaja, sadrži određene elemente (npr. naslov, sažetak), koji su objektivni i jednoznačni
jer će ih različiti informacijski stručnjaci prepoznati na isti način.

Kod očemnosti se uklanjaju epistemološki problemi u definiranju pojmova sadržaj/predmet. Očemnost uzima dokument
kao polazište za analizu.

Razlikujemo dvije razine: pokrivenost u dubinu(vertikalna očemnost) i pokrivenost u širinu (horizontalna očemnost).

15. Zašto se u sadržajno označivanje uvodi pojam očemnost? (vidi ? br.


14)

16. PROBLEMI U PREDMETNOM OZNAČIVANJU / PREDMETNOJ


ANALIZI?

TREBA ODABRATI PRIKLADNE OZNAČITELJE (ključne riječi, deskriptore) – razvijeni brojni alati kontrole rječnika s tim ciljem
(tezaurusi, popisi predmetnih odrednica…)

9
PROBLEMI PREDMETNE ANALIZE:

1) RAZLIČITE METODE UTVRĐIVANJA PREDMETA (Wilson)


o Metode svrhe – odrediti koji je autorov cilj/svrha
o Metoda figure – odrediti centralnu figuru (koja je autorova figura)
o Objektivna metoda – brojanje referenci
o Metoda kohezije, prihvaćanja ili odbijanja – koja nit povezuje djelo, što je rečeno ili nije rečeno
2) kulturne različitosti
3) predmet može imati mnogo FACETA (aspekti određenog predmeta, npr. kutija – kartonska?, bijela?, velika?)
4) isCRPnost
5) konzistentnost.

17. Odabir indeksnih pojmova u odnosu na odziv i preciznost? / Kako


odziv i preciznost utječu na predmetno označivanje?

Vodilja za indeksera pri donošenju odluke o odzivu i preciznosti trebaju biti dimenzije očemnosti, odnosno iscrpnost
(horizontalna) i specifičnost (vertikalna). Odziv i preciznost su obrnuto proporcionalne vrijednosti. Specifičnost, odnosno
vertikalna očemnost znači da indekser bira specifičnije pojmove. Time se povećava preciznost, ali smanjuje odziv pri
pretraživanju. Iscrpnost, tj. horizontalna očemnost označava stupanj pokrivenosti dokumenta pojmovima za označivanje.
Ukoliko indekser iscrpnije analizira dokument, povećava se odziv, ali smanjuje preciznost, te će se pojaviti nerelevantni
dokumenti.

10
18. KONCEPCIJE U PREDMETNOJ ANALIZI (TRI PRISTUPA)

1. Pristup usmjeren na korisnika


- ima u fokusu korisničke potrebe i njihovu terminologiju (tj. razmišljamo o potrebama i o terminologiji korisnika koji
su karakteristični za tu knjižnicu – KAKO TAJ DOKUMENT UČINITI VIDLJIV KORISNICIMA)

2. Pristup usmjeren na domenu (područje)


- domena (stručno područje) u kojoj korisnik djeluje postaje fokus analize
- npr. ako indeksiramo sliku nekog kamena – drugačiji tip oznaka ćemo dodijeliti ako analiziramo iz domene geologije
ili arheologije

3. Pristup usmjeren na dokument


- fokusiran na OBJEKTIVNOST; NEUTRALNOST – treba se držati teksta, a ne interpretirati sa strane
- indekser kod analize na temelju samog dokumenta utvrđuje njegov sadržaj.

19. KRITERIJI KVALITETNOG PREDMETNOG OZNAČIVANJA

Na pretraživanje posebno utječu TOČNOST, ISCRPNOST, SPECIFIČNOST (OČEMNOST) I KONZISTENTNOST označivanja.

1) TOČNOST = sposobnost osobe koja provodi označivanje da identificira pojmove i prevede ih na termine
kontroliranih rječnika.
2) ISCRPNOST
3) SPECIFIČNOST (OČEMNOST) = pojam očemnosti (engl. aboutness) odnosi se na pojmovnu pokrivenost – postoje
dvije dimenzije očemnosti:
a. iscrpnost (pokrivenost u širinu)
b. specifičnost (pokrivenost u dubinu)
i. ŠTO JE POJAM SPECIFIČNIJI, TO JE DOKUMENT BOLJE ISKAZAN OZNAČITELJEM
4) KONZISTENTNOST = isti predmeti bi se trebali označiti istim TERMINIMA kako bi u katalogu bili okupljeni slični
predmeti, što se u praksi pokazalo teško izvedivo

- općenitiji pojmovi – VEĆI broj rezultata (veći odziv)

- specifični pojmovi – MANJI broj rezultata (veća preciznost)

BIRATI POJMOVE KOJI SU „NA SREDINI“ / tj. sredinu u pojmovnom rasponu (da uhvatimo i odziv i preciznost), tj. potrebno
uspostaviti kompromis između jednog i drugog jer oboje nije moguće

Npr. SUĐE, ČAŠE (nekoliko rezultata je precizno, a ostalo – druge čaše), VINSKE ČAŠE (mali odziv, precizan pojam)

Nužnost održavanja kompromisa između TOČNOSTI (preciznosti) I ODZIVA (potpunosti)

20. Kako odziv i preciznost utječu na predmetno označivanje?

LANCESTER kaže kako je za korisnika prihvatljivo da odziv i preciznost variraju između 50% i 60%.

11
 taj postotak treba biti vodilja za indeksera u odluci iscrpnosti i specifičnosti (iscrpnost/povećava odziv i
specifičnost/povećava preciznost) – one utječu na točnost i odaziv
 time se postiže ekonomičnost

21. Kako indekseri rješavaju problem odziva i preciznosti?

 s obzirom na ulogu drugačije postupaju, odnosno ističu različite karakteristike izvora:

 autor: ukoliko samostalno indeksira - ključne riječi, statistička obrada teksta, citatno pretraživanje
 korisnik: autorovi + korisnički pojmovi
 predmetni/informacijski stručnjak: sustavi za organizaciju znanja (tezaurusi, klasifikacije)

Zajedničko: svatko će interpretirati sadržaj izvora iz rakursa vlastitog okruženja


- vodilja za indeksera pri donošenju odluke o odzivu i preciznosti trebaju biti dimenzije očemnosti, odnosno
iscrpnost (horizontalna) i specifičnost (vertikalna)

Specifičnost (vertikalna očemnost):

indekser bira specifičnije pojmove - time se povećava preciznost, ali smanjuje odziv pri pretraživanju

Iscrpnost (horizontalna očemnost):

označava stupanj pokrivenosti dokumenta pojmovima za označivanje

- ukoliko indekser iscrpnije analizira dokument, povećava se odziv, ali smanjuje preciznost, te će se pojaviti
nerelevantni dokumenti

Konzistentnost (DOSLJEDNOST)

- pojedinci neće isto odrediti predmet (iste sadržaje u različitim dokumentima različite osobe moraju jednako obraditi –
ako ga i jednako definiraju, imenovat će ga različitim pojmovima iz prirodnog jezika)

INTERKONZISTENTNOST: dosljednost u označivanju kod različitih indeksera – RAZLIČITO OZNAČAVAJU

INTRAKONZISTENTNOST: na razini jedne osobe - dosljednost indeksera tijekom vremena kroz koje označuje (pr. razlike na
početku/kraju radnog vremena, početku/kraju karijere) – NISMO DOSLJEDNI

FAKTORI UTJECAJA:

veličina vokabulara (veći vokabular – manja konzistentnost; visoka specifičnost – manja konzistentnost)

broj označitelja (veća iscrpnost, manja konzistentnost) (iscrpnost – broj označitelja koje dodijelimo dokumentu)

OČEMNOST

DVIJE DIMENZIJE OČEMNOSTI

Iscrpnost (horizontalna očemnost)

- broj označitelja koje smijemo dodijeliti dokumentu


12
- propisan pravilnikom/praksom u knjižnici - diktira ju lokalna politika (šef u knjižnici)
- mora postojati jasna predodžba kolika je razina iscrpnosti potrebna (npr. može se odrediti da maksimalni broj
označitelja bude 5, tada će sustav biti relativno konzistentan)
- svim označiteljima treba se istaknuti cijeli sadržaj (ne svaki dio), ali moramo poopćavati
- povećava odziv

22. Objasni dubinsko označivanje i sažimanje!


Dvije razine iscrpnosti:
 Dubinsko označivanje/indeksiranje
 karakteristično za specijalizirane i komercijalne servise (više u bazama podataka)
 pretraživanje informacija; uključene i podteme iz izvora
 pokrivamo sav sadržaj / različiti deskriptori
 povećava preciznost/točnost jer se koristi preciznija/specifičnija terminologija

 Sažimanje
 knjižnice (knjižnična katalogizacija)
 pretraživanje dokumenata/knjiga
 identifikacija prevladavajućeg predmeta, visoka razina poopćavanja, navodi samo koncepte
zastupljene u glavnoj temi
 cijeli sadržaj ćemo probati upisati uz nekoliko predmetnica
 oovećava odziv/potpunost zbog općenitijih pojmova

Specifičnost (vertikalna očemnost)

- povećava preciznost
- pokrivenost u dubinu, vertikala = specifičnost odabranih pojmova
- što je pojam specifičniji, tim je predmet bolje iskazan označiteljem (stupanj preciznosti)
- ukupnost predmeta eksplicitno ili implicitno sadržanih u tekstu dokumenta
- odnosi se na tekst, naslov, izražene i neizražene autorove intencije, moguća gledišta čitatelja

broj pronađenih relevantnih dokumenata


točnost ili preciznost= X 100
broj pronađenih dokumenata

broj pronađenih relevantnih dokumenata


odziv ili potpunost = X 100
broj relevantnih dokumenata u sustavu

23. PREDMETNO OZNAČIVANJE, VAŽNOST I AUTOMATIZACIJA


Predmetno označivanje

- označivanje dokumenata kojima se omogućava pronalaženje literature o određenom predmetu


- ima funkciju okupljanja, browsinga i očuvanja konteksta

- izrađuju se predmetni nizovi (prekoordinacija):

od velike važnosti u organizaciji znanja – važno u znanosti i kod sofisticiranih potreba

13
- Nastaju složene predmetne odrednice:

olakšava pretraživanje, precizira pronalaženje

setovi predmetnih odrednica nude iste ili slične sadržaje koji su okupljeni unutar predmetnog kataloga

24. Osnovni koraci u predmetnom označivanju:


A) pojmovna analiza
- određivanja bitnih karakteristika sadržaja ili teme dokumenta
(očemnost: iscrpnost i dubina utvrđivanja sadržaja)

B) odabir koncepta
- prevođenje pojmova na kontrolirani rječnik (čime se oblikuju pristupnice)
- odredimo radimo li u prekoord./postkoord. sustavu (prekoord. – odredimo sintaksu itd.)

Automatizacija

- u tradicionalnom predmetnom označivanju predmetni stručnjak pojmove „doznačuje“ dokumentu


- automatsko predmetno označivanje koristi za osnovu svog procesa originalni dokument, a analiza teksta
dokumenta izvodi se automatski pomoću specijalnih računalnih programa
- temelji se na statističkoj obradi teksta i lingvističkim metodama
- sustavi za automatsko predmetno označavanje su na putu da postanu uobičajena pomagala u knjižnicama

- pojavom prvih automatiziranih sustava pomak prema prirodnom jeziku kao metodi indeksiranja (ključne riječi,
tezurusi) u elektroničkim zbirkama gdje fizički pristup ili pregledavanje (browsing) nisu važne

- u knjižničnom okruženju popis predmetnih odrednica primjereniji je način

25. Treba li odustati od predmetnog označivanja?


- NE, iako krajnji korisnici najčešće koriste ključne riječi, a ne predmetne odrednice pri sadržajnom pretraživanju
- predmetne odrednice često koriste bibliotekari (sužavaju popis u odnosu na UDK, posebno su korisne u specijalnim
i znanstvenim knjižnicama za sofisticirana pretraživanja, čuvaju kontekst, nude pouzdanu i brzu informaciju, imaju
veliku sposobnost širenja i prihvaćanja novih znanstvenih i stručnih termina)

- Javlja se teorijski problem:

postaju li dodatne informacije suvišne i može li dodatna informacija povećati odziv ili preciznost – odgovor na to
pitanje može se povezati s problemom sadržaja i/ili predmeta (koliko je dokument transparentan i sadržaj očit te
funkcionira li tekst kao optimalna reprezentacija samog sebe?)

26. PREDMETNO PRETRAŽIVANJE / AUTOMATSKO PREDMETNO


PRETRAŽIVANJE

PREDMETNO PRETRAŽIVANJE

- pronalaženje literature o određenom PREDMETU koji je u njima sadržan

- jedan od načina na koji možemo u KATALOGU pristupiti jedinici građe na temelju sadržajnih obilježja

Je li moguće predmetno označivanje riješiti automatizirani postupcima?

14
 automatsko pretraživanje se koristi originalnim dokumentom, a analiza tekst izvodi se pomoću specijalnih računalni
programa
 temelji se na statističkoj obradi teksta i lingvističkim metodama
 sustavi za automatsko predmetno označivanje su na putu da postanu uobičajena pomagala u knjižnicama

27. TEZAURUSI

TEZAURUSI, rječnici kontroliranih izraza/odrednica, koriste se za predmetno označivanje. Tako je terminologija


KONZISTENTNA (POSTOJANA) i uvijek se koriste isti termini, bez obzira na to kakvu terminologiju koriste autori!

TEZAURUS je vrsta rječnika (sakuplja nazive i organizira ih!).

1. spadaju u POSTKOORDINIRANE SUSTAVE jer sadrži jednostavne pojmove


2. važnost tezaurusa: U PRETRAŽIVANJU, U OZNAČIVANJU DOKUMENTA
3. kompleksni predmeti/sadržaji označuju se većim brojem deskriptora (radi bolje preglednosti i razumijevanja
veza), koji se pri pretraživanju povezuju logičkim operatorima
4. najčešće se bave jednim područjem (disciplinom), stoga su osobito uspješni u dubinskom označivanju
sadržajno kompleksnih izvora (npr. članci) – ZATO vezani uz informacijske servise i baze podataka
5. praktični kod specifičnih/znanstvenih istraživanja (ne ako npr. tražimo kulinarske recepte)

28. Zašto se pojavljuju TEZAURUSI?


Thesaurus – grč. riznica/blago/spremište

Koncept tezaurusa pojavio se kao konkurencija klasifikacijama.

Godine 1950. pojavljuje se u okviru SUSTAVA ZA OZNAČIVANJE, kao alat za predmetno označivanje.

50-e godine (zašto se tezaurus pojavljuje naspram klasifikacijama)

- pojavili su se kao protustruja/konkurencija klasifikaciji (T – preciznost; K – odziv): moderniji, suvremeniji indeksni


jezici

- razvoj motiviran željom za odmakom od nefleksibilnog principa ladica (prekoordinacija) i okretanju prirodnom
jeziku

- potreba za dubinskom analizom sadržaja – što je nemoć klasifikacije

- počinju se koristiti u bazama podataka (u zbirkama koje pokrivaju 1 predmetno područje)

Tezaurus čini strukturirani popis termina koji stručnjak koristi pri opisu dokumenata (obično 1 predmetno područje).

70-tih se smirila euforija oko tezaurusa uz pretraživanje punog teksta.

19. st. – ROGET – pod imenom „tezaurus“ izdao rječnik sinonima engleskog jezika – tj. kako jednu riječ možemo izraziti na
više načina (jezično bogatstvo nastoji se proširiti)

1974. godine objavljen je prvi međunarodni standard za konstrukciju jednojezičnih tezaurusa, a potom počinje
standardizacija.

70-e

- zaživjeli i široko se koriste (i u knjižnicama), kada se pojavljuju razni standardi

Danas tezaurusima i klasifikacijama dostižemo komplementarne ciljeve (tezaurusi=preciznost ; klasifikacija = odziv).

15
29. Objasni razliku između deskriptora i nedeskriptora!
A) Deskriptori
- opisnici
- jezične jedinice oko kojih je organiziran pojmovni rječnik
- normirani i terminološki kontrolirani naziv
- aktivni dio tezaurusa – koristimo ih u označivanju/pretraživanju

B) Nedeskriptori
- služe za ulaz u tezaurus
- upućuju nas dalje na drugi termin (označava se oznakom „USE“ - upotrijebi)
- pasivni dio tezaurusa - ne koristimo ih u označivanju/pretraživanju

C) Semantički odnosi
- zasnovani na značenju (ponajprije između deskriptora i nedeskriptora, a zatim i između desktriptora)
(odnosi: hijerarhijski, srodnosti, asocijativnosti, semantičko značenje)

METAJEZIČNE OZNAKE – njima se označavaju odnosi među deskriptorima

MT pripadnost potpojmovniku - mikrotezaurus - jednom ili većem broju

(hijerarhijski odnos)

BT nadređeni/ širi pojam

NT podređeni/uži pojam

(odnos srodnosti)

RT srodni pojam / asocijativnost

(odnos ekvivalencije)

USE rabi/uporabi

UF uporabi za / rabi se umjesto

SN upotrebna bilješka (upisuje se i određuje značenje pojedinog deskriptora)

Pr. NAPOLIČARENJE

SN dogovor prema kojem vlasnik ustupa svoju zemlju u zamjenu za dio uroda

Odnos između deskriptora može biti hijerarhijski i odnos srodnosti, a između deskriptora i nedeskriptora odnos
ekvivalnecije.

Pr. BT DESKRIPTOR (1 pojam) NT

USE FOR RT NT

16
BT gnojidba (BT nadređeni pojam; mogli smo staviti i MT – ako ih je jako puno!; BT – za one do 5)

mineralna gn. DESKR.

organska gn.

MT voće (potpojmovnik)

bobičasto v. DESKR.

NT1 kupine

NT1 maline

v. sa sjemenkama DESKR.

NT1 dunje

NT1 kruške

BT povrće (BT nadređeni pojam)

celer DESKR.

cvjetača

karfiol USE cvjetača (moramo ponoviti)

BT društvene znanosti (potpojmovnik)

sociologija DESKR.

NT1 industrijska sociologija

NT1 sociologija grada

MT umjetnost (potpojmovnik)

narodna umj. DESKR.

NT1 nar. glazba

NT1 nar. ples

kazalište DESKR.

teatar USE kazalište (moramo ponoviti)

NT1 lutkarstvo

NT1 školski igrokaz

17
30. Što je to tezaurus i vrste tezaurusa:
TEZAURUSI, rječnici kontroliranih izraza/odrednica, koriste se za predmetno označivanje. Tako je terminologija
KONZISTENTNA (POSTOJANA) i uvijek se koriste isti termini, bez obzira na to kakvu terminologiju koriste autori!

TEZAURUS je vrsta rječnika i terminološko pomagalo (sakuplja nazive i organizira ih!).

VRSTE TEZAURUSA:

 jednojezični
 višejezični
 mikrotezaurus
 makrotezaurus…

vezuje se uz INFORMACIJSKE servise


sadrži jednostavne pojmove
odnoi se na jednopredmetno područje
online tezaurusi
POSTKOORDINIRANI

vezuju se uz KNJIŽNIČNU zajednicu (izvorno


nastali za gradnju PREDMETNIH KATALOGA)
sadrže ŠIRE pojmovne jedinice 1111
sadrže fraze

KLASIFIKACIJE
TEZAURUS ne odnose na jednopredmetno područje
TEZAURUSI (npr. LCHS)
PREKOORDINIRANI
 umjetni jezik  prirodni jezik s kontrolom

PREDMETNI SUSTAV/sadrži
širina (područje, pokrivenost)  dubina
PREDMETNE
 visoka razina apstrakcije ODREDNICE
 niska razina apstrakcije
 klasa (elementi)  deskriptori
osiguravaju terminologiju koja je dosljedna,
 sistematski poredak elemenata SLIČNOSTI:
 a ne nekontrolirana
abecedni ili nepredvidiva
poredak elemenata
 hijerarhijski odnosi  srodnost, istoznačnost, hijerarhija sustavima
služe se upitnim i hijerarhijskim
(semantički odnosi)
 prekoordinirani  postkoordinirani
 sličnost među dokumentima  razlika među dokumentima
(naglasak) – sve knjige iz jednog (naglasak) – razlikuju okupljeno
područja trpa u 1 vreću (okuplja)
 odziv  preciznost

31. Razlika između tezaurusa i sustava PREDMETNIH ODREDNICA


(klasičnog sustava)?

18
Dok se TEZAURUS odnosi samo na jedno predmetno područje, sustav PREDMETNIH ODREDNICA sastoji se od rječnika,
odnosno popisa dozvoljenih riječi te sintakse === i ne odnose se na samo jedno predmetno područje.

Sustavi PREDMETNIH ODREDNICA su nastali s ciljem gradnje PREDMETNIH KATALOGA u knjižnicama.

TEZAURUSI se odnose na samo 1 predmetno područje, kao odgovor na klasifikacijske sustave.

TEZAURUSI su POSTKOORDINIRAI (koristi prirodan jezik, pojmovi se uzimaju iz teksta dokumenta, a kompleksni pojmovi se
označuju s više deskriptora).

SUSTAVI PREDMETNIH ODREDNICA su PREKOORDINIRANI (izrađuju se predmetni nizovi).

32. KOJA JE RAZLIKA IZMEĐU TEZAURUSA KAO


LINGVISTIČKOG POJMA I TEZAURUSA KAO INFORMACIJSKOG
POMAGALA?
Lingvistički aspekt:

 tezaurus sadrži samo pojmove na prirodnom jeziku i njihove sinonime, a semantički odnosi nisu izraženi. Služi za
pronalaženje odgovarajućeg izraza.

Tezaurus kao informacijsko pomagalo

 je sadržan od deskriptora i od međusobno povezanih pojmova putem semantičkih odnosa (hijerarhija,


asocijativnost, ekvivalencija). Služi kao alat za predmetno označivanje.

33. Kako je TEZAURUSIMA moguće izraziti semantiku i semantičku


relaciju?

Semantički se odnosi u TEZAURUSU temelje na značenju između:

 deskriptora i nedeskriptora, a zatim između


 samih deskriptora.

Semantički su odnosi:

1. BILJEŠKA O UPOTREBI– objašnjava uporabnu vrijednost deskriptora


2. PRIPADNOST POJMOVNIKU– deskriptor može pripadati jednom ili više potpojmovnika
3. HIJERARHIJSKI ODNOS– označavaju se izrazima BT za širi pojam i NT za uži pojam
4. ODNOS SRODNOSTI(ASOCIJATIVNOST) – ukazuje na vezu između termina koja se ne može iskazati kao hijararhija ili
ekvivalencija, oznaka koja se koristi je RT.
5. ODNOS EKVIVALENCIJE– obuhvaća odnos među sinonima i kvazisinonimima. Prednost se daje jednom pojmou te se
za njega koristi oznaka USE

34. PREDMETNI KATALOG


- tradicionalni predmetni sustav (vezuje se uz knjižničnu zajednicu)
- popis knjižnog fonda po određenim predmetima izražen prirodnim jezikom i uređen abecednim redom
- stvarni katalog
- kontrolirani rječnik usvojenih termina, kroz uputno-informativni sustav iskazuju se paradigmatski odnosi između
termina
- osnovna jedinica je predmetna odrednica
- sustav sa sintaksom (koji omogućuje iskazivanje složenih sadržaja dokumenta)

PREDNOST:
19
- nudi brzu i pouzdanu informaciju
- velika sposobnost širenja i prihvaćanja novih znanstvenih i stručnih termina

35. KOJI SU KRITERIJI KVALITETNOG PREDMETNOG


PRETRAŽIVANJA?
Razvoj predmetnog pretraživanja započinje u 19 st. Temelje je postavio Cutter.

Zadatak kvalitetnog predmetnog pretraživanja je:

1. Omogućiti pronalaženje literature o određenom predmetu,

2. Dati sažeti iskaz o sadržaju i obliku dokumenta.

Na pretraživanje utječe kvalitetno označivanje jedinica građe prema kontroliranim sustavima.

36. PREDMETNE ODREDNICE

1) osnovna jedinica predmetnog kataloga


2) ODREDNICA nekog dokumenta koja ukazuje na njegov PREDMET ili PREDMETE
3) jedinstven jezični izraz koji predstavlja predmet dokumenta i omogućuje kontroliran pristup (u katalogu ili
kazalu, sadržaju dokumenta)

- sastoji se od:
a) jednog indeksnog izraza (ako se predmet može iskazati jednim pojmom – implicitni)

ILI

b) nekoliko izraza (ako se treba iskazati s više pojmova) povezanih u niz prema utvrđenim sintaktičkim pravilima
predmetnog sustava koji je u uporabi

PREDMETNI NIZOVI I NJIHOVA ULOGA


- od velike su važnosti u organizaciji znanja jer korisnike vrlo precizno dovode do traženog dokumenta
- čuvaju kontekst značenja analiziranog sadržaja dokumenta (pomoću predmetnih nizova)
- pomoću setova predmetnih odrednica korisnicima se nude isti ili slični sadržaji koji su (zahvaljujući takvom načinu
grupiranja) okupljeni unutar predmetnog kataloga (pr. Childred Diseases – Alternative treatment, Atlases,
Botswana…)

Razlika između deskriptora ili predmetnih odrednica?

mogu biti samostalne pojedinačne u predmetnim se odrednicama


riječi PREDMETNE
opisuje GLAVNI PREDMET
DESKRIPTOR DOKUMENT
opisuju se POJEDINI ASPEKTI ODREDNICE
PREDMETA DOKUMENTA 20
obično se dodjeljuje 1 do 2
obično se dodjeljuje od 5 do 25 predmetne odrednice
deskriptora
37. LCSH – Library of Congress Subject Headings shema

1) najpoznatiji sustav predmetnih odrednica

2) najširi predmetni rječnik za opću primjenu

3) univerzalni kontrolirani rječnik

4) model za razvoj sustava predmetnih odrednica u mnogim zemljama (standard u zemljama engleskog govornog
područja)

Cilj sustava predmetnih odrednica jest sažeti čitav sadržaj dokumenta uz pomoć jednog ili više dozvoljenih termina, koji
su jednako specifični kao i predmet koji označuju.

Neke je predmete nemoguće prikazati jednom odrednicom, pa se u tim slučajevima dodaje nekoliko odrednica radi
potpunijeg opisa sadržaja.

NEDOSTACI

- NEMA KOHEZIVNE STRUKTURE SUSTAVA – stalno se nadodaju novi pojmovi – sustav koji stalno raste (unutarnja
struktura nedostaje)

(zbog korisnika su sastavljači postepeno počeli dodavati uputnice, ali opet ad hoc – temeljeno na procjeni; po strukturi plitki
sustav – ograničena hijerarhijska struktura)

38. PREDNOSTI PREDMETNOG PRISTUPA I SUSTAVA

1) najvažnije je da čuvaju kontekst značenja analiziranog sadržaja dokumenta (ZBOG izrađivanja predmetnih nizova),
dok se kod postkoordiniranih sustava to značenje više-manje raspada
2) mogućnost prebiranja (browsing), relacije, intelektualno značenje
3) olakšava se pretraživanje, precizira pronalaženje, s lakoćom se izražavaju višestruki predmeti
4) od velike važnosti u organizaciji znanja
5) važno u znanosti i kod sofisticiranih potreba – pr. Children Diseasses – da smo s operaterima pretraživali, dobili
bismo sve zbrčkano, ovako imamo pregled
6) setovi predmetnih odrednica nude iste ili slične sadržaje koji su okupljeni unutar predmetnog kataloga

PREDNOSTI:

1. izrađuju se predmetni nizovi (prekoordinacija)


2. tako nastaju složene predmetne odrednice pomoću kojih se čuva kontekst značenja analiziranog sadržaja
dokumenata, olakšava se pretraživanje, precizira pronalaženje
3. predmetni nizovi su od velike važnosti su organizaciji znanja – važno u znanosti i kod softiciranih potreba
4. setovi predmenih odrednica nude iste ili slične sadržaje koji su okupljeni unutar predmetnog kataloga

NEDOSTATCI:

1. kompleksna pravila, složene oznake


2. dugotrajno osposobljavanje katalogizatora /predmetnog analitičara,
3. sustav skup u izradi i održavanju
4. nedovoljna ažurnost i nerazumljivost za krajnjeg korisnika

21
39. KATEGORIJE I REDOSLIJED PREDMETNIH ODREDNICA

Predmetna odrednica (predmetnica, predmetna riječ, eng.


subject entry, subject heading)
 odrednica nekog dokumenta koja ukazuje na njegov
predmet ili predmete OSOBNA

 najčešće se sastoji od ključnih riječi uzetih iz naslova ili


teksta dokumenta (v. deskriptor, indeksna oznaka).

KORPORATIVNA
1) OSOBNE
2) KORPORATIVNE
3) STVARNE
4) geografsko/etnografske
STVARNA
5) opći pojam
6) vremenske
7) oznake za oblik

Svaka kategorija, osim vremenske, može u strukturi složene odrednice biti


vodeća.

Osobne, korporativne i oznake za stvarni naslov ne mogu biti dodane.

22
40. DEVET OPĆIH NAČELA ZA IZRADU PREDMETNOG SUSTAVA
(PREMA IFLI) + DVA NAČELA PRIMJENE
(izrada pravilnika za predmetnu obradu / načelo specifične odrednice; načela oblikovanja)

(dakle, ne postoji neki opći standard jer se temelji na prirodnom jeziku – p. jezici su vrlo različiti)

načelo jedinstvene odrednice – JEDNO OD OSNOVNIH NAČELA: isti sadržaj dokumenta uvijek treba stajati pod istom predmetnom
odrednicom i uvijek u istom obliku!

načelo sinonimije – načelo nadzora sinonima (spolnost vs. seksualnost) - svi podaci o određenom predmetu okupljaju se na
jednom mjestu i kontroliraju jezikom za predmetno označivanje

načelo homonimije – (Antigona – mitološki / književni lik) - sprječava se ulaz irelevantnih podataka i povećava preciznost jezika za
predmetno označivanje, tj. homonimija se kontrolira tim jezikom

semantičko načelo – predmetne odrednice trebaju biti povezane prema odnosima jednakosti, hijerarhije i srodnosti
(paradigmatski odnosi)

sintaktičko načelo – upotrebljava se da bi se izrazile složene predmetne odrednice; sintaksa jezika za predmetno označivanje
treba povezivati elemente predmetne odrednice sintagmatskim, a ne semantičkim (paradigmatskim) odnosima

načelo dosljednosti – osigurava da svaka nova predmetna odrednica prihvaćena u jeziku za predmetno označivanje oblikom i
strukturom bude slična s usporedivim odrednicama koje već postoje u tom jeziku (velika i mala slova, zagrade, kratice)

načelo imenovanja – imena i nazivi mjesta moraju biti usuglašeni s kataložnim pravilima

načelo jamstva predloška – služi da bi se izrazio predmetni sadržaj dokumenta, rječnik jezika za predmetno označivanje treba se
dinamično razvijati na temelju jezične potvrđenosti, odnosno na osnovi predloška te sustavno integrirati unutar postojećeg
rječnika

načelo uvažavanja korisnika – služi da bi se izašlo u susret potrebama korisnika, rječnik jezika za predmetno označivanje treba biti
izabran tako da odražava trenutnu upotrebu jezika određene vrste korisnika, bilo općih ili specijalnih knjižnica

Načela primjene u praksi:

Izrada pravilnika za predmetnu obradu i upute za primjenu


23
Načelo specifične odrednice

41. Ima li Hrvatska nacionalni pravilnik za predmetnu obradu?


Nema, mnoge knjižnice imaju svoje interne pravilnike (ali ništa na nacionalnoj razini). Kada se pristupilo pripremama za
izradu pravilnika, ponuđena su dva rješenja:

 Oblikovanje PREDMETNE ODREDNICE na načelu jezične strukture prema sintaksi hrvatskog jezika
 Oblikovanje PREDMETNE ODREDNICE slaganjem utvrđenih kategorija predmetnih oznaka prema propisanom
redoslijedu.

OPIŠI STANJE PREDMETNOG OZNAČIVANJA U RH (POSTOJANJE PRAVILNIKA ZA PREDMETNO OZNAČIVANJE; RJEŠENJE ZA


IZRADU PRAVILNIKA.

Od 1951. izrađuje se predmetni katalog u Hrvatskoj. 1. (interna) pravila za upotrebu složenih predmetnih odrednica
napisana su 1980.

Kada se pristupilo pripremama za izradu pravila ponuđena su 2 rješenja:

- oblikovanje predmetne odrednice na načelu jezične strukture prema sintaksi hrvatskog jezika

- oblikovanje predmetne odrednice slaganjem utvrđenih kategorija predmetnih oznaka prema propisanom redoslijedu

Kod predmetnog označivanja u Hrvatskoj postoji problem slavenskih naroda, zbog neusuglašenosti naziva i problema s
dijakritičkim znakovima.

42. INDEKSIRANJE I ODNOS PRECIZNOSTI I ODZIVA U NIZU:


glazbala – puhačka glazbala – flauta

MT glazbala BT puhačka glazbala NT flauta ???

43. KOJI BI POJAM BIO POGODAN KAO DESKRIPTOR U


NAVEDENOM POJMOVNOM RASPONU I ZAŠTO?
mačka – kratkodlaka mačka – bengalska mačka

44. ONTOLOGIJE I FOLKSONOMIJE (protežnost vs. ekspresivnost)


(novi „igrači“ u indeksiranju)

Folksonomija

- skup svih oznaka koje dodjeljuju korisnici


- način označivanja u kojem korisnici sami dodaju oznake
- „primitivniji oblici“ – korisnici pišu svoje oznake
- korisnici koriste prirodni jezik – može doći do jezičnih fenomena (dvoznačnost, sinonimi, homonimi, dijalektalne
varijante, nije određen gramatički oblik – pr. imenice u jednini i množini)
24
- spadaju u slabe metode predstavljanja znanja

Primjer bi bio coolinarika gdje uz oznake koje označavaju vrstu jela tipa gulaš, juha ili namirnice koje se koriste za to jelo,
imaju i oznake poput fino, rođendan, Božić, Anin recept, koji zapravo ne koriste nikome osim osobi koja je osmislila tu
oznaku

Ekspresivnost vs. protežnost

- ekspresivnost - mjeri se brojem i specifičnošću paradigmatskih relacija (ako se pojavljuje više paradigmatskih veza
između pojmova – veća ekspresivnost)

- protežnost - kolika je domena znanja

Folksonomije ne sadrže paradigmatske veze između pojmova te je stoga njihova ekspresivnost NISKA, a protežnost
VELIKA (obuhvaćaju široku domenu znanja).

Paradigmatske veze su načini na koje su neki pojmovi povezani, dakle, radi li se o sinonimima, homonimima, jesu li
podređeni i nadređeni pojam, ili su to suprotni pojmovi

(Primjer za paradigmatsku vezu je jagoda – voće)

Tekst je o kolaču od jagoda, ali korisniku sad nije bitna činjenica da je jagoda voće, jer je to razumljivo samo po sebi, pa će
vjerojatnije staviti oznake tipa šlag, jaje koje nije moguće generalizirati i koje su vezane uz sam tekst (sintagmatske veze)

Ontologija

- vezane za semantički web (u računalnom okruženju)


- PUNO paradigmatskih veza (svi mogući složeni semantički odnosi da bi računalo moglo nešto zaključiti)
- paradigmatske veze koje su zastupljene u ontologijama su hiponimija, meronimija, ekvivalencija i određene,
specificirane asocijativne veze
- iz toga možemo zaključiti da su ontologije VISOKO EKSPRESIVNE
- ontologije obuhvaćaju usko područje znanja – NAJMANJA PROTEŽNOST

45. KATEGORIJE SUSTAVA ZA ORGANIZACIJU ZNANJA PREMA


HODGEU?

A) Popisi pojmova:
naglasak na zastupljenom pojmovlju te se uz popise pojmova obično javljaju definicije (RJEČNICI)

B) Klasifikacije i kategorizacije:
stavljaju naglasak na stvaranje predmetnih skupina (KLASIFIKACIJE)

C) Relacijski popisi:
naglasak na vezama između pojmova i koncepata (TEZAURUSI)

25
46. PREDMETNA OBRADA / PREDMETNI PRISTUP U
INTERNETSKOM OKRUŽENJU

- u internetskom okruženju nestaje problem prostornih ograničenja te svaki pojam odnosno kombinacija pojmova može
postati predmetna pristupnica

- dolazi do teorijske dvojbe postaje li bilo koja vrsta dodane informacije suvišna te može li dodatna informacija povećati
odziv ili preciznost (pojavljuje se problem transparentnosti sadržaja)

47. ISTRAŽIVAČKA TEŽIŠTA U PODRUČJU KORISNIČKOG


ISTRAŽIVANJA
a) obrasci tagiranja (korisnička istraživanja, navike označivanja, što iz tagova možemo saznati o korisnicima)

b) istraživanja o korisničkim oznakama (istraživanja na korpusu tagova; distribucije, frekvencije, kategorije oznaka itd.)

48. KOJI ČIMBENIK UTJEČE NA


KONZISTENTNOST/DOSLJEDNOST U OZNAČIVANJU?
Na dosljednost utječu sljedeći faktori: VELIČINA VOKABULARA (veći vokabular, manja konzistentnost; neizravno visoka
specifičnost, manja konzistentnost) I BROJ OZNAČITELJA (veća iscrpnost, manja konzistentnost). Potrebno je da se isti
predmeti označe istim terminima kako bi u katalogu bili okupljeni slični predmeti. To se u praksi pokazalo teško izvedivim
jer je konzistentnost obrnuto proporcionalna s iscrpnošću i specifičnošću.
ILI
Načelo dosljednosti jest šesto od devet načela za izradu predmetnog sustava. Odnosi se na velika i mala slova, zagrade i
kratice. Sklonost nedosljednosti imanentna je ljudskoj prirodi.

49. BROWSING (PREBIRANJE, PREGLEDAVANJE)


- pronalaženje informacija temelji se na interakciji korisnika s bazom informacijskog sustava

- mogućnost odabiranja pristupnica iz ponuđenog popisa

- odabir termina putem izbornika iz pojedinih polja = predlaže se kada korisnik ne zna točno što traži ili ne postoji
točan odgovor na njegov upit

POZITIVNE STRANE:
korisnici ne trebaju znati kako se točno koja riječ piše, a slijeđenjem veza može se naići na nešto zanimljivo ili korisno

50. PRIRODNI SUSTAVI ZA OZNAČIVANJE – KONTROLIRANI


SUSTAVI ZA OZNAČIVANJE
Prirodni sustavi za označivanje
- temelje se na riječima preuzetima iz same jedinice građe, a ne na terminima preuzetima iz nekog kontroliranog
sustava za označivanje (sve riječi koje se u dokumentu spominju potencijalni su termini za označivanje)

- u prirodnim sustavima ne postoje propisani načini oblikovanja termina


26
- osnovni problem prirodnih sustava su – sinonimija, homonimija, polisemija…

- uporaba prirodnog jezika povećava odziv, ali smanjuje preciznost, dok je s kontroliranim jezicima obrnuto
(PUNO nerelevantnih rezultata)

- U sustavima prirodnih jezika koriste se različite metode i tehnike pretraživanja – ključne riječi, kraćenje, Booleovi i
drugi operatori, rangiranja po relevantnosti itd. – no sve to može samo djelomično zamijeniti kontrolirane jezike

- Danas je najbolje rješenje KOMBINACIJA pretraživanja po prirodnim i kontroliranim sustavima (istodobno korištenje
tih sustava omogućeno je tek razvojem online sustava)

51. Koncepcije predmetne analize prema Hanne Albrechtsen, vrste


informacija i metode
Simplicistička koncepcija:

1. Promatra sadržaj kao objektivni entitet, koji može biti izveden kao izravni lingvistički izvodi iz dokumenta ili
sumirani poput matematičkih znakova
2. Prema ovoj koncepciji indeksiranje može biti u potpunosti automatsko
3. informacije koje se indeksiraju u predmetu su EKSPLICITNE INFORMACIJE
4. metoda indeksiranja je ekstrakcija.

Sadržajno-orijentirana koncepcija:

1. nadilazi površinsku leksičku ili gramatičku strukturu izvora


2. usredotočena je na sadržaje, a dokument promatra kao izolirani entitet
3. vrsta informacija u predmetu, koje se indeksiraju mogu biti i eksplicitne i implicitne, a metode su i ekstrakcija i
dodjeljivanje
4. Kritika: trivijalni deskriptori, nedostaju relacije prema teorijskim okvirima.

Zahtjevima orijentirana koncepcija:

1. dokumenti se stvaraju da bi priopćili znanje, a informacijski stručnjak analizira dokument s namjerom predviđanja
potencijalnih upita, potreba korisnika
2. zahtjevima orijentirana koncepcija se razvija komplementarno s razvojem sustava okrenutih krajnjim korisnicima
3. metoda indeksiranja koju koristi je metoda dodjeljivanja.

27

You might also like