You are on page 1of 5

Mreni izvori informacija

(resursi)
Pronalaenje informacija
na INTERNETU

Informacije se publiciraju pomou razliitih mrenih


usluga i servisa:
WWW
Gopher
FTP arhive
distribucijske liste
mrene novine
elektronika pota
imeniki servisi (netfind, whois++, X.500)
baze podataka dostupne putem mree
...

Pretraivanje mrenih
resursa
pretraivanje mrenih resursa
=
pronalaenje sadraja publiciranih na mrei
(elimo nai informaciju i najpogodniji nain
pristupa)

Pretraivanje mrenih
resursa
Obavlja se odgovarajuim sustavima
(alatima)
Mnotvo je razliitih sustava (alata)
Gotovo svi imaju www suelje
Doseg pretraivanja
Globalni
Lokalni

Nema savrenog niti sveobuhvatnog

Web informacijski
prostor

Pretraivi Web

Veljaa 1999., Lawrence i Giles, NEC Institute


800 miljuna stranica
Sadraj: 83% com, 6% sci/edu, 1.5% porn
60% Weba je indeksirano
Sijeanj 2000., Inktomi & NEC Institute
Vie od 1 miljarde Web stranica
Vrne domene: 55% com, 8% net, 4%org, 1%gov
kraj 2000. godine vie od 2 milijarde web stranica dostupnih
na internetu
7 milijuna stranica nastaje svaki dan
svakih 8 mjeseci broj dokumenata na internetu se
udvostruuje

Sustavi za pretraivanje
Weba
Trailice (pretraivaki mehanizmi)
Trailice (search engines)
Metatrailice (metasearch engines, unifed serach
interfaces)

Tematski katalozi
U pravilu pretraivi

Ostali sustavi
Arhive programa, traenje ljudi i mail adresa, traenje slika,
specijalizirana suelja, pristupa bazama podataka, elektroniki
rjenici, ..

Portali

Pretraivaki mehanizmi
to su i kako rade?
Automatizirani sustavi koji prikupljaju informacije o
mrenim resursima i omoguuju pretraivanje
prikupljenih informacija
Prikupljanje informacija obavljaju posebni programi roboti (robot, crawler, spider)
robot pregledava dostupne mrene resurse (WWW
dokumente)
gradi pretraivu kolekciju podataka (bazu podataka)
provjerava aurnost izgraene baze podataka i
obnavlja njen sadraj
WWW suelje omoguuje korisniku pretraivanje baze
podataka (database search, index search)

Pretraivaki mehanizmi

Pretraivaki mehanizmi
to su i kako rade? (2)
pretraivaki
mehanizam
baza
podataka

Pretraivaki mehanizmi
Postavljanje upita
Sintaksa upita i spektar mogunosti ovisi o alatu
(postoji standardni spektar mogunosti)
Mogu je izbor resursa koje pretraujemo
(www ili neki drugi resursi; itavi dokumenti ili
samo naslovi, ...)
Korisno je pri prvom susretu s nekim alatom
proitati raspoloive upute
Primjeri: (Alta Vista,Google)
training
Internet training

robot

http:// ...




Pretraivaki mehanizmi

to su i kako rade? (3)


Upit se postavlja upisivanjem u odgovarajuu formu
Osim jednostavnog pretraivanja po zadanoj kljunoj
rijei ili frazi mogue je postaviti i sloenije upite
Rezultat pretraivanja osim URL adresa moe
sadravati i dodatne informacije
Mogua je kontrola ispisa razultata pretraivanja
Izgled suelja i mogunosti pretraivanja ovise o
konkretnom alatu (pretraivakom mehanizmu)

WWW
dokumenti

Primjeri
Alta Vista - http://www.altavista.com/
Google- http:// www.google.com/
InfoSeek - http://www.infoseek.com/
WebCrawler http://www.webcrawler.com/
Lycos Search - http://www.lycos.com/
HotBot - http://www.hotbot.com/
Veina potrala ima i trailicu.

Pretraivaki mehanizmi
Postavljanje upita (2)
uporaba malih i velikih slova
James Maxwell
Montreal

vieslone kljune rijei


James Maxwell
Trai James ILI Maxwell (Altavista)
Trai james AND Maxwell (Google)
uporaba fraza
James Maxwell
NASA Space shuttle program

uporaba logikih operatora (AND, OR, AND NOT) (Altavista)


James AND Maxwell
fruit AND NOT apple
Internet training AND search engines

Pretraivaki mehanizmi
Postavljanje upita (3)
uporaba logikih operatora ( OR) (Google)
vacation london OR paris
Trai podatke o odmoru u Londonu ili Parizu

kontrola kljunih rijei (+, -)


+film +noir
+python -monty
Stara sintaksa na Altavisti, ali jo radi, nova na
http://www.altavista.com/sites/help/adv_search/syntax

Pretraivaki mehanizmi
Postavljanje upita (5)
Izbor (kontrola) resursa (Alta Vista)
o title:Internet training
o title:Internet training +domain:uk
o text:James Maxwell

Susjednost (Alta Vista)


o Internet NEAR training

Pretraivaki mehanizmi
Prednosti i mane
Prednosti:
veliki opseg
efikasno pretraivanje i pristup informacijama
automatiziran rad
Mane:
nema kontrole kvalitete
nema klasifikacije
rezultati mogu biti izvan konteksta (npr. film)
sadre i zastarjele i nepostojee URL adrese
sadre i smee

Pretraivaki mehanizmi
Postavljanje upita (4)
Google u pretraivanju ignorira rijei tipa where,
how i sl.
Ako se ele ukljuiti ispred njih se stavlja znak +
Star Wars Episode +I
Za pretragu Star Wars Episode I

Znak (-)
python -monty
Pomo na Google
http://www.google.com/intl/hr/help/refinesearch.html

Pretraivaki mehanizmi
Vane odlike
Baza podataka (veliina, aurnost, puni tekst
dokumenata, sloenost)
Mogunosti postavljanja (sloenih) upita
(boolean search, proximity search, ...)
Brzina rada (odziv)
Rangiranje rezultata (results ranking)
Kvaliteta ispisa (saetak, datum nastanka dokumenta, ...)
Mogunost kontrole ispisa

Tematski katalozi
to su i kako rade?
tematski organizirane kolekcije podataka o odabranim
mrenim resursima
(odabrani resursi klasificirani po temama)
sadre URL adrese mrenih resursa
mogu sadravati i nazive resursa, saetke, ...
ne odravaju se automatski (programski) ve se
temelje na radu urednika
klasificiranje resursa se odvija prema hijerarhijskoj
shemi tema (podruja)
nain klasificiranja nije unificiran
(UDC, Dewey, proizvoljan ...)
postoji mogunost pretraivanja kataloga

Tematski katalozi

Tematski katalozi

Primjeri

Vane odlike

Yahoo - http://www.yahoo.com
DMOZ - http://dmoz.org/
EINet Galaxy - http://galaxy.einet.net/
Clearinghouse - http://www.clearinghouse.net
Hrvatski homepage http://www.hr

veliina (broj klasificiranih resursa)


tematsko stablo - nain klasifikacije
dodatne informacije o resursima
rangiranje resursa
mogunost pretraivanja
veze s pretraivakim mehanizmima
dodatne mogunosti

Tematski katalozi

Ostali sustavi

Prednosti i mane
Prednosti:
klasifikacija resursa po temama (podrujima)
mogunost internog pretraivanja kataloga
nema smea
Mane:
manualno odravanje
pojedine dijelove kataloga ne ureuju
profesionalci
sadre i zastarjele infromacije

Ostali sustavi

Viestruka suelja (multiple search interfaces)


jednostavna suelja koje korisniku omoguuje da na
jednom mjestu odabere pretraivaki mehanizam koji
e koristiti
nemaju vlastite baze podataka niti robot program
primjeri:
Easy Searcher - http://www.easysearcher.com/
Lukol http://www.lukol.com

Ostali sustavi

Posebno organizirana suelja prema


(WWW) resursima

Specijalizirana suelja (Information gateways)


primjeri:
OMNI - http://www.omni.ac.uk/ (Medicina i zdravlje)
SOSIG - http://sosig.ac.uk/ (Drutvene znanosti, pravo)
HERO - http://www.hero.ac.uk/ (Obrazovanje)
AstroWeb http://www.stsci.edu/astroweb/astronomy.html
Informacijski sustav prirodoslovlja http://prirodo.irb.hr/

Specijalizirana suelja (information


gateways)
prednosti:
korektno klasificiran sadraj uvijek u kontekstu
mogue pretraivanje
mane:
vezani uz jednu temu (podruje)
manualno odravanje

Ostali sustavi
Elektroniki rjenici (Dictionaries, Thesauruses)
WWW suelja prema elektronikim rjenicima
mogue pretraivanje

primjeri:
Webster - http://www.m-w.com/netdict.htm
FOLDOC - http://wombat.doc.ic.ac.uk/

Ostali sustavi
pretraivanje kolekcija (baza) podataka
Inivisible Web - http://www.invisibleweb.com/
Lycos Seach. DB - http://dir.lycos.com/Reference/Searchable_Databases/
INFOMINE - http://infomine.ucr.edu/
Terraserver - http://terraserver.com/

i ...
rjenici, enciklopedije, vodii, pretraive kolekcije
multimedijalnih sadraja, .

PORTALI

Ostali sustavi
Arhive programa
www.tucows.com
http://tucows.vdu.hr/
(Hrvatski mirror)

www.zdnet.com
www.download.com
Traenje ljudi i mail adresa
www.bigfoot.com
Traenje slika
www.ditto.com

Portali

http://www.klik.hr/
http://www.monitor.hr/
http://www.hej.hr/
http://www.hinet.hr/
http://www.vip.hr/
http://www.vidi.hr/
http://www.index.hr/
http://www.iskon.hr
...

Portali

ulaz u informacijski prostor Interneta


hibridni alat - pravo rjeenje
nude pristup (svim) mrenim servisima na jednom mjestu
temelje se na pretraivakom mehanizmu i/ili tematskom
katalogu
opi ili specijalizirani (tema ili interesna skupina)
http://cnn.com/
http://www.excite.com/
http://www.altavista.com/
http://www.yahoo.com/
http://www.ihlth.com/
http://www.digitalessays.com/
...

You might also like