Professional Documents
Culture Documents
SEMINARSKI RAD
PREDMET: INFORMATIKA I
TEMA: PRETRAŽIVANJE INTERNETA
Student: Asistent:
Lušija Elmana mr. Samir Lemeš
Seminarski rad 1
SADRŽAJ
I. UVOD......................................................................................................................... 2
1. ŠTA JE INTERNET?................................................................................................. 2
2. ISTORIJA RAZVOJA INTERNETA ....................................................................... 2
II. TEORETSKE OSNOVE PRETRAGE INTERNETA ........................................... 3
1. PRETRAŽIVANJE WWW ....................................................................................... 3
1.1. ŠTA JE TRAŽILICA? ..................................................................................... 3
1.2. ŠTA JE NAPREDNO PRETRAŽIVANJE?.................................................... 3
2. PRETRAŽIVANJE INTERNETA ......................................................................... 4
2.1. OSNOVE PRETRAŽIVANJA ........................................................................... 5
2.2. STRATEGIJA PRETRAŽIVANJA.................................................................... 6
2.3. REZULTATI PRETRAŽIVANJA...................................................................... 6
2.4. NAPREDNA PRETRAGA ................................................................................. 7
2.5. PRETRAGA SLIKA ........................................................................................... 8
3. ŠTA JE KOPERNIK I NJEGOVE VARIJANTE?....................................................... 8
4. WEB DIREKTORIJI................................................................................................ 10
5. RAZLIKE IZMEĈU WEB DIREKTORIJA POPUT ''WWW.YAHOO.COM'' I
TRAŽILICE ''WWW.GOOGLE.COM'' ......................................................................... 10
LITERATURA................................................................................................................ 12
I. UVOD
1. ŠTA JE INTERNET?
Nastanak i razvoj interneta je vezan za istraživanje tokom 60-tih kada je agencija ARPA
/ADVANCED PROJECTS AGENCY/ pod upravom Ministarstva odbrane u SAD
napravila raþunarsku mrežu. Nadalje tokom 70-tih dolazi sve više do povezivanja
univerziteta i institucija, a kako se i ukazala potreba i za standardizovanjem prenosa
podataka razvijen je TCP i IP. Nacionalna fondacija za nauku NSF je 1985. god. u SAD
formirala istu paralelnu mrežu NSFNET. Pošto su se superraþunari pokazali preskupom
varijantom stoga se 1995.g. prekida projekat, a mrežu su koristile komercijalne
organizacije za elektronsku mrežu i druge namjene. Izraz interneta prvi put se pojavio
1982. god. kad je DARPA pustila u opticaj internet protokol (IP). TIMOTHY
BERNERS – LEE, engleski nauþnik 1989. god. predstavlja WORLD WIDE WEB
(WWW) þija je namjena da pomogne komunikaciju izmeÿu ljudi na razliþitim
lokacijama.WWW je vršio revoluciju interneta meÿutim tokom ranih 90-tih znatno se
uveüava broj korisnika, zbog jednostavnog korištenja multimedijalnih dokumenata.
Izmeÿu 1993 i 1996. god. dramatiþno se promjenio naþin korištenja interneta.
WINDOWS
UNIX
INTERNET DOS
VMS
MACINTOSH OS
1. PRETRAŽIVANJE WWW
Tražilica je servis koji nam pomaže da na internetu lakše pronaÿemo sadržaje koje
tražimo. Pomoüu tažilice možemo pronaüi sve što nas zanima na internetu, na raznim
web stranicama, meÿu brojnim e_mail adresama u svijetu i sl. Dijelovi tražilice su polje
za upis izraza koji želimo naüi, pull down meni za odreÿivanje opsega pretraživanja i
tipka za poþetak pretraživanja.
Ukoliko želimo dobiti što taþnije rezultate pretraživanja trebamo koristiti napredno
pretraživanje. Naime, kada u pretraživaþ upišemo samo jednu rijeþ dobit üemo sve
stranice koje sadrže tu rijeþ. A kada u pretraživaþ upišemo izraz od više rijeþi dobit
üemo stranice koje sadrže bilo koju od upisanih rijeþi. Da bismo precizirali što tražimo
možemo upotrijebiti moguünost naprednog pretraživanja i s mnogo manje muke i truda
pronaüi željeni izraz. Od specijalnih znakova možemo upotrijebiti: '', +, -, *, i, ?.
- upotrebom navodnika kod upisivanja više rijeþi tražilica üe pronaüi samo stranice
koje sadrže rijeþi koje smo upisali i to taþno istim redoslijedom (npr. ako upišemo
zabavna glazba dobit üemo sve stranice koje sadrže rijeþi glazba i zabavna, dok
üe upit ''zabavna glazba'' rezultirati svim stranicama na kojima se rijeþ zabavna
glazba pojavljuje iskljuþivo tim redoslijedom.)
- upotrebom znaka ''+'' tražilica üe pronaüi sve stranice koje sadrže te rijeþi, ali bez
obzira na poredak (npr. upit ''glazba + zabavna'' dobit üemo sve stranice koje
sadrže ove dvije rijeþi.)
- upotreba znaka ''-'' nam omoguüuje da iz pretrage izbacimo stranice koje sadrže
neku rijeþ (npr. upitom ''glazba – zabavna'' dobit üemo sve stranice koje sadrže
rijeþ glazba a ne sadrže rijeþ zabavna.)
- upotreba znaka ''*'' nam omoguüuje da upišemo samo dio neke rijeþi , a ostalo
zamjenimo znakom ''*'' (npr. upit ''glazba*'' dat üe nam sve stranice koje sadrže
rijeþ glazba, glazbenik, glazbalo, i sl.)
- upotreba znaka ''?'' zamjenjuje bilo koji znak ili slovo u izrazu koji tražimo (npr.
upit ''?uha'' može rezultirati svim stranicama koje sadrže rijeþ juha, kuha, i sl.)
Postoji još i pretraživanje pomoüu Booleove algebre, logiþkog sistema koji je u 19.
stoljeüu predstavio matematiþar George Boole. Tri osnovna logiþka operatora
predstavljaju famelijarne engleske rijeþi AND, OR, NOT koje služe za tvorbu sintakse
naprednog pretraživanja.
AND - koristimo kako bi smo pretraživaþu naredili traženje dokumenta u kom se nalazi
više kljuþni rijeþi (kao rezultat upita javljaju se dokumenti koji sadrže date kljuþne
rijeþi),
OR – kao rezultat donosi najopštije odgovore pa je zbog toga postavljen kao osnovni
logiþki simbol veüine pretraživaþkih sistema (kao rezultat upita predstavlja sve
dokumente u kojem je sadržana bilo koja od navedenih rijeþi, pa þak i one koje nemaju
veze sa rijeþima ukljuþenim u sintaksu),
NOT – iskljuþuje odreÿene rijeþi iz traženog niza tj. funkcija mu je kao kod upotrebe
znaka ''-''.
2. PRETRAŽIVANJE INTERNETA
Od dana kada je nastao Internet (odnosno www – njegov najpoznatiji servis) znatno se
promijenio. Internet možemo opisati na mnoge naþine, ali poslije svega ostaje jedno –
da je to jedan ogroman, nepresušan izvor podataka i ako ga nauþimo koristiti, poboljšat
üemo kvalitet života, a kako je odliþna alatka za uþenje i izvrstan izvor svježih
informacija, pomoüu njega možemo dobiti vrlo znaþajne informacije i sl.
Ako se traži adresa na Internetu moraju se navesti rijeþi koje nas interesuju. Kada
pretraživaþ naÿe rijeþi koje su mu zadate, kao rezultat izbacit üe niz linkova sa adresama
na kojima se nalaze tražene rijeþi. U sluþaju kada se pretražuje Internet, korisnik mora
sam uraditi to FILTRIRANJE INFORMACIJA. U principu, pretraživanje Interneta
mogli bismo svesti na nekoliko faza:
a) Prvo što se radi jeste da odemo na neku stranicu koja sadrži pretraživaþ.
Najpoznatiji su ''WWW.HOTBOT.COM'', ''WWW.YAHOO.COM'',
''WWW.ALTAVISTA.COM'' i sl. Zatim u polje za unos upišemo kljuþne rijeþi
koje želimo da pretraživaþ naÿe i kliknemo na tipku ''SEARCH''.
b) Drugo što radimo je probijanje kroz linkove koje dobijemo kao rezultat klika na
''SEARCH''. U ovoj fazi odluþujemo koje üemo linkove slijediti a koje ne, te se
tako vrši svojstveno filtriranje informacija.
c) Treüe što se radi je pregledavanje stranica na koje smo otišli i konstatovanje da li
smo našli ono što smo tražili ili ne. Takoÿer, može se poboljšati naše traženje na
Internetu i smanjiti vrijeme potrebno da se naÿu informacije i to prvo kucamo
''WWW.GOOGLE.COM'', zatim kada dobijemo veliki broj linkova gledamo opis
ili obiþno na dnu prozora vidimo adresu i kliknemo na rijeþ ili dvije koje üe nam
reüi da bi to moglo biti mjesto koje tražimo. Kada smo kliknuli na link i stranica
se uþitala onda tražimo ono što nam treba. Ovo su samo savjeti pomoüu kojih
možemo pri traženju raznoraznih stvari uštediti malo svog vremena.
Najþešüe neüemo iz prvog pokušaja dobiti web sajt na kojem se nalazi ono što tražimo.
Zato je bitno znati þitati i analizirati dobijene rezultate, pošto iz njih možemo saznati
gdje smo pogriješili i šta još trebamo dodati. Ponovo üemo se fokusirati na Google, koji
i u ovom segmentu prednjaþi u odnosu na ostale . Google prikazuje po deset rezultata na
jednoj stranici, pri þemu üe odgovarajuüe web stranice biti meÿu prvih 30 izlistanih.
Broj prikazanih rezultata možemo podesiti na linku PREFERENCES, koji se nalazi u
samom vrhu stranice s rezultatima, kao i jezik kojim nam se Google ''obraüa'' (podržano
je preko 80 jezika). Svaki link sastoji se iz:
x NAZIVA SAJTA (A), koji ponekad može biti samo URL tog sajta (kada stanica
nema naziva ili nije potpuno indeksirana);
x ISJEýKA IZ DIJELA TEKSTA NA STRANICI (B) (gdje je traženi termin
pronaÿen),
x KATEGORIJE u kojoj je taj sajt katalogiziran (D),
x URL (E),
x CASHED (F) ,
x SIMILAR PAGES (G).
U suštini uvijek je stvar do pravilno definisanog termina za pretragu.
bilo gdje na stranici, URLOW ili u linkovima koji vode do nje. Ponekad treba probati i
ovaj naþin, jer se u linkovima na nekoj stranici može nalaziti rijeþ koja odreÿuje traženi
termin, pa prateüi taj link se može doüi do stranice s rezultatima. Još jedna zanimljiva
opcija, posebno za nas, je pretraga unutar sajtova, odnosno domena (E). Pomoüu ove
opcije se može uraditi i suprotno tj. zabraniti prikaz rezultata s odreÿenog sajta, odnosno
domena. Postoje još dvije zanimljive moguünosti: da Google prikaže sve sliþne stranice
(F) odnosno sve stranice koje imaju link na neku stranicu (G) i može se koristiti za
pronalaženje veüeg broja sajtova koji pišu o nekoj temi. Postoji naþin da sve ove
pretrage izvršimo i direktno iz polja za pretrage – korištenjem operatora (izmeÿu
operatora i rijeþi koja ga slijedi ne ostavlja se prazan prostor). Operatori za naprednu
pretragu su: LINK, INFO, SITE, ALLINTITLE, INTITLE, ALLINURL i FILETYPE.
Google nije najbolji samo u pretraživanju teksta, nego nudi i pretragu slika
(indeksiranih preko 390 miliona slika). Ovome segmentu sajta pristupa se direktno sa
prve stranice ili iz Google Toolbar-a.
a) Kada unesemo željeni pojam, dobit üemo prikazane umanjene verzije
indeksiranih slika,
b) Klikom na neku od njih vodi nas na stranicu na kojoj je ta slika upotrijebljena,
c) Zatim, kliknemo na link koji pokazuje samo tu sliku u punoj veliþini na posebnoj
stranici.
Postoje takoÿer napredne opcije prilikom pretrage slike, koje omoguüavaju da odredimo
veliþinu slike koja nas interesuje i boju, ali mogu ograniþiti pretragu i na odreÿeni
domen ili web sajt.
- COPERNIC 2000
Omoguüava korisniku da, komuniciranjem najboljih pretraživaþkih mašina, pronaÿe
taþno ono što se traži. Snaga programa krije se u šest kategorija koje pretražuju 55
pretraživaþkih mašina. Inteligentni filter za pretragu eliminiše sve duple informacije
(ponavljanje dokumenata). Kao rezultat pretrage nudi veoma ''prihvatljive'' linkove.
4. WEB DIREKTORIJI
Web direktoriji su vrsta tražilica koja nam omoguüuje lakšu pretragu traženih pojmova,
ali danas je meÿu njima manja razlika nego ranije. Tako ''yahoo'' pokušava organizirati
web, tj. indeksirane stranice, djeleüi ga u teme i podteme kao što su: umjetnost, nauka,
posao i sl. Ukoliko na Internetu tragamo za nekom informacijom potrebno je prvo otiüi
na Yahoo ili neki drugi web direktorij. Tako ako nam je potrebna neka informacija, a
nemoguüe je pregledati sve knjige da bi se do nje došlo, potrebno je samo otiüi na
Google pretraživaþ i unijeti podatak koji nam je potreban (npr. virusi). Pri traženju tog
podatka pretraživaþ koristi softver koji automatski slijedi sve linkove od jednog
dokumenta do drugog. Kada otkrije sajt, on šalje informaciju svom glavnom sajtu za
indeksiranje tj. vrši katalogizaciju tog sajta i izbaci na ekran sve informacije koje su
vezane za uneseni podatak. Ali pošto se obiþno kao rezultat pretrage vraüa previše
informacija mi tražimo samo onaj podatak koji je nama potreban. Ponekad se takoÿer
može desiti da uopšte nema rezultata, ali isto tako možemo otkriti da neki od podataka
koji pretražujemo imaju i neko drugo nama nepoznato znaþenje.
Danas je meÿu njima manja razlika nego ranije, jer veliki broj ''search-engine'' je izradio
velike kataloge u namjeri da pomognu našu pretragu. Yahoo pokušava organizirati web
(indeksirane stranice) djeleüi ga u teme i podteme poput: umjetnost, nauka, posao,
zabava i sl. Ukoliko Internetom tragamo za nekom informacijom iz opštih kategorija
potrebno je prvo otiüi na Yahoo ili neki drugi web direktorij. Promatrajmo web
direktorij kao indeks koji nam omoguüuje da pronaÿemo posebnu rijeþ ili frazu.
Obiþno se kao rezultat pretrage vraüa previše rezultata, ili možemo otkriti da rijeþ
kojima pretražujemo imaju i neko drugo nama do tada nepoznato znaþenje a ponekad
uopšte nema rezultata.
Najþešüe korištene tražilice na Net-u su:
LITERATURA
4. http://doxy.phy.hr./~bit/BIT_Inteligentni-roboti/pretrazi.html