Proiect cofinanţat din Fondul Social European prin Programul Operaţional Sectorial Dezvoltarea Resurselor Umane 2007 -2013

„ Investeşte în oameni!”

2.4 Motoare de cautare
Conf.univ.dr.ing. Catalin Gheorghe Amza

.com Yahoo Google bing Altavista Lycos MSN Search Ask Jeeves Cnet Search.askjeeves.2 Motoare de căutare Adresa Numele httpî//www.) şi frecvenţa de apariţie a acestora în document.yahoo. utilizatorul trebuie să introducă nişte cuvinte care pot să fie cuvinte cheie sau nu.com Aceasta este singura modalitate prin care o pagină de web poate fi inclusă în baza de date a unui motor de căutare. Câteva dintre acestea sunt menţionate în Tabelul 2. trebuie explicat procesul de creare a respectivului motor de căutare. acesta este constituit dintr-una sau mai multe baze de date şi de mecanisme de consultare a acestora. Motorul de căutare realizează apoi o căutare în bazele sale de date. În vederea explicării felului în care se pot folosi motoarele de căutare. Acest proces de căutare este dependent de modul în care paginile de web sunt indexate.msnsearch. Pentru obţinerea de informaţii. Căutarea poate fi la rândul ei realizată în mai multe moduri: . motorul de căutare Yahoo are baza de date împărţită în domenii.lycos.indexarea după cuvinte cheie – care se face în funcţie de localizarea (titlu. .search.bing. Tabelul 2.com httpî//www. Baza de date nu este constituită prin consultarea periodică a Internetului şi a adăugării în aceasta a paginilor web nou create. În principal.căutare după cuvinte cheie – căutarea se realizează cercetându-se baza de date folosindu-se cuvinte cheie.com httpî//www. Există astfel: .com httpî//www.4 Motoare de căutare (Search Engines) Motoarele sau instrumentele de căutare sunt programe specializate în obţinerea de informaţii.2. fiecare proprietar al unei pagini de web are posibilitatea să trimită adresa paginii sale de web împreună cu nişte cuvinte cheie care o caracterizează şi cu o scurtă descriere către motorul de căutare respectiv. iar lista cu paginile de web care cuprind respectivele cuvinte cheie sau se aproprie de acestea sunt afişate pe ecran. plasându-le astfel în baza de date corespunzătoare. .com httpî//www.altavista.indexarea umană – în care anumite persoane examinează paginile şi selectează cele mai potrivite cuvinte cheie şi fraze care le caracterizează. .google. Astfel. fiecare cu alte subdomenii. proces practic imposibil din punct de vedere al diversităţii şi al numărului mare de pagini de web existente.2.51. De exemplu. rezumat etc.căutare arborescentă – în care se porneşte de la un domeniu general şi se continuă căutarea într-o succesiune de alte subdomenii.com httpî//www.com httpî//www. aşa cum se vede din Figura 2. Acesta analizează pagina respectivă şi o include sau nu în baza sa de date în funcţie de tipul.com httpî//www.indexarea totală – care se face prin includerea fiecărui cuvânt din pagina de web respectivă într-o baza de date. corectitudinea şi calitatea acesteia.

folosirea ghilimelelor presupune găsirea unui text în acelaşi format cu cel specificat în interiorul ghilimelelor.49. în general. căutarea se realizează cu ajutorul cuvintelor cheie. 2. Paginile principale ale câtorva motoare de căutare sunt prezentate în figurile 2.combinaţie între cele două metode de căutare prezentate anterior – în care la fiecare nivel (domeniu sau subdomeniu) se poate realiza o căutare după cuvinte cheie (Figura 2. . .52. De asemenea. Se poate observa că toate acestea au în comun o casetă de text în care utilizatorul poate introduce textul după care se face căutarea. De exemplu. a paginilor web care conţin doar cuvântul ziarul şi a paginilor web care conţin doar cuvântul Adevarul.50. Acest text poate fi format din cuvinte cheie sau fraze. 2.semnul “-“ în faţa unui cuvânt cheie înseamnă că acesta nu trebuie să apară în textul paginii căutate. . Căutarea specificată prin: +ziarul +adevarul va genera o listă a paginilor care conţin cuvintele ziarul şi adevarul. căutarea specificată prin: +“ziarul Adevarul” +cotidian va genera o listă a paginilor care conţin fraza ”ziarul Adevarul” şi cuvântul cotidian.51).51 şi 2. utilizatorul poate folosi următoarea convenţie: semnul “+” în faţa unui cuvânt cheie înseamnă că acesta trebuie să fie inclus în pagina web căutată. Pentru aceasta. căutarea specificată prin: Ziarul Adevarul va genera ca rezultat o listă a paginilor web care conţin cuvintele ziarul şi Adevarul.

50 Pagina principală a motorului de căutare Yahoo .Figura 2.49 Pagina principală a motorului de căutare Altavista Figura 2.

procesul de căutare folosind un motor de căutare este dependent în mare măsură de persoana aflată în faţa calculatorului. Cineva fără experienţă ar putea să facă căutarea folosind cuvintele . Astfel.Figura 2.52 Pagina principală a motorului de căutare Google Un motor de căutare afişează o listă a paginilor care se potrivesc cu criteriile de căutare.51 Domeniile din motorul de căutare Yahoo Figura 2. De exemplu. de modul în care aceasta reuseşte să exprime clar şi concis ceea ce caută. să presupunem că se caută paginile care conţin poezii ale lui Mihai Eminescu. dar aceasta poate conţine şi link-uri către pagini care nu au legătură cu subiectul căutat. adresele cu probabilitatea cea mai mare sunt plasate primele în listă. Astfel. listă ce conţine legături către paginile corespunzătoare. de experienţa acestuia şi de motorul de căutare ales. Paginile sunt listate în funcţie de probabilitatea cu care conţinutul acestora coincide cu criteriile de căutare.

De aceea.53 Rezultatele căutării pentru motorul de căutare Google . rezultatele obţinute diferă în funcţie de motorul de căutare ales. însă aceasta va genera o listă imensă. o căutare optimă ar putea fi specificată astfel (Figura 2. care cuprinde toate paginile de web care conţin vreo referire la Mihai. Figura 2. Nici căutarea specificată prin +Mihai +Eminescu nu ar duce la rezultatul dorit pentru că lista generată va conţine toate paginile de web care fac vreo referire la Mihai Eminescu şi nu neapărat la poeziile acestuia.53): +”Mihai Eminescu” +poezii Bineînţeles. Eminescu sau Mihai Eminescu.cheie Mihai Eminescu.

Sign up to vote on this title
UsefulNot useful