2
RESUMO
O objetivo neste trabalho foi identificar o que é um agente de busca autônomo na
web
e o que ele deve procurar, como manipulá-lo e definir o que será catalogadopara alimentar a base de dados que futuramente será consultada. Desde umasimples URL (endereço de acesso a um arquivo na
web
) até uma imagem, pode-seextrair informações, depende do foco do negócio e das técnicas que foremutilizadas, como o uso das
tags
HTML ou de algoritmos de análise de textos. Todasas informações foram baseadas em acontecimentos e necessidades ao longo dacurta vida da Internet e das soluções já encontradas para os principais problemasque o seu grande e constante crescimento de conteúdo gerou. Concluí-se que as
meta tags
HTML são fundamentais nos controles dos robôs de busca e que asmesmas podem ser de grande ajuda na hora de fornecer informações sobre o seupróprio conteúdo. Já na área de imagens, novamente as
tags
HTML (agindo comoum conjunto) fornecem as informações necessárias sobre as imagens disponíveisnos hipertextos. Foram identificadas as visões que ocorreram no passado, atual eplanejamentos futuros. A motivação, além da curiosidade profissional, é oesclarecimento ao
webmaster
e usuários finais. A justificativa é espelhada nasempresas já estabelecidas que movimentam milionárias quantias de dinheiro nomundo e na Internet.
Palavras-chave:
crawler
, mecanismo de busca,
search engine
, catalogação,indexação,
tags
.
Add a Comment