Professional Documents
Culture Documents
Resumo
Este artigo explora as preciosas mais valias que o cenário emergente da
Convergência nos Media apresenta na pesquisa e recuperação de informação
bibliográfica ou científica. Enquanto a integração de informação lida com a pesquisa e
recuperação de diferentes fontes de modo a entregar dinamicamente essa informação ao
utilizador, de uma maneira uniforme e integrada, a Inteligência Colectiva constitui uma
preciosa mais valia que a componente participativa pode trazer a este processo, pelos
seus contributos para o fluxo “Dados Informação Conhecimento Sabedoria”.
Esta segunda vertente é analisada em mais detalhe, identificando-se os benefícios que
apresenta, mas também possíveis pontos fracos; numa segunda secção do artigo são
apresentados dois casos de estudo que representam o melhor que se faz ao nível de cada
uma das vertentes mencionadas, no contexto dos sistemas de informação bibliográfica.
Sobre este artigo: o presente estudo baseia-se no trabalho desenvolvido no âmbito da unidade curricular
“Culturas de Convergência nos Média”, da responsabilidade dos docentes Prof.ª Doutora Lídia Oliveira
Silva (Universidade de Aveiro) e Prof. Doutor José Azevedo (Universidade do Porto), a quem o autor
encarecidamente agradece por terem sensibilizado para as importantes mais valias associadas aos media
participativos e à Inteligência Colectiva. Esta disciplina teve lugar em Novembro e Dezembro de 2008,
como parte curricular do Programa Doutoral em Informação e Comunicação em Plataformas Digitais
(doutoramento conjunto da Universidade de Aveiro e da Universidade do Porto).
1 Termo cunhado em 2004 por Thomas Vander Wal na resposta a Gene Smith quando este perguntou aos
membros da lista de distribuição do AIfIA (“Asilomar Institute for Information Architecture”) sobre o
que assumem ambos os papéis de produtores e consumidores de informação, a
possibilidade de descreverem documentos com cabeçalhos de assuntos, marcadores ou
tags (termo original em inglês), sem obedecer a regras específicas de indexação. Dada a
sua natureza, uma indexação feita com base em folksonomias (também chamada de
“social tagging”) apresenta uma série de vantagens, mas também um vasto conjunto de
problemas que deve ser tido em conta, aquando da sua adopção.
Na verdade, tal como Isabella Peters e Wolfgang Stock defendem (Peters e Stock,
2007: 3), este tipo de indexação não deve ser considerado como uma classificação, pois
as tags não possuem qualquer tipo de notação ou relações entre si. Não deixa contudo
de ser uma indexação, que usa termos não controlados (Furnas et al., 2006; Peters,
2007, citados por Peters e Stock, 2007: 5) e que não obedece a um vocabulário
estruturado. Efectivamente, a sua proliferação e crescimento exponencial deve-se a tal,
isto é, a não haver uma base de autoridades ou alguém que controle a terminologia
usada, quer pelos criadores dos documentos, quer pelos consumidores dos mesmos.
Seria impensável exigir a estes “indexadores” (os referidos “prosumers), voluntários
num ambiente colaborativo na sua quase totalidade, que seguissem determinadas
normas ou que aprendessem a nomenclatura, organizada hierarquicamente, própria de
um determinado controlo de autoridades.
Por outro lado, o elevado dinamismo de algumas matérias, propício a um frequente
aparecimento de novos termos, é melhor “acompanhado” com uma indexação que não
esteja restrita a um vocabulário controlado ou estruturado, sendo que o aumento e
actualização (melhoria, de um modo genérico) de um dicionário ou controlo de
autoridades com vocabulário controlado pode beneficiar destas folksonomias. Vander
Wal (2004) avança que “as tags, a sua frequência e distribuição são fontes para novos
termos controlados, para modificações de alguns termos já existentes no vocabulário ou
mesmo extinção de alguns conceitos”, isto seguindo a lógica de uma “categorização
bottom-up” (ibid., citado por Peters e Stock, 2007: 18). Isto é, enquanto na construção
clássica de um vocabulário controlado, controlo de autoridades, se segue uma
categorização “top-down” (do mais genérico para o mais específico), o enriquecimento
deste vocabulário alimentado por folksonomias é feito dos termos específicos (tags),
que achavam do fenómeno da "Social Tagging" e desta “classificação”; resposta colocada à posteriori no
seu blog, Atomiq (http://atomiq.org/), em 3 de Agosto de 2004 (Smith, 2004).
2 Termo cunhado por Alvin Toffler em 1980 na sua obra “A Terceira Onda“ (Toffler, 1980).
agrupando-as ou colocando-as hierarquicamente dentro de uma categoria ou termo mais
genérico, numa determinada ontologia específica (categorização “bottom-up”, do mais
específico para o mais genérico).
A “liberdade” de se usar uma indexação que não esteja restrita a um vocabulário
controlado, tem contudo um preço, não devendo este ser imputado às tags em si, mas
sim ao comportamento dos “prosumers” (Shirky, 2004, referindo-se à falta de precisão
na atribuição de tags): nas folksonomias o mesmo termo pode ser encontrado em
diferentes formas (exemplo: singular / plural ou abreviaturas), não existe controlo de
sinónimos ou homónimos e erros ortográficos ou de digitação são muito frequentes. De
acordo com um estudo efectuado em 2006 e apresentado no artigo “Foksonomies:
Tidying up tags?”, publicado na revista científica “D-Lib Magazine” (2006, vol. 12, nº
1), cerca de 40% das tags presentes no Flickr, um serviço online de gestão e partilha de
fotos (Butterfield e Fake, 2004), e 28% das do Del.icio.us (actualmente “Delicious”),
um serviço online de “Social Bookmarking” (Schachter, 2003), “estavam ou mal
escritas, com termos de uma língua não disponível no software, codificadas de um
modo não entendido pelo dicionário do software, eram palavras compostas, construídas
a partir de duas ou mais palavras ou como uma mistura de termos de vários idiomas”
(Guy e Tonkin, 2006, disponível em http://www.dlib.org/dlib/january06/guy/
01guy.html).
Mesmo que nenhum dos casos mencionados acima ocorra, a indexação de um
determinado documento, tags atribuídas, pode ser considerada como a não “mais
correcta” para uma elevada percentagem de outros “prosumers”. E a razão para tal
acontecer, quer as ocorrências relatadas no estudo, quer a não revisão dos restantes
“prosumers” na indexação atribuída pelos “prosumers” anteriores, deriva de um único
facto, muito simples. Na verdade, esta razão facilmente se identifica quando se
contextualiza este tipo de indexação, nomeadamente o momento em que a mesma é
efectuada e qual a sua razão (porque é atribuída): a atribuição de tags a um determinado
documento é feita na sua esmagadora maioria de acordo com os interesses pessoais de
cada “prosumer”. Isto pode ser facilmente verificado, analisando algo tão simples como
a motivação para a atribuição de tags. Efectivamente, Golder e Huberman (2006),
defendem que “uma quantidade significativa da indexação com tags, se não toda, é feita
para uso pessoal e não para benefício público” (isto é, não é motivada pelo interesse que
possa ter para a descoberta desse documento pela comunidade). Tal comportamento
pode variar de acordo com o serviço, sendo que um bom exemplo ocorre num dos
serviços mencionados anteriormente, Del.icio.us (e daí talvez a razão dos 28% de tags
não “correctas” encontradas no estudo atrás mencionado, neste serviço).
Efectivamente, temos que considerar 3 tipos de indexação, associados aos 3
diferentes grupos de actores que podemos ter no contexto da criação, disponibilização e
utilização de um determinado documento: do(s) autor(es), dos indexadores profissionais
(interpretes do documento) e dos utilizadores. Isabella Peters e Wolfgang Stock (Peters
e Stock, 2007: 17), citando Kipp (2006), propõem o esquema apresentado na figura 3
como uma interpretação de como estes 3 tipos de indexação se intrusão à volta do
documento, nos diferentes contextos (“environment”).
ontologia
classificação
thesaurus
actor:
interprete
documento
actor: actor:
utilizador autor
análise do texto
folksonomias integral/citação
contexto
------------------------------------------------------------------------------------------------------------------------------------
Figura 3: Google Books - imagem reduzida da capa, resumo, links para serviços
associados, para a adição à biblioteca do utilizador e para a classificação
e escrita de uma critica desta obra (©2009 Google)
Figura 5: Google Books - passagens presentes noutros livros e críticas encontradas na net
(©2009 Google)
A secção seguinte é relacionada com esta e alimentada quer pelo motor de pesquisa
do Google para páginas Web (páginas Web que fazem referencia a esta obra, blogs
incluídos), quer pelo Google Scholar (“Google Académico” para Portugal), com a
relação de artigos ai presentes que referenciam a obra em questão. De notar que para
efectuar tal ligação o Google Scholar analisa e indexa o texto integral do artigo e não
apenas os dados presentes no registo do mesmo como a informação relativa ao autor,
título, ano, palavras-chave ou resumo.
Figura 6: Google Books - páginas Web e artigos no Google Scholar que referenciam esta obra
(©2009 Google)
Figura 8: Google Books – locais mencionados na obra, com as passagens onde os mesmo são referidos e
links para as respectivas páginas (©2009 Google)
Toda a contribuição para esta “informação social” relativa a uma determinada obra
pode ser dada por cada utilizador quando a adiciona à sua biblioteca, como por exemplo
atribuir tags, classificar ou escrever uma crítica.
3. Conclusão
Componentes web 2.0 e o ambiente participativo e colaborativo associado ao seu
uso podem ajudar no enriquecimento de sistemas de pesquisa e recuperação de
informação, promovendo a Inteligência Colectiva pela partilha do conhecimento,
avaliando os recursos encontrados, de modo a que os utilizadores seguintes, ao
efectuarem uma pesquisa semelhante, obtenham em primeiro lugar os resultados mais
pertinentes (ciclo “Encontrar Avaliar Compreender Partilhar”). Se incluirmos
nesses sistemas uma componente de agregação de conteúdos, preferencialmente usando
algoritmos inteligentes de recuperação de informação relacionada, pode-se dotar os
utilizadores de um ponto de pesquisa rico em conteúdos, quer por ser um agregador de
várias fontes, quer pela sua componente participativa/colaborativa, com possíveis mais
valias na criação e identificação de comunidades de utilizadores com interesses comuns.
4. Referências Bibliográficas
Butterfield, Stewart e Caterina Fake (2004). Flickr - Compartilhamento de fotos [em linha]. [Consult.
15/03/2009]. Disponível em WWW:<URL:http://www.flickr.com/>;
Ex Libris (2008). Ex Libris the bridge to knowledge, Aleph [em linha]. [Consult. 15/03/2009].
Disponível em WWW:<URL:http://www.exlibrisgroup.com/category/Aleph>;
Golder, Scott A. e Bernardo A. Huberman (2006) 'Usage patterns of collaborative tagging systems'.
Journal of Information Science. Vol. 32, n.º 2, pp. 198-208;
Google Inc. (2005). Pesquisa de livros do Google [em linha]. [Consult. 15/03/2009]. Disponível em
WWW:<URL:http://books.google.com/books?hl=pt-PT>;
Guy, M. e E. Tonkin (2006) 'Folksonomies: Tidying up tags?'. D-Lib Magazine. ISSN 1082-9873.
Vol. 12, n.º 1;
Kipp, Margaret E. I. (2006) 'Complementary or Discrete Contexts in Online Indexing: A Comparison
of User, Creator, and Intermediary Keywords'. Canadian Journal of Information and Library
Science. Vol. 30, n.º 3;
LibraryThing (2005). LibraryThing | Catalog your books online [em linha]. [Consult. 15/03/2009].
Disponível em WWW:<URL:http://www.librarything.com/>;
Mai, Jens-Erik (2006) 'Contextual analysis for the design of controlled vocabularies'. Bulletin of the
American Society for Information Science and Technology. Vol. 33, n.º 1, pp. 17-19;
Mathes, Adam (2004). Folksonomies-Cooperative Classification and Communication Through Shared
Metadata;
Peters, I. e W. G. Stock (2007) 'Folksonomy and information retrieval'. Proceedings of the ASIST
Annual Meeting. ISSN 15508390 (ISSN); 0877155399 (ISBN); 9780877155393 (ISBN). Vol.
44;
Schachter, Joshua (2003). Delicious [em linha]. [Consult. 15/03/2009]. Disponível em WWW:<URL:
http://delicious.com/>;
Serviços de Documentação da Universidade de Aveiro (2002, 10/03/2009). Catálogo Bibliográfico da
Universidade de Aveiro [em linha]. Aveiro. [Consult. 15/03/2009]. Disponível em
WWW:<URL:http://opac.doc.ua.pt/>;
Serviços de Documentação da Universidade de Aveiro (2007, 15/12/2007). Serviços de
Documentação › Missão [em linha]. [Consult. 12/03/2009]. Disponível em WWW:<URL:
http://www.doc.ua.pt/PageImage.aspx?id=2923>;
Shirky, Clay (2004, 25-08-2004). Folksonomy (Blog Many-to-Many) [em linha]. [Consult.
04/12/2008]. Disponível em WWW:<URL:http://many.corante.com/archives/2004/08/25/
folksonomy.php>;
Smith, Gene (2004, 3/08/2004). Folksonomy: Social classification [em linha]. [Consult. 4/12/2008].
Disponível em WWW:<URL:http://atomiq.org/archives/2004/08/folksonomy_social_
classification.html>;
Starr, J. (2007) 'Library thing.com: The holy grail of book recommendation engines'. Searcher:
Magazine for Database Professionals. ISSN 10704795. Vol. 15, n.º 7, pp. 25-32;
Toffler, A. (1980). The Third Wave. New York: William Morrow;
Vander Wal, Thomas (2004, 3/10/2004). Feed on this (Blog vanderwal.net) [em linha]. [Consult.
04/12/2008]. Disponível em WWW:<URL: http://www.vanderwal.net/random/category.php?
cat=153>.