You are on page 1of 10

A estrutura lógico-hierárquica de linguagens

de indexação utilizadas por bibliotecas


universitárias
La estructura lógica y jerárquica de lenguajes de indización utilizados por las bibliotecas universitarias
The logical and hierarchical structure of indexing languages used by university libraries

Mariângela Spotti Lopes FUJITA (1), Luciana Beatriz Piovezan dos SANTOS (2)

(1) Universidade Estadual Paulista Júlio de Mesquita Filho, Av. Hygino Muzzi Filho, 737, Campus Universitário,
CEP. 17525-900, Marília, SP, Brasil, fujita@marilia.unesp.br, (2) Programa de Pós-Graduação em Ciência da Informação
da Universidade Estadual Paulista, lbpiovezan@gmail.com

Resumen Abstract
El uso de lenguajes de indización realiza con precisión The use of indexing languages mediates accurately
la mediación entre los vocabularios de los documentos between document and user vocabularies during infor-
y los de los usuarios durante la recuperación de infor- mation retrieval. Nevertheless, it should be updated ac-
mación. Dichos lenguajes, sin embargo, deben ser ac- cordingly to the generation and innovation fo new
tualizados a medida que avanza la generación e inno- knowledge. Updating terms depends on the hierar-
vación del conocimiento. Dicha actualización depende chical structure that guides the inclusion and classifica-
de la estructura jerárquica para facilitar su inclusión y tion of terms. With the research proposal about hierar-
clasificación. Para la investigación propuesta sobre las chical structures of indexing languages, the bottom-up
estructuras jerárquicas de lenguajes de indización se committee method porposed in the ANSI/NISO-2005
adoptó el método del comité ascendente propuesto en Guidelines for the compilation of controlled vocabular-
la Directiva ANSI/NISO de 2005 para construir voca- ies using the integrated methodological model was
bularios controlados usando el modelo metodológico adopted, comparing the hierarchies of the Library of
integral, comparando las jerarquías de las Library of Congress Subject Headings (LCSH), the Subject Ter-
Congress Subject Headings (LCSH), la Terminologia minology of National Library (TBN), the BIBLIODATA
de Assuntos da Biblioteca Nacional (TBN), el Lingua- Language and the USP Vocabulary in the fields of
gem BIBLIODATA y el Vocabulário de la Universidad Physics and Mathematics. The results show that BIB-
de São Paulo en las áreas de física y matemáticas. Los LIODATA language does not have certain hierarchical
resultados muestran que el lenguaje Bibliodata no po- relationships, making any comparison impossible. TBN
see algunas relaciones jerárquicas, lo que impide su has eight levels hierarchy for Mathematics and the
comparación. El TBN tiene ocho niveles de jerarquía other languages have four levels for Physics. The con-
para las matemáticas; y los demás lenguajess tienen clusion is that it is possible to develop hierarchies using
jerarquías de cuatro niveles para la física. Se concluye these methods.
que es posible el desarrollo de jerarquías utilizando los Keywords: Indexing languages. University libraries.
métodos propuestos. Hierachical relations. Categorial structures. Updating.
Palabras clave: Lenguajes de indización. Bibliotecas Brasil.
universitarias. Relaciones jerárquicas. Estructuras ca-
tegoriales. Actualización. Brasil.

1. Introdução em realidade, não precisaria ser utilizada pelos


catalogadores, pois a linguagem natural é a mais
A linguagem de indexação, como ferramenta de utilizada pelos usuários como demonstraram os
conversão, deve ser utilizada tanto pelo indexa- resultados obtidos no primeiro estudo de avalia-
dor após a atribuição de conceitos extraídos do ção realizado por Boccato, Fujita e Gil Leiva
documento quanto pelo usuário antes da atribui- (2011), que verificou o desempenho e o índice de
ção de conceitos extraídos da necessidade de in- precisão na recuperação de áreas científicas es-
formação que orientará a estratégia de busca no pecializadas em 3 áreas de conhecimento no ca-
catálogo da biblioteca. Ocorre que usuários do tálogo on-line ATHENA do sistema de bibliotecas
catálogo bibliográfico on-line ATHENA (2) não da UNESP. A análise dos dados coletados utili-
conhecem e nunca utilizaram linguagem de inde- zou, como indicadores de avaliação da lingua-
xação por não estar disponibilizada na web junto gem de indexação, os índices de precisão e re-
à ferramenta de busca. Nunca existiu, então, a vocação pela recuperação da informação no ca-
mediação da linguagem no catálogo ATHENA e, tálogo Athena (Lancaster, 2004; Gil Leiva, 2008).

Fujita, Mariângela Spotti Lopes; Santos, Luciana Beatriz. A estrutura lógico-hierárquica de linguagens de indexação
utilizadas por bibliotecas universitárias. // Scire. 22:2 (jul.-dic. 2016) 37-46. ISSN 1135-3716.
38

Essa constatação pode ser a mesma de outras linguagem de indexação para bibliotecas univer-
bibliotecas que necessitam aprimorar a recupe- sitárias.
ração por assuntos de seus catálogos on-line e
isso poderá ser resolvido pela escolha de uma 2. Linguagens de indexação utilizadas
linguagem de indexação. A decisão de usar uma por bibliotecas: aspectos históricos
só linguagem deve ser tomada em função da e de estrutura lógico-hierárquica,
compatibilização de vocabulário a ser utilizado na
semântica e associativa
indexação e na estratégia de busca para obter
resultados de recuperação mais precisos, corre- Para avançarmos no que tange ao uso da lingua-
tos e específicos. gem de indexação em bibliotecas examinaremos
este instrumento a partir de sua concepção como
O uso de uma linguagem de indexação ade-
Lista de Cabeçalhos de Assuntos e sua constru-
quada e atualizada para o contexto de contínua
ção.
geração de novos conhecimentos e de inovação,
no caso das bibliotecas da UNESP, foi determi- Veremos, então, que as listas de cabeçalhos de
nante para a construção da Linguagem de inde- assunto são linguagens de indexação pelos as-
xação UNESP mediante processo de adequação pectos estruturais e que, por isso, evoluíram e in-
e compatibilização de vocabulários de três lin- corporaram aspectos de tesauros, tendo em vista
guagens de indexação de mesma raiz terminoló- as grandes mudanças de acesso e de recupera-
gica utilizadas por bibliotecas: Terminologia de ção da informação em sistemas de buscas por
assuntos da Biblioteca Nacional, Library of Con- assunto.
gress Subject Headings (LCSH) e Medical Sub-
ject Headings (MeSH). O avanço desse processo Tal como o tesauro, as listas de cabeçalhos de
de adequação e compatibilização exige, contudo, assuntos são linguagens de estrutura alfabética,
a incorporação de termos novos conforme pre- considerando-se que os termos que as integram
visto inicialmente pela própria necessidade do são ordenados alfabeticamente. Tanto o tesauro
contexto de geração de novos conhecimentos ci- como as listas de cabeçalhos de assuntos, pos-
entíficos e tecnológicos das bibliotecas universi- suem entre os termos relações hierárquicas, se-
tárias. mânticas e associativas como se observa no
Quadro I:
Ocorre que a criação de termos novos depende
da existência de uma macroestrutura de catego-
Descrição Horticultura (subdividido geograficamente)
rias temáticas que oriente a inclusão e classifica-
Remissiva Ver Hortaliças - Cultivo Hortas
ção dos termos para que se componha a estru- (US/UF)
tura lógica e hierárquica dos termos superorde- Remissiva Ver Tam- TE: Aclimatação (Plantas)
bém (TR) TE: Cobertura dos solos
nados e subordinados. TE: Cogumelos - Cultivo
TE: Estufas para cultivo
Essa macroestrutura para organizar a ordem hi- TE: Frutas - Cultivo
TE: Hidroponia
erárquica dos assuntos ainda não existe na Lin- TE: Jardinagem paisagística
guagem de indexação UNESP e precisa ser cri- TE: Olericultura
TE: Plantas - Propagação
ada para orientar a adequação, a compatibiliza- TE: Plantio (Cultivo de plantas)
ção e a inclusão de termos novos pela organiza- TE: Poda
TE: Produtos hortigranjeiros
ção de registros de autoridade. Aparentemente, TG: Agricultura
a Linguagem da Biblioteca Nacional (BN) e a Lin- TR: Jardinagem
guagem da Library of Congress Subject Hea- Fonte positiva LCSH
dos dados
dings (LCSH) não possuem uma macroestrutura Nota geral pública Usado para obras que tratam do cultivo,
de categorias temáticas que organiza a ordem hi- para fins comerciais, de frutas, vegetais e
plantas ornamentais
erárquica dos assuntos, ainda que, todos os ter-
Outros vocabulários
mos possuam uma organização hierárquica.
Library of Congress Horticulture
Considerando-se a observação desse problema
Quadro I. Ficha da autoridade – Termo tópico
de estruturação lógica e hierárquica da Lingua-
“Horticultura” da TBN
gem de indexação UNESP, é importante o de-
senvolvimento de investigação sobre o processo
de elaboração da estrutura lógica e hierárquica O termo “Horticultura” tem relação semântica
de linguagens de indexação na perspectiva de com os termos “Hortaliças-Cultivo” e “Hortas”
uma política de indexação. Para isso, propõe-se como termo preferido ou de equivalência, relação
o estudo da macroestrutura de categorias da lin- hierárquica como termo superordenado com os
guagem LCSH, Terminologia da Biblioteca Naci- termos específicos (TE) subordinados a partir do
onal, Vocabulário USP e Linguagem do BIBLIO- termo “Aclimatação (Plantas)” até o termo “Pro-
DATA para elaboração e desenvolvimento dessa dutos Hortigranjeiros” e como termo subordinado

Fujita, Mariângela Spotti Lopes; Santos, Luciana Beatriz. A estrutura lógico-hierárquica de linguagens de indexação
utilizadas por bibliotecas universitárias. // Scire. 22:2 (jul.-dic. 2016) 37-46. ISSN 1135-3716.
39

com o termo genérico (TG) “Agricultura” e, por úl- adotado na oitava edição da lista, publicada em
timo, relação associativa (TR) com o termo “Jar- 1975 (Hoshy, 2001, p. 135-136).
dinagem”.
Torres (2006) ressalta o papel de destaque da LC
As relações hierárquicas entre termos superor- na disseminação da catalogação de assuntos e
denados e subordinados demonstram a estrutura das listas de cabeçalhos de assuntos, que, desde
vertical de relações lógico-hierárquicas de uma sua criação e com a comercialização de seus re-
linguagem de indexação que se constitui de vér- gistros bibliográficos e de autoridade, sedimen-
tices e níveis. O vértice das cadeias hierárquicas tara o uso do cabeçalho de assunto na represen-
em sistemas de classificação, segundo explica tação do conteúdo de documentos.
Cintra et al. (1994, p. 32), é “constituído de disci-
Deste modo, a LCSH tem sido amplamente utili-
plinas convencionais que se subdividem sucessi-
zada em bibliotecas para promoção do acesso
vamente”. Nos tesauros e listas de cabeçalhos
por assunto, tendo sido traduzida e adaptada
de assunto, os vértices equivalem às classes e
para diversos idiomas e servido como base para
são denominados de top terms ou termos gené-
construção de outras linguagens de indexação.
ricos superordenados que poderão ser o gênero
ou o todo. Considerada como a principal lista de cabeçalhos
de assunto existente, a LCSH, embora seja origi-
No exemplo do Quadro II, o top term da cadeia
nalmente uma linguagem pré-coordenada, estão
hierárquica é “Agricultura”, que possui 3 níveis
hoje organizados em formato de tesauro, com
constituídos de 3 vértices:
seus cabeçalhos arranjados em uma estrutura de
relacionamentos de equivalência, hierárquicos e
. AGRICULTURA associativos (Fujita, Boccato e Rubi, 2010).
.. Horticultura No âmbito da LCSH, os cabeçalhos de assuntos
... Aclimatação (Plantas) são construídos a partir da criação de um registro
... Cobertura dos solos
de autoridade de assunto em formato Machine
[…]
... Produtos hortigranjeiros Readable Cataloging - MARC21, que será incor-
porado à lista de autoridades que compõe a
Quadro II. Vértices e níveis da estrutura lógico- LCSH (Hoshy, 2001).
hierárquica do termo “Horticultura” na TBN
O Registro de autoridades de assunto da LCSH
é composto por notas de escopo e indicações de
Para a construção, atualização e manutenção de relacionamentos, tendo, como objetivos básicos,
linguagens de indexação é fundamental o conhe- prover o cabeçalho de assunto autorizado ou di-
cimento e uso da estrutura lógico- hierárquica re- recionar ao cabeçalho autorizado, indicar se um
presentada pelas cadeias hierárquicas de termos cabeçalho pode ou não ser subdividido geografi-
superordenados e subordinados compostas de camente, prover uma nota de escopo quando
vértices e níveis com a finalidade de representa- houver necessidade de explicar a cobertura a
ção do domínio de assunto de modo completo. que o termo se aplica e indicar relacionamentos
entre cabeçalhos.
Para o entendimento das linguagens de indexa-
ção utilizadas por bibliotecas passamos a exami- Como dito, a LCSH está organizada em uma es-
nar as listas de cabeçalhos de assunto que são trutura de relacionamentos de equivalência, hie-
continuamente atualizadas e estão disponíveis rárquicos e associativos, que permitem aos usu-
para uso. ários ampliar, especificar ou redirecionar suas
buscas. Tais relacionamentos e suas designa-
2.1. A linguagem da LCSH: história ções são padronizados para construção e geren-
e configuração lógico-hierárquica, ciamento de tesauros (Hoshy, 2001).
semântica e associativa Desse modo, a estrutura da LCSH compreende
A Library of Congress Subject Headings (Lista de uma ordenação sistemática que evidencia as re-
Cabeçalho de assunto da Biblioteca do Con- lações que unem os cabeçalhos de assunto que
gresso) começou a ser construída em 1898 para a compõem. Nessa estrutura, as relações hierár-
atender às necessidades de representação dos quicas, expressas pelo código BT para termo ge-
conteúdos de livros e periódicos custodiados ral e NT para termo específico, são feitas para
pela Biblioteca do Congresso dos Estados Uni- indicar que há uma relação de superordena-
dos (Library of Congress - LC). Inicialmente inti- ção/subordinação entre dois ou mais cabeçalhos
tulada Subject Headings in the Dictionary Catalo- (Yi e Chan, 2010).
gues of the Library of Congress, o título atual foi

Fujita, Mariângela Spotti Lopes; Santos, Luciana Beatriz. A estrutura lógico-hierárquica de linguagens de indexação
utilizadas por bibliotecas universitárias. // Scire. 22:2 (jul.-dic. 2016) 37-46. ISSN 1135-3716.
40

Nesse tipo de relacionamento, há a possibilidade BIBLIODATA compõe-se pelo cabeçalho, relaci-


de um cabeçalho pertencer a mais de uma hie- onamentos, nota de escopo e termo LC – em que
rarquia lógica, casos em que serão feitas referên- se indica o termo correspondente na LCSH (Fun-
cias a cada hierarquia à qual o cabeçalho se liga, dação Getúlio Vargas, 1995).
respeitando-se a ligação apenas ao termo imedi-
A Terminologia da Biblioteca Nacional (TBN) re-
atamente superior em cada hierarquia (Hoshy,
monta a 1945, quando a instituição passou a
2001).
adotar os princípios da American Library Associ-
O relacionamento de equivalência, expresso pe- ation (ALA) para tratamento da informação, cri-
los códigos USE e UF (usado para), existe entre ando catálogos de autoridades de nomes pesso-
termos não-preferidos remetendo para um cabe- ais e coletivos e, conjuntamente, passou a adotar
çalho autorizado, quando dois ou mais termos a LCSH como padrão para criação de pontos de
designam o mesmo conceito, de maneira a aten- acesso por assunto para uso interno da institui-
der ao princípio do cabeçalho uniforme e contro- ção. Foi apenas no ano de 1982, com sua en-
lar variantes semânticas e ortográficas (Hoshy, trada na Rede BIBLIODATA/CALCO que a insti-
2001). tuição passou a construir sua própria linguagem
baseada na LCSH e cujo uso “foi sistematizado
O relacionamento associativo, expresso pelo có-
não só em âmbito interno como para utilização
digo RT (termo relacionado) indica termos que
pelas bibliotecas participantes da Rede BIBLIO-
estão ligados de alguma forma diferente das an-
DATA, mantendo-se os cabeçalhos originais e
teriormente expressas, de modo que se relacio-
gerando, assim, um vocabulário bilíngue”
nem cabeçalhos relativos a assuntos entre os
(GRINGS, 2016, no prelo).
quais há uma associação mental.
Em 1994, quando a FGV optou por uma mu-
2.2. Linguagens derivadas da LCSH: dança de software operacional para a Rede BI-
terminologia da Biblioteca Nacional e linguagem BLIODATA, a BN deixou de participar da Rede e
BIBLIODATA em comparação com a LCSH ambas as linguagens passaram a ser desenvol-
vidas separadamente, mantendo como seme-
A Lista de Cabeçalhos de Assunto da Rede BI- lhança apenas o fato de possuírem a LCSH como
BLIODATA começou a ser desenvolvida no âm- matriz e base terminológica (GRINGS, 2016, no
bito do projeto BIBLIODATA/CALCO (Cataloga- prelo).
ção Legível por Computador), um esforço con-
junto da Fundação Getúlio Vargas (FGV) e do 2.3. Linguagem de indexação de bibliotecas
Instituto Brasileiro de Bibliografia e Documenta- universitárias: o Vocabulário USP
ção (IBBD), atual IBICT (Instituto Brasileiro de In-
formação em Ciência e Tecnologia) com o obje- O Vocabulário USP é uma linguagem construída
tivo de padronizar a utilização de cabeçalhos de para a indexação de assuntos da coleção das bi-
assunto (Histórico, [2016]). bliotecas universitárias da USP em seu Banco de
Dados Bibliográficos DEDALUS. Para atender às
A Linguagem BIBLIODATA é disponibilizada ele-
necessidades relativas às atividades inerentes à
tronicamente a todas as instituições credencia-
universidade, o Vocabulário USP constitui-se de
das pela Rede BIBLIODATA acompanhada de
uma linguagem interdisciplinar, que abrange as
um manual de procedimentos que contém a sua
diversas áreas do conhecimento (Universidade
estrutura formal e instruções de operacionaliza-
de São Paulo, 2015).
ção da linguagem.
A criação do Vocabulário USP iniciou-se com a
Verifica-se que a Linguagem BIBLIODATA é uma
composição, em 1993, de uma equipe de biblio-
linguagem controlada e pré-coordenada, cujos
tecários da USP, responsável por atualizar e am-
termos são arranjados alfabeticamente, com-
pliar a Lista de Assuntos que era utilizada até o
posta por meio de tradução e adaptação para a
momento. A equipe de bibliotecários contou com
língua portuguesa da LCSH. De acordo com o
o apoio de professores da Escola de Biblioteco-
Manual de cabeçalhos de assunto da Rede BI-
nomia da USP e também da UNESP (Universi-
BLIODATA, a opção pela LCSH deu-se por sua
dade de São Paulo, [s.d.]).
característica multidisciplinar, além de sua confi-
abilidade (Fundação Getúlio Vargas, 1995). Como resultado, em 2003 foi implementado o Vo-
cabulário USP, disponível para consulta on-line
A lista de cabeçalhos da Linguagem BIBLIO-
na página web da universidade. O vocabulário
DATA é composta por cabeçalhos tópicos e sub-
constitui-se de descritores, não-descritores, qua-
divisões de assunto, de forma, geográficas e cro-
lificadores, remissivas e termos denominados
nológicas, remissivas (relações de equivalência)
como “elos falsos”, que são termos não-descrito-
e relacionamentos hierárquicos e associativos. O
res que atuam como elemento aglutinador de
registro de autoridade de assunto da Linguagem

Fujita, Mariângela Spotti Lopes; Santos, Luciana Beatriz. A estrutura lógico-hierárquica de linguagens de indexação
utilizadas por bibliotecas universitárias. // Scire. 22:2 (jul.-dic. 2016) 37-46. ISSN 1135-3716.
41

descritores mais específicos (Universidade de termos, Uso de equipamento automático de pro-


São Paulo, 2006). cessamento de dados (IBICT e UNESCO), Ter-
mos não designados (ANSI/NISO).
O Vocabulário USP está disponível para consulta
externa, podendo ser visualizado por sua apre- Conforme análise mais detalhada das etapas no
sentação em lista alfabética ou hierárquica, com- quadro de Cervantes (2009, p. 200), verificou-se
plementada por tabelas de qualificadores, além que é na etapa de “Métodos de compilação” que
de poder ser consultado por sua macroestrutura, as três Diretrizes expõem a construção das clas-
em que são explicitadas suas relações lógico-se- ses mais amplas, denominadas de categorias a
mânticas. Estima-se que atualmente o Vocabulá- partir das quais se constroem as hierarquias de
rio USP contenha aproximadamente 45 mil ter- termos genéricos e específicos. As Diretrizes do
mos (Universidade de São Paulo, 2015). IBICT e da UNESCO dividem os métodos em de-
dutivo, indutivo e combinação de métodos e a
Para uso interno, o vocabulário está disponibili-
ANSI/NISO amplia para 4 os tipos de métodos,
zado na base de dados SIBIX 650 integrada ao
sendo abordagem de comitê, abordagem empí-
sistema de gerenciamento para uso na indexa-
rica, combinação de métodos e assistência da
ção de itens do acervo. O Vocabulário também
máquina.
pode ser utilizado por outras instituições por meio
de consulta à página web institucional (Universi- Os métodos indutivo e dedutivo são considera-
dade de São Paulo, 2006; Universidade de São dos pela Diretriz ANSI/NISO (2005) como empí-
Paulo, 2015). ricos e estão incluídos em seu método de abor-
dagem empírica. De forma geral, são descritos
As quatro linguagens de indexação apresenta-
com conteúdo semelhante nas três diretrizes
das foram construídas para uso em bibliotecas,
com enfoque para a orientação de inclusão de
sendo que apenas o Vocabulário USP tem a es-
termos em categorias que devem ser identifica-
pecificidade de haver sido desenvolvido para bi-
das pelos termos genéricos de primeiro nível hi-
bliotecas universitárias; as demais são utilizadas
erárquico antes (indutivo) ou depois (dedutivo) da
em diversas modalidades de bibliotecas indistin-
compilação dos termos. A combinação de méto-
tamente. Tais linguagens apresentam estrutura
dos indutivo e dedutivo propõe método que incor-
alfabética de organização de termos, sendo que
pora o dedutivo e o indutivo de modo que sugere
três são linguagens pré-coordenadas (LCSH,
o estabelecimento das categorias dos termos de
TBN e BIBLIODATA) e uma linguagem é pós-co-
modo indutivo por um grupo editorial composto
ordenada, o Vocabulário USP. Duas linguagens,
por indexadores e especialistas e depois de as
LCSH e BIBLIODATA, são denominadas como
hierarquias de termos serem examinadas a partir
listas de cabeçalhos de assunto, mas a primeira
da perspectiva dedutiva.
adota características de tesauro para organiza-
ção de seus termos, da mesma forma que a TBN, A abordagem de comitê, sugerida pela diretriz
que segue a estrutura e a terminologia da LCSH. ANSI/NISO (2005), propõe a atuação de um co-
As quatro linguagens apresentam complementos mitê composto por especialistas no domínio dos
para os termos incluídos, como listas de qualifi- assuntos e especialistas em criação de vocabu-
cadores, subdivisões e remissivas. lários e identifica dois métodos para a atuação
desse comitê: Top-down (descendente) e Bot-
3. O estudo das macroestruturas tom-up (ascendente). No descendente, os ter-
das linguagens de indexação: mos mais genéricos ou superordenados são
método e procedimentos identificados inicialmente e depois são construí-
das as hierarquias de termos subordinados ou
A construção de linguagens de indexação possui mais específicos para atingir o nível de profundi-
procedimentos específicos abordados por nor- dade hierárquica necessário. No ascendente, é
matizações e literatura da área. As principais di- mais característica a situação de vocabulários
retrizes, em diferentes momentos, abordaram a controlados já iniciados que precisam incorporar
construção de vocabulários controlados. São termos derivados de novos conteúdos e, nesse
elas: a do IBICT (1984), da UNESCO (1996) e da caso, a estrutura de categorias e as relações hi-
ANSI/NISO (2005) cujas etapas podem ser ob- erárquicas vão sendo construídas ao contrário:
servadas e analisadas a partir de síntese elabo- iniciam-se pelos termos mais específicos e avan-
rada por Cervantes (2009, p. 200) no quadro çam para os termos superordenados. Desse
“Etapas de construção de um tesauro de acordo modo, o método descendente é mais indicado
com as diretrizes”, que contém 9 etapas: Traba- para a construção de novos vocabulários que re-
lho preliminar, métodos de compilação, Registro sultarão em linguagens de indexação e o ascen-
de termos, Verificação dos termos, Determina- dente, para linguagens de indexação já publica-
ção da estrutura e formatos de apresentação, Ní- das e que necessitam do acréscimo de novos ter-
veis de Especificidade, Inclusão e Exclusão de mos para sua atualização e manutenção.

Fujita, Mariângela Spotti Lopes; Santos, Luciana Beatriz. A estrutura lógico-hierárquica de linguagens de indexação
utilizadas por bibliotecas universitárias. // Scire. 22:2 (jul.-dic. 2016) 37-46. ISSN 1135-3716.
42

Portanto, para a situação desta proposta de do Vocabulário USP utilizando o “Modelo Meto-
acréscimo de termos novos combinados com a dológico Integrado para construção de Tesauro”
necessidade de criar uma estrutura de categorias de Cervantes (2009, p. 164).
e suas hierarquias para o conjunto de termos já
Observa-se que na coluna da direita estão os
existentes da Linguagem de indexação da
procedimentos terminográficos para cada etapa
UNESP, será adotado para a compilação o mé-
da construção do tesauro (coluna da esquerda)
todo de comitê ascendente, considerando-se que
que aqui generalizamos para linguagem de inde-
os termos específicos já existem e as hierarquias
xação. Nosso enfoque será a aplicação dos pro-
de termos necessitam da identificação das cate-
cedimentos terminográficos propostos para o
gorias.
método de compilação de abordagem de comitê
Para a identificação das categorias serão anali- ascendente com a finalidade de construir é uma
sadas as estruturas de categorias das linguagens estrutura de categorias para a Linguagem
de indexação da LCSH, da Terminologia de As- UNESP e, para isso, definimos o desenvolvi-
suntos da Biblioteca Nacional, do BIBLIODATA e mento de suas etapas e fases:

Modelo metodológico integrado para construção de tesauro


Sistematização de etapas da construção de tesauros (normalização, literatura e tesauros) -
Procedimentos terminográficos
1. Trabalho preliminar Escolha do domínio e da língua do tesauro
(Orientações gerais/ Uso de equipamento automático Delimitação do subdomínio
de processamento de dados) Estabelecimento dos limites da pesquisa
terminológica temática;
Consulta a especialista do domínio/subdomínio
2. Método de compilação Coleta do corpus do trabalho terminológico
(Abordagem de compilação) Estabelecimento da árvore de domínio
Expansão da representação do domínio
escolhido
3. Registro de termos Coleta e classificação de termos.
4. Verificação de termos Verificação, classificação e confirmação de
(Admissão e exclusão de termos /Especificidade) termos
Elaboração de definições
Uso do vocabulário de especialidade para o
estabelecimento de relações entre os descritores e
de relações entre descritores e não descritores
Organização das relações entre descritores
5. Forma de apresentação de um tesauro Trabalhos de apresentação do tesauro.

Quadro III. Sistematização das etapas de construção de tesauros

6. Coleta do corpus do trabalho terminológico • Fase 4: elaboração da estrutura lógico-hierár-


quica do domínio da Física e da Matemática,
• Fase 1: identificação e descrição das lingua-
tendo, como parâmetro, as estruturas das lin-
gens de indexação selecionadas para análise
guagens de indexação.
do domínio da Física e da Matemática con-
forme apresentado nos itens 2.1, 2.2 e 2.3;
4. Análise e discussão sobre o estudo
• Fase 2: identificação e descrição das estrutu- das macroestruturas das linguagens
ras de representação documentária das áreas de indexação
de Física e da Matemática nas linguagens de
indexação selecionadas; Neste tópico será abordada a aplicação do “Mo-
delo Metodológico Integrado para construção de
7. Estabelecimento da árvore de domínio Tesauro”, proposto por Cervantes (2009) relati-
• Fase 3: identificação e descrição das hierar- vamente à etapa Método de compilação, descre-
quias de termos dos domínios de Física e Ma- vendo o desenvolvimento das fases 2, 3 e 4.
temática das linguagens de indexação;
8. Expansão da representação de domínio

Fujita, Mariângela Spotti Lopes; Santos, Luciana Beatriz. A estrutura lógico-hierárquica de linguagens de indexação
utilizadas por bibliotecas universitárias. // Scire. 22:2 (jul.-dic. 2016) 37-46. ISSN 1135-3716.
43

4.1. Coleta do corpus do trabalho terminológico categorias e indicação dos relacionamentos en-
tre estes termos (Fujita, 2011).
Fase 2: Identificação e descrição das estruturas
de representação documentária das áreas de Fí- Observando-se a estrutura hierárquica das lin-
sica e da Matemática nas linguagens de indexa- guagens de indexação, verificou-se que na LCSH
ção selecionadas foi possível encontrar termos subordinados que
avançaram até o quarto nível hierárquico para
Foram analisadas as linguagens de indexação ambas as categorias analisadas.
identificadas previamente de modo a compilar e
estruturar os termos relativos às áreas de Física
e Matemática, agrupados em uma planilha, com LCSH
o objetivo de identificar a sua estrutura termino- TG Physics TG Mathematics
lógica, visto que apenas o Vocabulário USP a TE Agricultural physics TE Algebra
disponibiliza de forma estruturada em sua macro- TE Soil physics TE Axioms
estrutura. Por meio da identificação dos termos TE Soil absorption and TE Axiomatic set theory
de primeiro nível hierárquico em ambas as áreas adsorption
temáticas, discriminaram-se as categorias de as- TE Soil colloids TE Axiom of choice
sunto de cada linguagem analisada. TE Archaeological physics TE Banach-Tarski paradox
Na LCSH, a categoria da área de Física é indi- Quadro IV. Exemplo da hierarquia das categorias
cada pelo termo Physics, ao qual estão agrega- Física e Matemática na LSCH
dos 67 termos imediatamente subordinados, e a
categoria da área de Matemática é indicada pelo
termo Mathematics, ao qual estão relacionados Exemplo disso é o termo “Soil colloids”, que é um
77 termos imediatamente subordinados. termo subordinado de quarto nível hierárquico,
cujo termo imediatamente superordenado é “Soil
A TBN identifica a área da Matemática pelo termo absorption and adsorption”, que, por sua vez, é
Matemática, ao qual foram relacionados 45 ter- específico de “Soil physics”, todos pertencentes
mos subordinados, já o termo Física identifica a à hierarquia “Agricultural physics” na categoria
área de Física, ao qual são subordinados 47 ter- Física. Um exemplo da categoria Matemática é
mos. “Banach-Tarski paradox” também subordinado
No Vocabulário USP, a área de Física é identifi- de quarto nível hierárquico, que pertence à hie-
cada pela categoria CE520 – FÍSICA, posterior- rarquia de “Axioms”, completado pelos termos
mente subdividida em 20 termos genéricos, e a “Axiomatic set theory” e “Axiom of choice”.
área da Matemática é identificada pela categoria Na Terminologia da Biblioteca Nacional, foram
CE550 MATEMÁTICA, subdividida em 65 termos identificados termos subordinados que avança-
genéricos. ram até o quarto nível hierárquico para a área de
Diante do identificado nesta fase, em que se ve- Física e até o oitavo nível hierárquico para a área
rificou que as três linguagens analisadas indicam de Matemática.
as categorias de Física e de Matemática por es- Na categoria Física, o termo “Articulações – Hi-
tes termos, sugere-se que a Linguagem UNESP permobilidade” demonstra essa afirmação. Ob-
adote esta nomenclatura como denominação das serva-se que é um termo subordinado de quarto
categorias aqui tratadas. nível hierárquico que se relaciona imediatamente
ao termo superordenado “Articulações - Ampli-
4.2. Estabelecimento da árvore de domínio tude de movimento”, por sua vez termo especí-
fico de “Biomecânica” que completa a hierarquia
Fase 3: identificação e descrição das hierarquias
do termo “Biofísica”. Para a categoria de Mate-
de termos dos domínios de Física e Matemática
mática, tem-se o exemplo da hierarquia do termo
das linguagens de indexação
“Cálculo vetorial”, composta por oito níveis hie-
A partir do agrupamento dos termos relativos às rárquicos demonstrados nos termos subordina-
áreas de Física e Matemática existentes nas lin- dos “Cálculo tensorial”, “Espaços generalizados”,
guagens de indexação analisadas, foi possível o “Banach, Espaços de”, “Banach, Álgebra de”,
estabelecimento de uma estrutura proveniente “Análise harmônica”, “Harmônicos esféricos” e
das categorias principais, identificadas anterior- do termo “Grassmann, Teoria da extensão de”.
mente.
A estruturação dos termos em uma linguagem
tem por objetivo a caracterização do domínio e
se faz por meio da classificação dos termos nas

Fujita, Mariângela Spotti Lopes; Santos, Luciana Beatriz. A estrutura lógico-hierárquica de linguagens de indexação
utilizadas por bibliotecas universitárias. // Scire. 22:2 (jul.-dic. 2016) 37-46. ISSN 1135-3716.
44

TBN linguagens que possuem essa estrutura hierár-


TG Física TG Matemática quica estabelecida. Dessa forma, de modo a ga-
TE Biofísica TE Cálculo vetorial rantir a consistência e adequação da Macroestru-
TE Biomecânica TE Cálculo tensorial
tura da Linguagem Unesp, não é indicada a utili-
zação da linguagem da Rede BIBLIODATA neste
TE Articulações – Amplitude TE Espaços generalizados
de movimento processo.
TE Articulações - TE Banach, Espaços de
Hipermobilidade 4.3. Expansão da representação de domínio
TE Calor TE Banach, Álgebra de
Fase 4: Elaboração da estrutura lógico-hierár-
TE Calor animal TE Análise harmônica quica do domínio da Física e Matemática tendo
TE Controle de temperatura TE Harmônicos esféricos como parâmetro as estruturas das linguagens de
TE Capilaridade TE Grassmann, Teoria indexação
da extensão de
Com as comparações expostas nos Quadros 6
Quadro V. Exemplo da hierarquia das categorias (Física) e 7 (Matemática) em Apêndices na
Física e Matemática na TBN
versão eletrônica, é possível observar que, entre
as três estruturas, há poucas semelhanças entre
A análise do Vocabulário USP identificou termos os vértices por causa da estrutura do Vocabulário
subordinados que avançaram até o quinto nível USP, porém entre as estruturas da LCSH e TBN
hierárquico na categoria Física e até o quarto ní- existem várias semelhanças. Nas três estruturas
vel na categoria referente à Matemática. de Física, existe semelhança, como, por exem-
plo, com o vértice “Física médica” e na Matemá-
tica com o vértice “Álgebra”. Com relação às di-
Vocabulário USP ferenças entre vértices, elas existem somente na
CE520 FÍSICA CE550 - MATEMÁTICA LCSH, como, por exemplo, “Física Agrícola” e
CE520.12 - MECÂNICA DOS CE550.1 – ÁLGEBRA “Física Arqueológica”, termos genéricos que de-
LÍQUIDOS
monstram a interdisciplinaridade científica de do-
CE520.12.1 - HIDRÁULICA 550.16 - ANÁLISE FUNCIONAL
(MECÂNICA DOS LÍQUIDOS)
mínios presentes na linguagem. Na Matemática,
CE520.12.2 - HIDROMECÂNICA CE550.16.51 - OPERADORES
“Geometria diferencial”, “Geometria diferencial
clássica” e “Geometria não euclidiana” são exem-
CE520.12.2.1 - HIDROSTÁTICA CE550.16.51.17 -
OPERADORES LINEARES plos de vértices que existem somente no Voca-
CE520.12.2.1.1 - DENSIDADE CE550.16.51.17.2 - C- bulário USP.
DOS LÍQUIDOS SEMIGRUPOS
A proposta para elaboração de estruturas lógico-
Quadro VI. Exemplo da hierarquia das categorias hierárquicas para expansão da representação
Física e Matemática no Vocabulário USP dos domínios de Física e Matemática será, por-
tanto, a de incluir as semelhanças e as diferen-
Na categoria CE520 FÍSICA, tal estrutura pode ças entre as três estruturas para que a exaustivi-
ser vista no termo “CE520.12.2.1.1 - DENSIDA- dade e a especificidade sejam contempladas de
DE DOS LÍQUIDOS”, termo mais específico su- modo a garantir profundidade no permanente de-
bordinado à “CE520.12.2.1 – HIDROSTÁTICA”, senvolvimento da linguagem de indexação que
que é um termo subordinado à “CE520.12.2 - HI- se pretende para bibliotecas universitárias con-
DROMECÂNICA”, cujo termo genérico é forme Quadro 8 (Apêndice na versão eletrônica).
“CE520.12.1 - HIDRÁULICA (MECÂNICA DOS
LÍQUIDOS)”. Já na categoria “CE550 - MATEMÁ- 5. Considerações finais
TICA”, é possível demonstrar a hierarquia do Após a análise das estruturas de categorias e
termo “CE550. 16 - ANÁLISE FUNCIONAL”, ao das hierarquias lógicas das linguagens de inde-
qual o termo “CE550.16.51 - OPE-RADORES” é xação, verificou-se que a escolha das linguagens
subordinado, chegando ao termo “CE550.16. LCSH, TBN, BIBLIODATA e Vocabulário USP foi
51.17 - OPERADORES LI-NEARES”, ao qual o adequada para o tipo de análise pretendida, con-
termo “CE550.16.51.17.2 - C-SEMIGRUPOS” se siderando que se trata de linguagens desenvolvi-
relaciona no quarto nível de profundidade. das para contextos semelhantes de aplicação.
Verificou-se que a linguagem da Rede BIBLIO- A linguagem BIBLIODATA, porém, demonstrou
DATA não possui relacionamentos hierárquicos não possuir hierarquização de termos, inviabili-
determinados, constituindo-se efetivamente zando sua utilização nas fases finais da pesquisa
como uma lista de cabeçalhos de assunto e, por- e, portanto, decretando que sua utilização para o
tanto, não há como compará-la com as demais propósito final desta análise, a construção de

Fujita, Mariângela Spotti Lopes; Santos, Luciana Beatriz. A estrutura lógico-hierárquica de linguagens de indexação
utilizadas por bibliotecas universitárias. // Scire. 22:2 (jul.-dic. 2016) 37-46. ISSN 1135-3716.
45

uma proposta de macroestrutura para a Lingua- (2) Catálogo on-line construído pela rede de bibliotecas uni-
versitárias da Universidade Estadual Paulista Júlio de
gem UNESP, é inviável. Desta verificação, con-
Mesquita Filho - UNESP, disponível em: http://www.athe
clui-se que a escolha das linguagens de indexa- na.biblioteca.unesp.br.
ção destinadas à análise de macroestruturas
deve considerar linguagens constantemente atu- Referências
alizadas, como o são a LCSH, a TBN e o Voca-
bulário USP e que sejam direcionadas a contex- American National Standards Institute; National Information
Standards Organization (2005). ANSI/NISO Z39.19-
tos de uso semelhantes.
2005: guidelines for the construction, format, and mana-
Quanto à estrutura das linguagens, é possível gement of monolingual controlled vocabularies. Bet-
hesda, Ma: NISO Press, 2005. 184 p. http://www.niso.org/
destacar que a LCSH sobressaiu-se por sua exa- apps/group_public/project/details.php?project_id=46
ustividade e diversidade terminológica, ofere- (2016-04-31).
cendo opções para o trabalho do indexador, de Barbosa, Alice P. (1972). Projeto CALCO: adaptação do
modo que este possa atender às necessidades MARC II para implantação de uma central de processa-
mais atuais de interdisciplinaridade científica. mento da catalogação cooperativa. 1972. Dissertação
(Mestrado em Biblioteconomia e Documentação) – Insti-
A TBN, por ser uma versão da LCSH, possui com tuto Brasileiro de Biblioteconomia e Documentação, Uni-
versidade Federal do Rio de Janeiro, Rio de Janeiro.
essa linguagem mais semelhanças, porém, não
apresenta a mesma diversidade que a sua ma- Boccato, V. R. C., Fujita, M. S. L., Gil Leiva, I. (2011). Avali-
ação comparada do uso de linguagens de indexação em
triz, de modo que esta análise não poderia pres- catálogos de bibliotecas universitárias para recuperação
cindir do uso de ambas as linguagens para a por assunto. // Scire. 17:1 (2011) 55-64.
composição da representação documentária dos Cervantes, Brígida Maria Nogueira (2009). A construção de
domínios. tesauros com a integração de procedimentos terminográ-
ficos. 2009. 209f. Tese (Doutorado) – Faculdade de Filo-
Quanto ao Vocabulário USP, podemos destacar sofia e Ciências, Universidade Estadual Paulista, Marília,
que sua estrutura diferenciada das demais lin- 2009.
guagens indica que sua utilização será impor- Cintra, A. M. M.; et al. (1994) Para entender as linguagens
tante para a elaboração da macroestrutura da documentárias. São Paulo: Polis, 1994. 72 p.
Linguagem UNESP, especialmente por haver Fujita, M. S. L. (2011). Modelos de categorização para a cons-
trução de tesauros: metodologia de ensino. // Boccato, V.
sido construído no contexto de um sistema inte- R. C.; Gracioso, L. de S. (org.) Estudos de linguagem em
grado de bibliotecas universitárias prezando, em Ciência da Informação. Campinas, SP: Alínea, 2011. 35-
sua constituição, características das áreas de do- 67.
mínio da universidade. Fujita, M. S. L.; Boccato, V. R. C.; Rubi, M. P. (2010). O con-
texto da indexação para a catalogação de livros em abor-
As três linguagens demonstram ser importantes dagem sociocognitiva. // Brazilian Journal of Information
para a construção de estruturas lógico-hierárqui- Science. 4:2 (jul./dez. 2010) 22-40. http://www2.mari-
cas com profundidade adequada à busca contí- lia.unesp.br/revistas/index.php/bjis/article/view/485
(2011-07-16)
nua pela geração de novos conhecimentos e ino-
Fundação Getúlio Vargas. Rede BIBLIODATA/CALCO (1995)
vação no âmbito das bibliotecas universitárias. Manual de cabeçalhos de assunto: normas e procedi-
mentos: versão 1.0. Rio de Janeiro.
Finalmente, a metodologia utilizada mostrou-se
apropriada à proposta, destacando-se o uso da Gil Leiva, I. (2008) Manual de indización: teoria y práctica. Gi-
jón: Ediciones Trea.
Diretriz ANSI/NISO (2005), que contempla e am-
Gil Urdiciain, B. (2004). Manual de lenguages documentales.
plia as orientações propostas pelo IBICT (1984) Gijón: Ediciones Trea. 280 p.
e UNESCO (1996). O uso do método de comitê Grings, L. (2016). Controle de autoridades na Biblioteca Na-
ascendente associado ao Modelo Metodológico cional do Brasil: breve histórico e práticas atuais. // Re-
Integrado para construção de Tesauro de Cer- vista Brasileira de Biblioteconomia e Documentação. 12:1
vantes (2009) foi bem sucedido e conduziu a ela- (No prelo).
boração da proposta de estrutura lógico-hierár- Guimarães, J. A. C. (2008). A dimensão teórica do trata-
quica para expansão dos domínios de Física e mento temático da informação e suas interlocuções com
o universo científico da International Society for Kno-
Matemática. Dessa forma, a utilização de proce- wledge Organization (ISKO) // Revista Ibero-Americana
dimentos terminográficos para a construção de de Ciência da Informação. 1:1 (jan./jun. 2008) 77-99.
macroestrutura lógica de linguagens de indexa- Histórico. ([2016]). Rede BIBLIODATA. Rio de Janeiro: IBICT.
ção permitiu a caracterização dos domínios e in- http://bibliodata.ibict.br/geral/modelos/historicoantes.htm
dica-se que seja utilizada esta opção metodoló- (2016-03-05)
gica para a construção da macroestrutura para a Hoshy, L.M.E. (2001). Relationships in Library of Congress
Subject Headings. // Bean, C.A. (ed.) Relationships in the
Linguagem UNESP. organization of knowledge. Dordrecht: Kluwer Academic
Publishers, 2001. 135-152.
Notas Lancaster, F. W. (2004). Indexação e resumos: teoria e prá-
tica. 2. ed. Brasília: Briquet de Lemos.
(1) Parte das atividades de pesquisa em desenvolvimento
com auxílio regular FAPESP (Processo 2015/13410-8)

Fujita, Mariângela Spotti Lopes; Santos, Luciana Beatriz. A estrutura lógico-hierárquica de linguagens de indexação
utilizadas por bibliotecas universitárias. // Scire. 22:2 (jul.-dic. 2016) 37-46. ISSN 1135-3716.
46

Torres, L. M. C. (2006). Sistematização da sintaxe de ca- Universidade de São Paulo (2006) Sistema Integrado de Bi-
beçalho de assunto. // Gomes, H. E. (coord.) BITI - Biblio- bliotecas. Manual de indexação de assuntos com uso do
teconomia, Informação & Tecnologia da Informação. Rio Vocabulário Controlado USP: versão preliminar. São
de Janeiro, 2006. http://www.conexaorio.com/biti/lecy/ Paulo. 72 p. http://areatecnica.sibi.usp.br/wiki/in-
lecy.htm (2013-10-22). dex.php/Vocabul%C3%A1rio_Controlado. (2012-11-27)
UNESCO (1993) Diretrizes para o estabelecimento e desen- Yi, K.; Chan, L. M. (2010). Revisiting the syntactical and struc-
volvimento de tesauros monolíngües. [2ª ed. rev. por De- tural analysis of Library of Congress Subject Headings for
rek Austin e Peter Dale]; Trad. de Bianca Amaro de Melo; the digital environment. // Journal of the american society
rev. de Lígia Maria Café de Miranda. Brasília: IBICT; SE- for information science and technology. 61:4, 677-687.
NAI. http://onlinelibrary.wiley.com/doi/10.1002/asi.v61:4/is-
Universidade de São Paulo (2015) Sistema Integrado de Bi- suetoc (2016-03-16).
bliotecas. Vocabulário Controlado USP. http://www.sibi.
usp.br/produtos/vocabulario-controlado-usp/ (2016-01- Enviado: 2016-04-01. Segunda versión: 2016-06-29.
16). Aceptado: 2016-09-15.
Universidade de São Paulo ([s.d.]). Vocabulário Controlado
do SIBi/USP: histórico. http://143.107.154.62/Vocab/ima-
gens/Historico.htm (2016-03-27).

Fujita, Mariângela Spotti Lopes; Santos, Luciana Beatriz. A estrutura lógico-hierárquica de linguagens de indexação
utilizadas por bibliotecas universitárias. // Scire. 22:2 (jul.-dic. 2016) 37-46. ISSN 1135-3716.

You might also like