You are on page 1of 11

DataGramaZero - Revista de Cincia da Informao - v.5 n.

6 dez/04 ARTIGO 02

Tesauro e normalizao terminolgica: o termo como base para intercmbio de informaes


Thesaurus and terminological standardization: term as basis for information exchange
por Hagar Espanha Gomes e Maria Luiza de Almeida Campos

Resumo: Uma anlise da Norma Internacional de elaborao de Tesauros Monolngues (ISO 2788) aqui apresentada, focalizando a
investigao nos aspectos relativos ao termo de indexao como base para intercmbio de informaes. A partir de princpios da Teoria da
Terminologia de Wster e da Teoria do Conceito de Dahlberg, discutem-se as solues apresentadas na ISO 2788 para a forma do termo.
Devido s facilidades de integrao de informaes e graas s tecnologias de informao vigentes fundamental que o profissional de
informao se paute em princpios tericos consistentes para o tratamento terminolgico , visando garantir qualidade e consistncia nos
processos de intercmbio de informao. Atualmente, o crescimento da utilizao de ambientes distribudas, especialmente na Web, de
interfaces abertas de acesso a bancos de dados, de tecnologias de mediadores e de padres de formato para troca de dados contribuiu para
que informaes originalmente isoladas sejam disponibilizadas para serem utilizadas de maneira integrada. Neste sentido, o Tesauro
assume papel fundamental nesta integrao, viabilizando a interoperabilidade semntica de sistemas distribudos heterogneos.
Palavras-chave: Tesauro; Normalizao Terminolgica; Norma Internacional de Elaborao de Tesauros ( ISO 2788); Termo de
indexao.

Abstract: An analysis of the International Standard for thesaurus construction (ISO 2788) is presented focusing on aspects relating to
indexing term as basis for information exchange. Wster's Theory of Terminology and Dahlberg's Theory of Concept provide the
foundations to discuss solutions present in ISO Standard about the form of the term. Due to easiness of information integration and to current
information technology, the information professional must work based on sound theoretical principles for the terminological treatment of the
term, aiming at quality and consistency in the process of intormation exchange. Nowadays, the growing activity in distributive environment,
specially in the Web, open interfaces of access to data banks, of intermediate technologies and of format standards for data exchange has
contributed to originally isolated information be available fo use in an integrated way. In this aspect, the thesaurus assumes fundamental role
in this integration, providing semantic feasibility among heterogeneous distributed systems.
Keywords: Thesaurus; Terminological sandardization; International Standard for Thesaurus Construction (ISO 2788); Indexing terms.

1. Introduo

O uso consistente de princpios na indexao um fator de qualidade e pode contribuir para a eficcia dos
servios, desde que a anlise do assunto seja adequada. Neste contexto, o vocabulrio utilizado um requisito
essencial e deve ser devidamente controlado e normalizado. Esta normalizao se efetiva no apenas no interior de
um servio de recuperao de informao, mas entre diferentes servios.

As facilidades de intercmbio, graas s tecnologias de informao vigentes, passam a requerer maior ateno dos
profissionais de informao ao planejarem seus servios, levando em conta os padres ou em desenvolvimento ou
j institudos para as diferentes atividades que ocorrem no interior de um servio de recuperao de informao.

Atualmente, bases de dados de todos os tipos tm proliferado com a disponibilizao de informaes em rede e
principalmente na Web. A recuperao dos contedos informativos ainda no realizada de forma satisfatria,
devido falta de ferramentas de acesso adequadas, que viabilizem, por exemplo, o controle terminolgico. O que
vem ocorrendo de modo mais freqente a utilizao de mtodos automticos de indexao e recuperao de
informaes, que, por si s, esto muito distantes de serem uma soluo apropriada, pois se baseiam na freqncia
de ocorrncia dos termos, no atentando para questes ligadas sua natureza semntica.

Desta forma, a questo que se coloca relativa ao tratamento e recuperao de informaes diz respeito
qualidade e preciso no tratamento das informaes e adequao a uma dada solicitao de busca atravs de
um controle terminolgico que venha garantir preciso nas informaes recuperadas em meio eletrnico. sempre
bom lembrar que, empregando terminologia normalizada em seu discurso, o autor est, tambm ele, contribuindo
para a eficcia dos sistemas de recuperao, alm de melhorar a preciso de sua comunicao.

Na rea de Terminologia, a ISO desenvolveu uma Norma de Harmonizao de conceitos e termos (ISO-860), que
pode ser til em servios de uma mesma lngua ou entre servios de lnguas diferentes. As solues de problemas
terminolgicos oferecidas por esta norma e o padro de metadados compem um quadro de tecnologia essencial,
mas no completo, para a interoperabilidade, seja em termos de software seja em termos de significados. Estas
questes so percebidas mais fortemente quanto se trata de organizao de informaes em rede, o que requer
mecanismos de intercmbio automtico de dados.

No mbito das atividades intelectuais de tratamento da informao, o quadro de tecnologia se completa com a
elaborao de tesauros, aproveitando-se de princpios para a produo de terminologias, sobre os quais podem ser
aplicados os princpios de harmonizao de conceitos e termos entre tesauros de diferentes servios de
recuperao de informao inter- e intra-lnguas, e esta produo campo de atuao dos bibliotecrios e
documentalistas.

A normalizao de vocabulrios, nomenclaturas, terminologias ou assemelhados tem sua relevncia no apenas em


servios de informao; de grande valor para as trocas internacionais, nas quais as atividades de
exportao/importao focalizam produtos ou tecnologias, nem sempre designados pelos mesmos termos numa
mesma lngua falada por diferentes pases ou por termos cognatos.

Se os princpios de construo de terminologias e tesauros forem incorporados a normas - internacionais e/ou


nacionais - outro ganho a possibilidade de melhores resultados nos servios que utilizam meta-buscadores, pois
diferentes tesauros de reas afins, baseados nos mesmos princpios configurar-se-o como instrumentos
compatveis e harmnicos.

Alm disso, sabe-se que os buscadores atuam nos textos, ou em pedaos de textos, utilizando a linguagem natural
como base para a recuperao e aqui, tambm, sobreleva o uso, pelos autores, de terminologia padro, essencial
para uma comunicao sem ambigidades e, como conseqncia, facilitadora de melhor recuperao pelos
buscadores, como ocorre nas cincias bsicas.

O tesauro tem sido considerado como uma linguagem de indexao. Isto verdade, quando ele est em uso num
servio de recuperao de informao, e destinado ao uso para o qual desenvolvido, com regras para sua
utilizao. Mas, se pensarmos no tesauro como uma tecnologia independente, ainda no integrada a um servio -
por exemplo, quando algum deseja avaliar um tesauro desenvolvido por outros ou quando ele ainda vai ser
desenvolvido -, um planejamento, uma fundamentao terica, que no aceite excees, como toda linguagem
artificial, tornam-se imprescindvel. Estes aspectos propiciam condies seguras na etapa de manuteno, quando
da incluso de novos termos na estrutura vigente, evitando criaes anmalas, como o caso de decises ad-hoc,
ou seja, decises voltadas para a soluo de um caso especfico, no generalizvel. O que se deve almejar so
regras genricas que contemplem os casos particulares. Isto : regras prescritvas.

Estudos voltados para questes relativas as bases tericas de linguagem documentria (CAMPOS 1986; CAMPOS,
1995, 2001, 2004; CAMPOS & GOMES, 2003; GOMES, 2003; GOMES&CAMPOS&MOTTA, 2004; MOTTA,
2000), desenvolvidos no Brasil, tem sido para um grupo de pesquisadores uma das condies para a realizao de
inmeras atividades relacionadas ao controle terminolgico como base para a integrao de informaes.

Recentemente, o tesauro tem sido objeto de interesse da Informtica, nomeado como uma ontologia, sendo
considerado como um mecanismo para se alcanar a interoperabilidade. Neste caso, cada metadado, ento, visto
como um termo, um conceito, e no um grupo de palavras que podem ser 'fatoradas'. Neste ambiente, os princpios
para organizao de tesauros com base em conceitos se tornam de fundamental importncia, ainda mais que a
estruturao dos termos possibilita a interoperabilidade semntica. (Hunter)

Apesar da importncia do tesauro, o Brasil no dispe de norma brasileira prpria. Em nvel internacional existe a
"Norma Internacional de Elaborao de Tesauros Monolngues (ISO 2788)", que apesar dos esforos empreendidos
no sentido de apresentar princpios para uma normalizao terminolgica consistente, verifica-se, ainda, muitos
problemas relativos unidade de representao, ou seja, ao termo de indexao.

O objetivo deste estudo apresentar uma anlise luz de teorias como a Teoria do Conceito (Dahlberg) e a Teoria
da Terminologia ( WUESTER, 1981 e FELBER, 1984) dos princpios relativos ao termo da Norma ISO 2788,
visando municiar o profissional de informao de uma viso crtica para lidar com questes relativas a intercmbio
de informaes no momento atual.

2. Princpios Fundamentais

A anlise da norma ISO 2788 que aqui se faz, toma por base alguns princpios que a seguir so apresentados de
forma bastante resumida, relacionados definio de 'termo'.

O Tesauro, como instrumento de controle da indexao, surgiu em servios de recuperao em ambiente


computacional. Naquele momento - no final dos anos 50 e incio dos 60 - ainda no haviam sido desenvolvidos
procedimentos computacionais para reconhecer termos constitudos por grupos de palavras. Ento, a nfase recaiu
em unidades verbais e princpios foram desenvolvidos para ajustar-se a aquela limitao tecnolgica. fcil
compreender a preocupao com conceitos como 'fatorao sinttica' e 'fatorao morfolgica' presentes na
literatura da poca e abordadas por alguns autores da dcada de 60. No entanto, se esta a motivao para o uso
de tais tcnicas, elas hoje no se justificam. Se pensarmos apenas na recuperao de palavras tais como se
encontram nos textos, tais solues podem ser satisfatrias. Mas quando tentamos aplicar estes princpios
construo de tesauro, ou seja, ao instrumento de controle do vocabulrio de indexao, vemos que eles no se
ajustam. Por exemplo, um usurio pode preparar uma busca com as palavras 'poluio' e 'atmosfrica'. E
certamente receber algo relativo a 'poluio atmosfrica'. Mas, e no tesauro, como fica estruturado o assunto? Um
tesauro no comporta adjetivos; por outro lado, qual a estrutura da expresso 'poluio atmosfrica'? um termo
especfico de 'poluio'? O ar um elemento poluidor? Ou o ar 'carrega' elementos poluidores? Ou a poluio
(qumica, fsica ou biolgica) ocorre no meio 'ar'?

A linguagem natural defendida e aceita por muitos, mas ela tem armadilhas como a do exemplo acima. Trabalhar
com a palavra (extrada da linguagem natural, tout court) parece no ser a soluo. aqui que surgem as
contribuies da Terminologia (WUESTER, 1981; FELBER, 1984) e da Teoria do Conceito DAHLBERG, 1978):
a unidade do tesauro no deve ser a palavra, mas o conceito, materializado no termo. O conceito visto, dessa
forma, como uma unidade indivisvel formada pelo referente, caracterstica e forma verbal.

Se a palavra tem seu significado evidenciado no contexto frasal, o termo, por seu turno, carrega consigo o
significado/contedo. O termo assim constitudo por uma forma verbal e um contedo conceitual. A homonmia
fica, em geral, eliminada, nos tesauros, porque estes cobrem domnios especficos do conhecimento e no contexto
do domnio que o termo evoca, para a comunidade do domnio, o contedo que tem que evocar. Um postulado da
Teoria da Terminologia que os termos guardam uma monorreferencialidade relativa.

Qual a contribuio da Terminologia para o Tesauro documentrio? Ela se ocupa do conceito e das relaes entre
eles, exatamente como deve ocorrer num tesauro documentrio. Outro postulado da Terminologia que os
conceitos se relacionam como um sistema, ou seja, eles se definem uns em relao aos outros. Fica difcil
apreender um conceito isoladamente, pois ele precisa de outros conceitos para poder ser apreendido. Por exemplo,
como dominar o conceito de 'verniz', sem ter o conceito de 'resina'? Para dominar ambos os conceitos precisamos
dominar as caractersticas de cada um dos objetos a que eles.se referem, as quais so, por sua vez, tambm
conceitos.

Ou, ento, como estruturar adequadamente no Tesauro os termos 'conhaque' e 'conhaque de gengibre'? Se
seguirmos a forma verbal, seremos tentados a afirmar que 'conhaque' o termo geral e 'conhaque de gengibre' um
termo especfico. Como nos apropriarmos corretamente do contedo de tais termos? Se analisarmos as
caractersticas dos objetos a que os termos se referem (anlise do objeto), vamos saber que o objeto 'conhaque'
um 'tipo de bebida alcolica fermentada-destilada a partir do vinho', e que o objeto 'conhaque de gengibre' um
'destilado de cana-de-aucar adicionado de gengibre, como substncia aromtica'. A partir da podemos estruturar
os termos do tesauro adequadamente, ou seja, no cairemos na armadilha de considerar o termo 'conhaque' como o
termo da classe geral, da qual 'conhaque de gengibre' seria o termo especfico, mas estabeleceremos entre eles uma
relao associativa. O que fizemos foi uma anlise terminolgica dos termos, a qual permite o estabelecimento de
relaes mais adequadas entre eles.

A anlise do referente permite estabelecer relaes lgicas (de superordenao/subordinao) e relaes


ontolgicas (partitivas e associativas).

As primeiras ocorrem quando da anlise das propriedades do objeto/referente e as segundas ocorrem quando
observamos sua relao com outros, como, por exemplo, sua funo na realidade emprica ou sua contigidade
espacial ou temporal.

Aqui incorporamos, como apresentado anteriormente, elementos da Teoria do Conceito de Dahlberg, que considera
o conceito como constitudo de trs elementos: o objeto/o referente, as caractersticas desse objeto/referente e a
forma verbal que designa esse objeto/referente. O conceito no prescinde destes trs elementos: faltando um deles
no se tem o conceito, tem-se uma 'idia' mais ou menos vaga.

A verso anterior da Norma ISO 704 (Princpios de Terminologia) , definia 'conceito' como 'unidade de
pensamento'. Concordamos com a Dra. Dahlberg que rejeita esta definio porque o pensamento sem o uso da
linguagem no pode ser comunicado, est no quadro cognitivo de um indivduo; ento, no se pode garantir
consistncia na comunicao. Durante a reunio da ISO-TC 37, em que se aprovaria a nova verso da Norma, foi
possvel aprovar a definio de conceito como 'unidade de conhecimento'. O termo a sntese, pois 'carrega' em si
as caractersticas do objeto/referente. De acordo com a norma ISO 1087 - Vocabulrio da Terminologia, 'termo'
definido como 'designao de um conceito definido numa lngua especializada, por uma expresso lingstica.'

o termo essa materializao. Esse par Conceito-Denominao constitui o Termo. Se adotarmos a palavra
denominao, em vez de termo, teremos mais facilidade em identificar a expresso lingstica que designa um
conceito, ou seja, para nomearmos um objeto utilizaremos tantas palavras quantas forem necessrias para tal.

Ora, se o 'conceito' uma unidade, ento indivisvel. Se o termo denota o conceito, ento no existe termo
composto, pois isso equivaleria dizer que um termo composto tem um conceito composto, o que no faz sentido.
Ento, afirmamos, no que respeita forma, que o termo constitudo por uma palavra ou por um grupo de
palavras. E no se pode, portanto, considerar o conceito de 'termo composto'.

Ainda que muito resumidamente, temos aqui os principais fundamentos que utilizamos na determinao em um
tesauro documentrio do que consideramos unidade de representao - o termo de indexao. E a partir destes
fundamentos so analisados alguns aspectos da norma ISO 2788.

Entretanto necessrio evidenciar o caminho que adotamos para esta anlise. A anlise da Norma ISSO 2788 se
apia na investigao do que considera termo de indexao, atravs da interpretao das definies apresentadas
na Norma.

A forma como abordamos cada definio/explicao apresentada, se consolida, tambm, por uma postura terica e
metodolgica. Desta forma, cabe ressaltar uma das propostas da Teoria Geral da Terminologia, no que se refere a
elaborao de definies:

"A caracterstica que constitui um conceito tambm um conceito. Atravs dela pode-se comparar
conceitos, classific-los em um sistema de conceitos, sintetiz-los atravs da definio, e
denomin-los atravs dos termos. O agregado das caractersticas que constituem o conceito
determina sua intenso. A partir da determinao da intenso do conceito, ou seja da delimitao de
suas caractersticas, possvel determinar tambm conceitos que possam ser relacionados ao
conceito em anlise por possuirem caractersticas semelhantes; em outras palavras, possvel
determinar a totalidade ou o nmero de conceitos que este conceito abarca, o que constitui sua
extenso". (FELBER, 1984, p. 58)

Assim, nossa anlise trata de recuperar em cada definio/explicao apresentada os elementos que compe os
conceitos analisados, que so considerados tambm conceitos materializados atravs de termos.

3. A Norma Internacional de Elaborao de Tesauros Monolngues (ISO 2788)

O objetivo do tesauro, segundo a Norma, 'assegurar uma prtica consistente num servio de indexao ou entre
diferentes servios, como, por exemplo, numa rede'.

Antes de entrarmos especificamente na questo relacionada ao termo de indexao, j detectamos na definio de


"linguagem de indexao" e "tesauro" problemas que implicam em inconsistncias.

Vejamos cada definio:

linguagem de indexao
conjunto controlado de termos selecionados da linguagem natural usados para representar, de modo resumido, o
assunto dos documentos.

Comentrio:
A definio contm o que e a funo. O que se entende por 'controlado', em que consiste o controle?
Controle de qu?
Na lngua comum 'termo' o mesmo que 'palavra'. E palavra precisa de um contexto para se depreender seu
sentido. Ora, num tesauro este contexto no existe e o significado pode se tornar ambguo. Por exemplo, seja
a palavra 'vinagre': qual o seu significado? Se, num documento ele usado referindo-se a 'vinagre de arroz' e
noutro, a 'vinagre de vinho'' (aparentemente um pleonasmo), o significado de 'vinagre' o mesmo em ambos
os casos? A palavra 'vinagre' est presente nos dois termos, mas, no primeiro caso, 'arroz' no determinante
de 'vinagre' , o que produziria um termo especfico de 'vinagre'; em suma, uma anlise lingstica do termo
no resolve a questo. preciso uma anlise terminolgica

Ento, o que o 'termo'? A Norma no define.

Quanto funo, a linguagem documentria serve para 'representar, de modo resumido, o assunto de um
documento'. 'Assunto' tambm um conceito que no est definido, embora isso no tenha maiores
conseqncias nesta anlise.

tesauro
vocabulrio de uma linguagem de indexao controlada organizada formalmente explicitando 'a priori'
relacionamentos entre os conceitos (por exemplo, 'mais geral'e 'mais especfico').

Comentrio:
Esta definio circular na primeira parte, ou seja, naquela parte que declara o que o objeto . Em
'linguagem de indexao' j est explcita a caracterstica 'conjunto de termos' ou seja, um 'vocabulrio'
(conjunto de termos ou de vocbulos)'; e tambm a caracterstica 'controlado'. Isto fica mais claro se
aplicarmos o princpio da substituio. Usando este princpio, teramos como definio de tesauro:
vocabulrio de um 'conjunto controlado de termos...'

A segunda parte da definio diz o que o tesauro possui: relaes explcitas entre os conceitos. Mas no
define o que seja 'conceito'.

Como podemos observar estas definies incluem expresses que no esto definidas, como 'termo' e 'conceito'. A
falta de uma metodologia consistente para a construo de definies vai implicar em inconsistncias no texto.

3. 1 Termo de indexao
A Norma define 'termo de Indexao' como: representao de um conceito preferencialmente sob a forma de uma
palavra ou expresso

Como observamos anteriormente, em nenhum momento ela define o que conceito. Entretanto, admite que ele (o
termo) pode ser representado sob forma de uma palavra ou expresso, acrescentando uma nota que diz: "um termo
de indexao pode consistir em mais de uma palavra e ento conhecido como termo composto"

Ao introduzir o conceito de 'termo composto' ela contradiz diversos avanos j apresentados pela Teoria do
Conceito e a Teoria da Terminologia. Desta forma, a anlise que apresentaremos a seguir tem por objetivo
evidenciar as contradies apresentadas na Norma, quanto determinao da unidade de representao dos
tesauros documentrios, analisadas luz das Teorias citadas. Especificamente, vamos tomar por base a expresso
'termo composto' e as solues apresentadas para sua fatorao.

termo composto
termo de indexao que pode ser fatorado morfologicamente em componentes separados, cada um dos quais pode
ser expresso ou re-expresso como um substantivo capaz de servir independentemente como termo de indexao.

Comentrio:
Utilizando o princpio da substituio,substituiremos termo de indexao por sua definio e teremos, ento,
que 'termo composto' a 'representao de um conceito preferencialmente sob a forma de uma palavra ou
expresso', que pode ser fatorado morfologicamente, etc. etc.

Mais uma vez encontramos o termo 'conceito', no definido. Ao propor fatorao morfolgica, a Norma est
claramente privilegiando o aspecto verbal do termo de indexao, pois se o termo representa o conceito,
quando fatoramos o termo isolamos as palavras que o constituem. E isto pode significar a destruio do
conceito, ou seja, o conceito representado por aquele grupo de palavras, deixaria de estar representado num
tesauro, em nome da fatorao morfolgica.

H uma nota extensa:


"As partes da grande maioria de termos compostos podem ser distinguidas como segue:

a) O foco, isto , o substantivo componente que identifica a classe geral de conceito qual o termo como
um todo se refere.

Exemplo 1: o substantivo componente 'indexes' no termo composto 'printed indexes'.


Exemplo 2: o substantivo 'hospitals' na expresso 'hospitals for children'.

b) A diferena ou o modificador, isto , um ou mais componentes que servem para diminuir a extenso do
foco e assim especificar uma de suas subclasses

Exemplo 1: o adjetivo 'printed' no termo composto 'printed indexes'.


Exemplo 2: a preposio + substantivo 'for children' no termo composto 'hospitals for children'."

Diz, ainda, a Norma:

"O foco e suas diferenas podem se apresentar com palavras separadas, como em "dining rooms" ou "soup
spoons" ou podem vir concatenadas numa palavra, como em "bedrooms" ou "teaspoons..."

Comentrio:
A nota a) assume que no se fatora uma expresso quando ela designa o termo especfico de uma 'classe
geral de conceito qual o termo como um todo se refere'. Neste caso, privilegia-se o sentido, ou o conceito
[como preferimos].

A nota b) focaliza a diferena ou o modificador, mas, quando apresenta o mesmo exemplo, fica numa
explicao circular: em a) o foco caracteriza o todo, em b) a diferena especifica.

A anlise 'morfolgica' continua no ltimo pargrafo.

No captulo 6 da Norma, os termos de indexao so classificados do ponto de vista conceitual, ou seja, os termos
designam:

1) Entidades concretas
* coisas e suas partes fsicas
* materiais

2) Entidades abstratas
* aes ou eventos
* entidades abstratas e propriedades de coisas, materiais ou aes
* disciplinas ou cincias
* unidades de medida

3) Entidades individuais, ou 'classes-de-um', expressas por nomes prprios

No entanto, a falta de uma definio ou explicao do que seja 'conceito' leva a Norma a desconsiderar tal
classificao e a fazer uma abordagem lingstica do termo, ao incluir um captulo sobre a forma verbal,
fornecendo orientao sobre o uso de substantivos, adjetivos, advrbios e verbos e, ainda, sobre o uso de singular e
plural.

Todo o captulo 7 trata de fatorao.

Em 7.1 encontramos:
"A fatorao semntica aplica-se a termos simples e compostos. Um termo que representa uma noo
complexa re-expressa na forma de um termo mais simples ou da definio, cada um dos quais pode
tambm ocorrer em outras combinaes para representar uma srie de diferentes conceitos. Esta tcnica
no recomendada."

Comentrio:
De fato, a fatorao semntica uma tcnica que s tem sentido quando se considera o conceito. Isto,
porque a fatorao resulta em uma seleo de caractersticas do conceito, as quais so, tambm, conceitos,
por isso que podem 'tambm, ocorrer em outras combinaes". Contrariamente ao que recomenda a Norma,
esta tcnica a nica que convm, justamente porque as caractersticas so tambm conceitos e, como tal,
podem ser estruturados no sistema de conceitos. Por exemplo, num instituto de tecnologia alimentar o termo
de uso comum 'leite de soja' no usado, mas apenas duas de suas caractersticas, a saber, os conceitos 'soja'
e 'extrato protico'.

A respeito da fatorao sinttica, a Norma diz"ela pode ocorrer na anlise morfolgica em componentes
separados, cada um dos quais pode ser aceito como um termo de indexao por si s". No recomenda esta
tcnica para termos sincategoremticos.

Comentrio:
A linguagem utilizada est coerente. Observamos que a redao se refere a 'termo de indexao' e no a
'conceito'. Como afirmamos no incio do trabalho, se pensarmos apenas em um vocabulrio controlado, no
h maiores consideraes a fazer. Mas se pensarmos num tesauro, que exige relao entre os termos, ento o
termo 'composto', quando fatorado, deixa de existir e, portanto, no includo na estrutura. Dito de outro
modo, se o termo 'composto' designa um conceito, este deixar de estar representado no tesauro (deixa de
existir) pois apenas seus componentes estaro includos.

Quanto aos termos sincategoremticos, no h um argumento para no se recomendar esta tcnica. Quando
a anlise terminolgica, e no lilngistica, como a proposta neste item da Norma, o termo
sincategoremtico denota um conceito e, portanto, indivisvel.

Em 7.2, a orientao voltada para a no-fatorao.

Devem ser mantidos como compostos:

"a) termos muito familiares no uso comum". Exemplo: 'data processing'.

Comentrio:
O conhecimento dinmico e, como um corolrio, tambm a lngua. Termo 'famililar' para quem? Quando?
Que parmetros adotar para aceitar a 'familiaridade'?

"b) perda de sentido' quando se combinam os termos. Exemplo "food + plants" pode significar tanto "food for
plants", como "plants as food".

Comentrio:
Mais uma vez, a deciso gira em torno das palavras. Ora, "food for plants" denota uma classe de substncias
para nutrir as plantas. um conceito. Quanto a "plants as food" tem-se igualmente um termo que denota
uma classe especfica de plantas, com certas caractersticas que a tornam comestveis. Os elementos do
termo so indivisveis porque denotam um conceito e cada um de seus elementos denota outros conceitos.

Na Subseo 7.2.1 h orientao para os casos em que os 'termos compostos' no devem ser separados, a saber :

a) nomes prprios

b) termos em que a diferena perdeu seu significado original. Exemplo: 'lawn tennis' e 'trade winds.
Comentrio:
Ora, se os termos denotam conceitos, por que se preocupar com o significado original de um dos elementos
do termo? O importante saber a qual objeto o termo se refere.

c) Termos que contm uma diferena que sugere uma semelhana, como um smile, com uma coisa ou evento no
relacionado. Exemplo: 'tree structures', 'wing nuts'

d) Termos que no podem ser re-expressos (por exemplo, definidos), sem o uso de um substantivo extra que esteja
presente no termo composto apenas por implicao. Exemplo: 'free escapes" (escapes for people from fire)

e) Termos que contm nomes sincategoremticos. Exemplo: 'artificial limbs'; 'fossil fishes'

Comentrio:
Embora no explicitamente, o que est sendo considerado aqui so designaes de conceitos, embora,
claramente o discurso se refira questo de isolar ou no as palavras constitutivas do termo.

A Seo 7.3.1 trata de termos que devem ser fatorados sintaticamente:

a) um termo composto deve ser fatorado se o foco se refere a uma propriedade ou parte (inclusive materiais) e a
diferena representa o todo ou o possuidor daquela propriedade ou parte. Exemplo: 'aircraft engines'; 'hospital
personnel'; 'soil acidity'

Comentrio:
Os exemplos acima deixam claro que a norma atua no plano da lngua; a estrutura das expresses acima no
existe em lngua portuguesa, a saber substantivo seguido de substantivo. Se traduzirmos as expresses,
verificaremos que o resultado se enquadra numa situao em que a Norma no recomenda fatorar.. 'Motor
de avio', em que pese a presena da preposio 'de' significa 'motor para avio' (exatamente como em
'hospital for children'). Em portugus, a preposio 'de ' uma verdadeira armadilha para este tipo de anlise.

b) ao contrrio, o nome do todo pode ser modificado pelo nome de sua parte ou propriedade. Exemplo: 'acid
soils'. 'concrete bridges'; 'skilled personnel'

Comentrio:
Na verdade, o adjetivo no pode ser separado do substantivo porque tesauros s incluem substantivos.Isolar
o adjetivo equivaleria a eliminar o termo/conceito.

A subseo 7.3.2 trata de expresses relativas a aes ou eventos:

a) o nome de uma ao transitiva no deve ser modificado pelo nome do objeto sobre o qual a ao se efetua.
Exemplos: 'office management'; 'steel casting'; textile printing

Comentrio:
Mais uma vez estamos diante de uma estrutura inexistente na lngua portuguesa, a saber substantivo seguido
de substantivo. Mas noutra parte da norma h uma referncia a uma expresso em francs "pollution de
l'air', que corresponde a 'air pollution' Ali no se prope fatorar. Ento, temos uma inconsistncia. Este
fatoramento possvel do ponto de vista lingstico, pois se trata de dois substantivos. Do ponto de vista
conceitual, porm, deixa a desejar.

b) ao contrrio, o nome de uma coisa ou material pode ser modificado pelo nome de uma ao efetuada sobre
ela/ele. Exemplo: 'cast steels'; 'extruded plants'; 'printed textiles'
Comentrio:
O adjetivo no pode ser considerado 'nome de uma ao'. Aes so designadas por substantivos ou verbos.

Ainda com relao a aes ou eventos, segue a Norma:

a) o nome de uma ao intransitiva no deve ser modificado pelo nome do realizador da ao. Exemplos: 'bird
migration'; 'plant growth'; 'metal deterioration'

Comentrio: mais uma vez temos o modelo substantivo seguido de substantivo, inexistente na lngua
portuguesa.Isto invalida o carter internacional da Norma

b) ao contrrio, o nome de uma coisa pode ser modificado pelo nome da ao intransitiva na qual ela est ou foi
envolvida. Exemplos: 'degraded plants'; 'migrating birds'; 'moving pavements'

Comentrio: Fica claro que o modelo da anlise lingstica: o adjetivo no pode ser considerado um termo.

3.1.1 Comentrio geral sobre a questo do fatoramento de termos compostos


O primeiro tipo de fatorao discutido o da fatorao semntica, que no recomendado. No entanto, o exemplo
relativo a 'leite de soja' mostra que, do ponto de vista conceitual, este fatoramento faz sentido.

Quanto aos demais caso , provvel que as justificativas talvez no cubram todos os casos que venham a surgir.
Uma coisa, no entanto, certa, se cada uma das expresses includas nos exemplos denota um conceito, se se
referem, cada uma, a um objeto abstrato ou concreto, ento so termos, e nada mais. Portanto, no cabe qualquer
discusso sobre fatoramento sinttico ou morfolgico.

Outro aspecto a considerar: se adotarmos a tcnica de fatoramento sinttico ou morfolgico, o termo que denota o
conceito fica sem estrutura no tesauro, ou seja, aquele conceito expresso por um grupo de palavras, deixa de
figurar no tesauro.

4. Consideraes finais

A adoo da Teoria do Conceito e da Teoria da Terminologia, como fundamentos para a elaborao de tesauros
documentrios fornecem as condies para se construir instrumentos de trabalho consistentes, porque a anlise
tem incio no conceito. Como se pde perceber, na Norma 2877 a anlise tem incio na expresso verbal. Da
decorrem todas as inconsistncias apontadas.

De fato, no se est negando a possibilidade de recuperao de informao atravs de indexao automtica,


vendo-a, no entanto, como ao complementar, pois um usurio busca por palavras ou expresses com as quais
est familiarizado e o sistema deve responder a isto. No entanto, o tesauro mais do que simplesmente disciplinar
o uso de termos: ele uma estrutura de conceitos e, no momento em que tanto se fala em organizao de domnios
de conhecimento e sua representao, a estrutura conceitual no pode ser desconsiderada.

Estas questes so pouco discutidas seja em aula seja nos encontros profissionais ou mesmo em listas de discusso.
Para os informticos, no entanto,, os princpios tericos do tesauro comeam a ganhar importncia nas discusses
sobre metadados, interoperabilidade e outras questes assemelhadas, pois o que se pretende estruturar, naquelas
reas, no so palavras, mas objetos, cuja manipulao se torna possvel atravs de suas denominaes (ou
termos).

Ferramentas semnticas como tesauros precisam ser construdas respeitando princpios tericos consistentes,
abarcando domnios de estudos e pesquisa em lngua portuguesa, para serem utilizadas em bibliotecas digitais e
virtuais, em sistemas para gesto de conhecimento, para viabilizarem processos de integrao de informaes entre
pesquisadores, como auxlio para as ferramentas de busca de um modo geral, e principalmente como um
instrumento para a melhoria do tratamento e da recuperao de informao na rede. Alm disso, o uso de
conceitos como base para o estabelecimento dos termos em um tesauro permite maior facilidade para o
estabelecimento de equivalentes em outras lnguas.
Atualmente, o crescimento da utilizao de arquiteturas distribudas, especialmente no ambiente da Web, de
interfaces abertas de acesso a bancos de dados, de tecnologias de mediadores e de padres de formato para troca
de dados contribuiu para que informaes originalmente isoladas sejam disponibilizadas para serem utilizadas de
maneira integrada. Tesauro assume papel fundamental nesta integrao, viabilizando a interoperabilidade
semntica de sistemas distribudos heterogneos.

Se o profissional de informao quiser atuar de forma competente nesta rea, h que dominar amplamente as bases
tericas aqui defendidas, para no ficar refm de uma dada aceitao de padres internacionais, que em muitas
vezes, no possuem um princpio terico consistente.

Notas e Referncias Bibliogrficas:

CAMPOS, Astrio T. (1986) Linguagens documentrias. Revista de Biblioteconomia de Braslia, v. 14, n. 1, p.


85-88, jan./jun.1986.

CAMPOS, Maria Luiza de Almeida. Linguagens documentrias: ncleo bsico de conhecimento para seu estudo R
Esc. Biblioteconomia UFMG, Belo Horizonte, v.24, n.1, jan./jun. 1995. p.52-62.

CAMPOS, Maria Luiza de Almeida. Linguagem documentria: teorias que fundamentam sua elaborao Niteri,
RJ: Eduff, 2001.

CAMPOS, Maria Luiza de Almeida.Modelizao de domnios de conhecimento: uma investigao de princpios


fundamentais. Cincia da Informao, Braslia, v.33, n.1, jan./abril 2004.

CAMPOS, Maria Luiza de Almeida & GOMES, Hagar Espanha. Organizao de domnios de conhecimento e os
princpios ranganathianos. Perspectiva em Cincia da Informao UFMG, Belo Horizonte, v.8, n.2, jul./dez. 2003.

DAHLBERG, Ingetraut (1978). A referent-oriented analytical concept theory of INTERCONCEPT.International


Classification v. 5, n. 3.p. 142-150.

FELBER, H. (1984) Terminology manual Paris: UNESCO.

GOMES, Hagar Espanha. Classificao, tesauro e terminologia: fundamentos comuns. (online) Capturado em 4
ago. 2004. Disponvel na Internet http://www.conexaorio.com/biti/tertulia

GOMES, Hagar Espanha; CAMPOS, Maria Luiza de Almeida; MOTTA, Dilza Fonseca da. Tutorial para
elaborao de Tesauros. (online) Capturado em 4 ago. 2004. Disponvel na Internet http://www.conexaorio.com
/biti/tesauro

HUNTER, Jane. MetaNet- A Metadata term thesaurus to enable semantic interoperability between metadata
domains. Journal of Digital Information, Special Issue on Networked Knowledge Organization Systems, Volume
1, issue 8, April 2001. Disponvel, tambm em http://archive.dstc.edu.au/RDU/staff/jane-hunter/harmony
/jodi_article.html

MOTTA, Dilza Fonseca da. Mtodo relacional como nova abordagem para a construo de tesauros. Capturado
em ago. 2004. Disponvel na Internet http://www.conexaorio.com/biti/dilza/index.htm

WSTER, E.(1981) L'Etude scientifique gnrale de la Terminologie, zone frontalire entre la Linguistique, la
Logique, l'Ontologie, l'Informatique et les Sciences des Choses. In: RONDEAU, G. & FELBER, H. (org.)Textes
choisis de Terminologie. I. Fondments thoriques de la terminologie. Qubec, GIRSTERM, p. 57-114.

Sobre as autoras / About the Authors:

Hagar Espanha Gomes


Livre-docente pela Universidade Federal Fluminense; Consultora independente.

Maria Luiza de Almeida Campos


Doutora em Cincia da Informao pelo IBICT/UFRJ; Professora Adjunta do Departamento de Cincia da
Informao da Universidade Federal Fluminense/Professora do Programa de Ps-Graduao UFF/IBICT.