You are on page 1of 7

Tesauro

Ana Mara Martnez Tamayo


Ctedra de Organizacin del Conocimiento I, Departamento de Bibliotecologa, Facultad de
Humanidades y Ciencias de la Educacin, Universidad Nacional de La Plata

acompaado de un ndice alfabtico de dichos


trminos.
Una de estas propuestas fue la de Calvin N.
Mooers, que en 1947 intercambi alguna
correspondencia sobre el tema con varios
colegas. Mooers denomin descriptores a los
trminos y diccionario de descriptores al SOC.
En el mismo ao, C.L. Bernier y E.J. Crane,
del Chemical Abstract Service, sin conocer la
propuesta de Mooers, distinguieron tres tipos de
relaciones: de subordinacin, de coordinacin y
de equivalencia. Diez aos despus, el mismo
Bernier plante la posibilidad de conectar dos
SOC de este tipo, en el sentido actual de
microtesauro y macrotesauro.
Por ltimo, en 1951 Hans P. Luhn, ingeniero
de la IBM, propuso organizar los trminos en
familias notacionales y agregar un ndice
alfabtico. Aunque en algn momento Luhn se
autoadjudic la invencin del tesauro, hoy se
sabe que los otros autores mencionados le
precedieron y que adems l conoca la
propuesta de Mooers. No obstante, fue Luhn el
primero en referirse al nuevo SOC con el
trmino tesauro.
Entre 1955 y 1958, dos aportes britnicos
enriquecieron las propuestas anteriores. Uno fue
la recomendacin de S. Whelan, del Royal
Radar Establishment, para organizar los
descriptores formando una trama o red, en vez
de las jerarquas de los tradicionales sistemas de
clasificacin decimal. La otra contribucin
provino de la Cambridge Language Research
Unit, cuyos investigadores adems de sintetizar
las propuestas anteriores, planteaban la
conveniencia de seleccionar los descriptores de
los mismos documentos a indizar, como medio
de asegurar la confiabilidad de la terminologa.
Este principio, que se conoce como garanta
bibliogrfica, es fundamental para el diseo y
construccin de tesauros.
A partir de 1957, en la empresa E.I. Du Pont
de Nemours de Estados Unidos, B.E. Holms y
L.E. Rasmussen iniciaron estudios para adoptar
el sistema Uniterm de Mortimer Taube; luego
de varios cambios, en 1959 publicaron el
Technical thesaurus of the E.I. Du Pont de
Nemours & Co. Engineering Departament, que
segn Roberts (4) puede considerarse como el
primer tesauro que entr realmente en
operaciones.

El tesauro es un sistema de organizacin del


conocimiento (SOC), cuyos trminos de
indizacin se estructuran en un sistema de
relaciones explcitas.
El tesauro consta de un vocabulario de
indizacin, conformado por descriptores e
identificadores (1-3). Ambos son trminos
aceptados para la indizacin, es decir para
describir el contenido de los documentos en
catlogos de biblioteca, bibliografas u otros
documentos secundarios.
Por otra parte, los tesauros tambin incluyen
no descriptores que son sinnimos o
cuasisinnimos de los descriptores. Su funcin
es remitir desde un trmino no usado al trmino
que s se usa.
Los descriptores, identificadores y no
descriptores forman el vocabulario de entrada
del tesauro.
En un tesauro se hacen explcitos tres tipos de
relaciones: a) las relaciones de equivalencia, b)
las relaciones de jerarqua y c) las relaciones de
asociacin. Un tesauro debe mostrar las tres
relaciones; cuando se omiten, se trata de una
lista de descriptores, pero no de un tesauro.
La sintaxis del tesauro es poscoordinada, es
decir los trminos se almacenan en el registro
bibliogrfico sin seguir un orden de cita
predefinido y se coordinan en el momento de la
recuperacin.

Historia del tesauro


En su artculo sobre los orgenes del tesauro,
Norman Roberts (4) relaciona de algn modo la
aparicin de este SOC con tres factores: a) la
llamada explosin de la informacin que dio
lugar a la desactualizacin de los SOC
tradicionales, b) la necesidad de mecanizar los
procesos tcnicos y c) la teora de la indizacin
poscoordinada del bibliotecario estadounidense
Mortimer Taube.
Hacia mediados del siglo veinte, se
presentaron en Estados Unidos tres propuestas
que, si bien formuladas por separado, coincidan
en sealar la necesidad de crear un nuevo tipo
de SOC, cuyos trminos deban organizarse o
clasificarse en un ordenamiento sistemtico
semejante al conocido diccionario ideolgico
Rogets
thesaurus
of English
words,

conviene normalizar su redaccin mediante una


norma de catalogacin, por ejemplo AACR2.
Los identificadores pueden ser de ocho tipos:
- Identificador de persona: San Martn, Jos
de 1778-1850; Kent, Clark (personaje ficticio).
- Identificador de dinasta o familia: Borbn,
Casa de; Kennedy, Familia.
- Identificador de ente corporativo: UNESCO;
Argentina. Ministerio de Salud.
- Identificador de reunin: Congreso
Latinoamericano de Bioqumica Clnica (13 :
1997 : Caracas); Congreso Latinoamericano de
Bioqumica Clnica (12 : 1995 : Buenos Aires).
- Identificador de ttulo de obra: Hamlet; Cien
aos de soledad.
- Identificador de lugar geopoltico: Crdoba
(Argentina : provincia); Crdoba (Espaa :
provincia).
- Identificador de lugar geofsico: Los Andes
(cordillera), Nahuel Huapi (lago).
- Identificador de perodo: Edad Media;
Renacimiento.

Desde entonces se ha producido una gran


cantidad de tesauros y listas de descriptores
especializados, en numerosos idiomas y pases.

El vocabulario del tesauro


Como ya se mencion, el vocabulario de
entrada del tesauro consta de descriptores,
identificadores y no descriptores, aunque slo
los dos primeros son trminos de indizacin (13).
Descriptores
Los descriptores, tambin llamados trminos
preferentes, son los trminos de indizacin por
excelencia en un tesauro (1-3).
Si se trata de entidades concretas, pueden ser:
- Cosas y sus partes, por ejemplo: pjaros,
alas, regiones montaosas, montaas.
- Materiales: adhesivos, madera, titanio,
cartn corrugado.
Si representan entidades abstractas pueden
ser:
- Acciones y eventos: comercializacin,
ftbol, fabricacin de calzado, catalogacin.
- Propiedades: elasticidad, flexibilidad,
dureza, suavidad.
- Disciplinas, artes o ciencias: arqueologa,
qumica, escultura, economa.
- Unidades de medicin: hertz, kilmetro,
ampere, megabytes.
Los descriptores se presentan en tres formas
gramaticales:
- Frase nominal compuesta por un sustantivo,
sin artculo: experimentos, ingeniera, presin,
reacciones.
- Frase nominal compuesta por un sustantivo
y uno o dos adjetivos: experimentos
educacionales, ingeniera alimentaria, presin
atmosfrica,
reacciones
termonucleares
controladas.
- Frase preposicional: experimentos de
qumica, ingeniera de riego, presin de vapor,
reacciones de agregacin.
En los tesauros no estn permitidas las frases
invertidas como Golf, campos de. Sin embargo,
el algunos idiomas como el ingls, donde el
adjetivo se antepone al sustantivo, se permite
incorporar la frase invertida como no descriptor.

Calificadores
Un calificador es una aclaracin entre
parntesis, que permite distinguir un descriptor
de sus homnimos o trminos polismicos (13). Por ejemplo:
- Mercurio (deidad)
- Mercurio (elemento qumico)
- Mercurio (planeta)
Al incluir los descriptores en un registro
bibliogrfico, se debe tener en cuenta que el
calificador es parte del descriptor y no pueden
separarse.
Nota de alcance
La nota de alcance brinda informacin
adicional sobre el descriptor. Esta nota no es
parte del descriptor (1-3).
Las notas de alcance pueden ser de distinto
tipo y su simbologa es NA:
- Una definicin del descriptor de tipo
diccionario. Ejemplo:
DESESCOLARIZACION
NA Alegato a favor de un abandono del
acercamiento formal en la orgnizacin
de un currculo.

Identificadores
- Una explicacin del alcance del descriptor.
Por su parte, los identificadores o nombres
propios, representan una entidad individual y
nica (1-3). Si bien los tesauros incluyen
algunos identificadores, todas las bibliotecas se
ven obligadas a redactar la mayora de ellos,
independientemente del tesauro. En este sentido

METALOGRAFIA
NA Abarca la metalografa microscpica, de superficie, microscpica,
radiogrfica, de rayos X, etc.

tipografa diferente (aqu se distinguen con


maysculas los descriptores y minsculas los no
descriptores).

- Una instruccin para el indicador.


DETERIORO
NA Debe utilizarse, si se puede, un
trmino ms especfico.

Relacin jerrquica

- Una nota histrica sobre el descriptor.

Esta relacin muestra la superordenacin de


un descriptor que representa la clase o el todo,
respecto a otro descriptor que representa una
especie o una parte del anterior. El primero se
denomina trmino genrico y el segundo
trmino especfico. Esta relacin se expresa
mediante la siguiente simbologa:
- TG o < precede al trmino genrico
- TE o > precede al trmino especfico
Por ejemplo:

TANZANIA
NA Habilitado en abril de 1964 por la
fusin de las repblicas de Tangaica
y Zanzbar.
En los ltimos aos se ha sugerido la
posibilidad de separar la nota de alcance de la
definicin (2,5-6). La idea apunta a que todos
los descriptores de un tesauro incluyan una
definicin de tipo diccionario, que puede
lograrse de dos formas: a) agregando la
definicin o b) vinculando el tesauro con un
diccionario en forma electrnica.
Como quiera que sea, esta modalidad an no
ha sido incluida en la norma ISO 2788 para el
diseo y construccin de tesauros y por lo tanto,
no es un requisito indispensable ... por ahora.

Ntese que en la relacin jerrquica ambos


trminos son descriptores.

Las relaciones del tesauro

Relacin asociativa

Los descriptores de un tesauro se relacionan


entre s, de tres formas distintas, que dan lugar a
tres tipos de relaciones: de equivalencia, de
jerarqua y de asociacin (1-3).

Esta relacin suele definirse por negacin, ya


que se trata de una asociacin mental entre dos
descriptores, pero que no puede ser considerada
una relacin de equivalencia o una relacin
jerrquica. Esta relacin se expresa mediante el
smbolo TR o -. Por ejemplo:

Relacin de equivalencia
Es la relacin que se establece entre un
descriptor y sus sinnimos o cuasisinnimos, es
decir los no descriptores. Esta relacin se indica
con la siguiente simbologa:
- USE precede al descriptor.
- UP (usado por) precede al no descriptor
Estas referencias pueden sustituirse por los
siguientes smbolos grficos:

Aguacate
PALTA

PALTA
UP Aguacate

PALTA
= Aguacate

FELINOS
> GATOS

GATOS
TG FELINOS

GATOS
< FELINOS

FUMADOR
TR CIGARRILLO

FUMADOR
- CIGARRILLO

CIGARRILLO
TR FUMADOR

CIGARILLO
- FUMADOR

Aqu tambin los dos trminos de la relacin


son descriptores.

En sustitucin de USE
= En sustitucin de UP
Por ejemplo:
Aguacate
USE PALTA

FELINOS
TE GATOS

Poscoordinacin
La sintaxis del tesauro es poscoordinada, es
decir los descriptores se agregan al registro
bibliogrfico de cualquier manera, sin seguir un
orden de cita preestablecido. Es durante la
recuperacin que los descriptores se coordinan
usando un medio fsico (7).
Fue en 1950 que Mortimer Taube present su
teora de la indizacin poscoordinada, que
aplic a sus conocidas fichas Uniterm. Estas
fichas tuvieron variantes como las peek-a-boo,
de coincidencia ptica, etc.
En la actualidad, la poscoordinacin se logra
gracias al poder que tiene la computadora para

En el ejemplo anterior, el descriptor es


PALTA y el no descriptor es Aguacate, es decir
ste ltimo trmino no puede usarse en la
indizacin.
Ntese que generalmente los descriptores y
los no descriptores se escriben con una

MANUSCRITOS Z15.42.10
NA Textos escritos a mano o
mecanografiados de la obra de un
autor antes de su impresin
UP Manuscritos antiguos
TG Documentos inditos
TE Manuscritos cientficos
TR Conservadores de los manuscritos
Paleografa

coordinar los trminos con los operadores


booleanos AND, OR y NOT.
Por ejemplo, un documento sobre la
conservacin de ballenas y delfines en
Argentina, se indiza en el registro bibliogrfico
con los siguientes descriptores:
DESCRIPTORES [65]: Argentina%Balle
nas%Delfines%Conservacin

Ntese que los descriptores no estn


ordenados en el registro. En el momento de la
recuperacin, el usuario puede obtener el
registro coordinando los descriptores, entre
otras con las siguientes estrategias de bsqueda:

Manuscritos antiguos
USE MANUSCRITOS
En la seccin clasificada, los descriptores se
pueden presentar ordenados en una lista
sistemtica, por ejemplo:

Argentina AND ballenas

Z15.42 Documentos inditos


Z15.42.10 Manuscritos
Z15.42.30 Correspondencia
[...]
Z15.50 Material efmero

(ballenas OR delfines) AND


conservacin
Argentina AND delfines AND
conservacin
conservacin AND Argentina AND
(ballenas OR delfines)

En otros tesauros la seccin tiene una


presentacin grfica, ya sea una estructura
arborescente, un diagrama de flechas u otros (13).

Ordenamiento de los descriptores en


el tesauro

Indizacin con tesauro

Un tesauro posee, por lo menos dos


secciones:
- Una seccin alfabtica, en la que los
descriptores se ordenan segn las letras del
alfabeto.
- Una seccin sistemtica o clasificada, donde
los descriptores se ordenan de acuerdo con un
esquema de clasificacin predefinido.
Estas dos secciones se vinculan mediante un
nexo, que puede ser una notacin.
La informacin incluida en la seccin
alfabtica incluye los siguientes datos:
DESCRIPTOR
NA
UP
TT
TG
TE
TR

Para indizar un documento utilizando los


descriptores de un tesauro, es necesario seguir
los tres pasos de la descripcin de contenido (78):
1. Anlisis conceptual
2. Traduccin de conceptos a descriptores
3. Registro en el catlogo o bibliografa
En el Anexo 1 se muestran estos pasos con
ms detalle.
Anlisis conceptual

Nexo o notacin

El documento debe ser examinado mediante


una lectura tcnica (7-8). A partir de este
examen, se identifican los conceptos relevantes.
Por ejemplo, un documento sobre la educacin
continua de los mdicos en Uruguay, tendr
como conceptos:
- Educacin continua
- Mdicos
- Uruguay

No descriptor
USE DESCRIPTOR

Traduccin a descriptores

Por ejemplo:

Siguiendo con el ejemplo anterior, se


considera el primer concepto (7-8), es decir
Educacin continua. Se consulta el tesauro y se
encuentra la siguiente referencia:

(En todos los casos, el elemento de entrada se


registra en el subcampo $a)

Educacin continua
USE EDUCACIN PERMANENTE

Materia [650]: $aEducacin permanen


te%$aMdicos
Lugar [651]: $aUruguay

Siguiendo esta instruccin, se analiza el


descriptor indicado y sus referencias:
EDUCACIN PERMANENTE
UP Aprendizaje continuo
Educacin continua
Educacin postescolar
TE Educacin recurrente
TG Sistemas educacionales
TR Educacin compensatoria
Educacin de adultos
Educacin informal

Bibliografa
1.

2.

Tras evaluar los TG, TE y TR, se decide que


el descriptor apropiado para el concepto
identificado es Educacin permanente. A
continuacin se realizan las mismas operaciones
para los dems conceptos.

3.

4.

Registro en el catlogo o bibliografa


En los catlogos definidos con los formatos
de uso comn en nuestro medio, basados en el
Common Communication Format (CCF) de
Unisyst, los descriptores y los identificadores se
registran en el mismo campo (9):
- FOCAD: campo 65
- BIBUN: campo 65
- CEPAL: campos 76 y 77
Ejemplo:
DESCRIPTORES [65]: Educacin
nente%Mdicos%Uruguay

5.

perma

6.
Respecto a los formatos tipo MARC, los
identificadores se registran en campos
separados de los descriptores (9), siendo los
siguientes:
Para MARC21st:
- Descriptores: campo 650
- Identificador de persona, dinasta o familia:
campo 600
- Identificador de ente corporativo: campo
610
- Identificador de reunin: campo 611
- Identificador de ttulo: campo 630
- Identificador de lugar: campo 651
Para UNIMARC:
- Descriptores: campo 606
- Identificador de persona: campo 600
- Identificador de dinasta o familia: campo
602
- Identificador de ente corporativo: campo
601 (incluye los identificadores de reunin).
- Identificador de ttulo: campo 605
- Identificador de lugar geogrfico: campo
607

7.

8.

9.

*International Organization for Standardization. Guidelines for the establishment


and development of monolingual thesauri.
2 ed. Geneva: ISO, 1986 (ISO 2788). [Se
puede sustituir por la norma espaola UNE
50106 de 1990].
Aitchison J, Gilchrist A, Bawden D.
Thesaurus construction. 3 ed. London:
Aslib, 1997.
*Lancaster FW. El control del vocabulario
en la recuperacin de informacin.
Valencia: Universitat de Valncia, 1995.
Roberts
N.
Historical
studies
in
documentation:
pre-history
of
the
information retrieval thesaurus. Journal of
Documentation 1984; 40(4):271-85.
Aguado A, Pisarello RZ, Martnez AM,
Delorensi C. En: Lpez Huertas MJ,
Fernndez Molina JC, editores. La
representacin y la organizacin del
conocimiento en sus distintas perspectivas:
su influencia en la recuperacin de la
informacin: Actas del Congreso Congreso
ISKO-Espaa EOCONSID 99 (4: 1999:
Granada). Granada, Espaa, 22-24 de abril
de 1999. Granada: Universidad de Granada,
1999, p. 127-32.
National
Information
Standards
Organization.
Developing
the
next
generation of standards for controlled
vocabularies and thesauri [en lnea].
Bethesda: The Organization, 2003.
Disponible en: http:www.niso.org/commit
tees/ MT-info.html
*Lancaster FW. Indizacin y resumen:
teora y prctica. Buenos Aires: EB
Publicaciones, 1995. Caps. 2 y 3.
*International Organization for Standardization. Documentation: methods for
examining documents, determining their
subjects and selecting indexing terms.
Geneva: ISO, 1985 (ISO 5963 E). [Se
puede sustituir por la norma espaola UNE
50121 de 1991].
Martnez AM, Ramn S. Los formatos
bibliogrficos usados en bibliotecas
argentinas y sus implicaciones para la
descripcin de contenido en catlogos en
lnea. Informacin, Cultura y Sociedad
1999; 1(1):27-48.

[Las referencias marcadas con * son lecturas


obligatorias].

Autoevaluacin
1.
2.

3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.

Qu es un tesauro?
Cul es la diferencia entre el
vocabulario de entrada y el vocabulario
de indizacin?
Qu es un descriptor?
Qu formas gramaticales puede tener un
descriptor?
Qu es un identificador?
Cules son los diferentes tipos de
identificadores?
Qu es un calificador?
Qu es una nota de alcance?
Qu es una relacin de equivalencia?
Cul es su simbologa?
Qu es un no descriptor?
Qu es una relacin jerrquica? Cul es
su simbologa?
Qu es una relacin asociativa? Cul es
su simbologa?
Por qu el tesauro es poscoordinado?
Qu tipo de ordenamiento presenta un
tesauro?

[Responda estas preguntas sobre la base de este


texto y de la bibliografa de lectura obligatoria].

Anexo 1
FLUJOGRAMA DE LAS OPERACIONES DE INDIZACIN UTILIZANDO UN TESAURO

Inicio

Examine el documento e
identifique conceptos

Considere el primer
concepto

El tesauro
contiene un
trmino que
denote el
concepto?

No

El concepto se
expresa combinando
varios descriptores?

Si

Es un
descriptor?

No

Establezca un
trmino que
denote el
concepto

Si

El nuevo trmino
es adecuado como
descriptor?

Seleccione otro
trmino que
represente el
concepto

No

Si

No

Seleccione un
descriptor
Si

Considere el descriptor

Admita el nuevo
descriptor en el tesauro
(control de autoridades)

Considere cada uno de


los descriptores

Considere los trminos


asociados en el tesauro:
TG, TE, TR

Es mejor el
descriptor
asociado?

Si

No

Asigne
descriptores
en el registro
bibliogrfico

Existe otro
concepto?

No
Fin

Si

Prefiera el
descriptor
asociado

International Standard Organization. Documentation: methods for examining documents, determining their subjects, and
selecting indexing terms. Geneva: ISO, 1985 (ISO 5963-1985 (E).
7

You might also like