You are on page 1of 12

Referência bibliográfica deste artigo:

ALMEIDA, G. M. B.; ALUÍSIO, S. M.; OLIVEIRA, L. H. M. O


método em Terminologia: revendo alguns procedimentos. In:
ISQUERDO, Aparecida Negri; ALVES, Ieda Maria. (Orgs.).
Ciências do léxico: lexicologia, lexicografia, terminologia. 1 ed.
Campo Grande/São Paulo: Editora da UFMS/Humanitas, 2007, v.
III, p. 409-420.

O MÉTODO EM TERMINOLOGIA: REVENDO


ALGUNS PROCEDIMENTOS

Gladis Maria de Barcellos Almeida∗


Sandra Maria Aluísio**
Leandro Henrique Mendonça de Oliveira***

Desde 2000 vimos tentando sistematizar um método


de trabalho que, além de ser eficiente para a geração de
produtos terminológicos, estivesse em consonância com os
postulados de uma Terminologia de orientação descritiva,
fundamentada em princípios da Lingüística, cujo exemplo
mais consolidado é a Teoria Comunicativa da Terminologia
(TCT) (CABRÉ, 1999, 2003).
Filiar-se teoricamente à TCT significa,
fundamentalmente, abandonar “o tratamento prescritivo das
terminologias em favor de enfoques descritivos capazes de
entender o léxico especializado como um elemento natural
das línguas naturais” (KRIEGER e BEVILACQUA, 2005).
Estabelecemos, então, como método de trabalho, uma
seqüência de etapas que entendemos sejam constitutivas de


Universidade Federal de São Carlos – UFSCar. E-mail: gladis@ufscar.br.
**
Universidade de São Paulo/Câmpus de São Carlos. E-mail:
sandra@icmc.usp.br.
***
PPG/Ciências de Computação e Matemática Computacional/USP. E-
mail: lhmoliveira@gmail.com.

409
qualquer projeto terminológico com fins terminográficos e
que tenham a filiação teórica mencionada acima. As etapas
são as seguintes: 1) coleta (ou extração) de termos; 2)
elaboração do mapa conceitual (também denominado
estrutura conceitual), doravante ontologia1; 3) inserção dos
termos na ontologia e sua validação pelos especialistas; 4)
elaboração e preenchimento das fichas terminológicas; 5)
elaboração e incremento da base definicional; 6) elaboração
das definições e informações enciclopédicas (quando for o
caso); 7) edição dos verbetes. Faremos, a seguir, uma breve
explanação de cada uma dessas etapas.
A extração de termos diz respeito à obtenção do
conjunto terminológico que comporá a nomenclatura2 do
glossário ou dicionário. As fontes a partir das quais serão
extraídos os termos devem ser previamente selecionadas,
preferencialmente, devem ser fontes indicadas pelos próprios
especialistas da área-objeto. A extração pode ser feita de
forma manual ou automática, entretanto, quando se utiliza
extração automática, é necessária a elaboração de córpus em
formato digital, evidentemente. Os termos obtidos devem ser
inseridos na ontologia, por isso ela deve ser organizada
preliminarmente, ou concomitantemente à extração dos
termos, já que à medida que os termos vão sendo obtidos é
que se pode ter uma visão real de quais serão os campos
nocionais que deverão integrar a ontologia.
A ontologia é uma organização semântica da área-
objeto, semelhante ao que se entende por árvore de domínio, a
diferença é que os conceitos/termos estão ali armazenados.
Organiza-se uma estrutura constituída de campos nocionais, de
forma que essa estrutura reflita os conceitos da área-objeto bem
como as relações entre eles. A ontologia deve ser elaborada pelos
terminólogos com assessoria dos profissionais da área-objeto. Na
pesquisa terminológica, a ontologia é fundamental para: 1)
possibilitar uma abordagem mais sistemática de um campo de

1
O termo ontologia será utilizado neste trabalho com o sentido empregado em
Ciência da Informação.
2
Nomenclatura é o conjunto de unidades léxicas que vão constituir as entradas do
glossário ou dicionário.

410
especialidade; 2) circunscrever a pesquisa, já que todas as
ramificações da área-objeto, com seus campos, foram
previamente consideradas; 3) delimitar o conjunto terminológico;
4) determinar a pertinência dos termos, pois separando cada grupo
de termos pertencente a um determinado campo, poder-se-á
apontar quais termos são relevantes para o trabalho e quais não
são; 5) prever os grupos de termos pertencentes à área-objeto,
como também os que fazem parte de matérias conexas; 6) definir
as unidades terminológicas de maneira sistemática e, finalmente;
7) controlar a rede de remissivas (ALMEIDA, 2000:120).
A partir do momento que os termos estão alocados na
ontologia, pode-se proceder à sua validação pelos
especialistas. A validação de termos pelos especialistas é feita
da seguinte maneira: selecionam-se da ontologia determinados
campos nocionais e pede-se que cada assessor assinale os termos
considerados semanticamente relevantes em cada campo. A esse
modo de selecionar termos denominamos critério semântico. Há
que se ressaltar que esse critério é útil quando não se utiliza a
extração automática de termos.
Após a validação, obtêm-se os termos considerados
relevantes. Passa-se, então, ao preenchimento das fichas
terminológicas. O preenchimento das fichas é uma etapa
imprescindível numa pesquisa terminológica. A ficha
constitui-se num verdadeiro dossiê do termo, contendo toda a
sorte de informações que se mostrarem pertinentes para a
pesquisa em foco. Daí a razão de ela ser planejada logo no
início do trabalho. Importa mencionar que não há um modelo
ideal de ficha terminológica, cada ficha deve refletir as
necessidades do projeto, isto é: “para quê” e “para quem” se
faz determinado glossário ou dicionário. Isso auxilia o
terminólogo a prever quais campos deverão constar do
protocolo de preenchimento da ficha terminológica.
Concomitante ao preenchimento da ficha, incrementa-
se a base definicional. A base definicional tem como função
armazenar todos os excertos definitórios ou quaisquer
contextos explicativos referentes aos termos, de forma a
facilitar a redação da definição. Esses excertos são extraídos
da bibliografia especializada disponível. É imprescindível

411
armazenar essas informações, uma vez que: 1) somente com
o preenchimento de um número suficiente de excertos
definitórios é que a redação de uma definição pode ser
iniciada; 2) a quantidade e qualidade de excertos devem ser
suficientes para elucidar o redator das definições, uma vez
que este não é um especialista da área-objeto; 3) as
definições, depois de elaboradas, são submetidas à apreciação
dos especialistas, caso eles encontrem algum problema
conceitual, questionem as fontes bibliográficas ou peçam que
o trabalho seja refeito, é possível um retorno a essas
informações constantes da base definicional, não sendo
necessária uma volta aos textos originais, que nem sempre
estão à disposição de terminólogo. Em vista disso, a base
deve ser freqüentemente atualizada.
A etapa de redação da definição terminológica é a
mais complexa, custosa e importante numa pesquisa
terminológica que objetiva a elaboração de dicionários
especializados, já que um bom dicionário se avalia,
principalmente, pela qualidade das suas definições.
Segundo Sager (1993:68), a definição, como produto,
é uma descrição lingüística de um conceito, baseada numa
lista de características que transmitem o significado desse
conceito. O texto definitório possui a forma de uma
predicação sobre uma palavra ou expressão. Ressalte-se,
ainda, que as definições especializadas, como Sager
(1993:68) as denomina, descrevem um conceito dentro de um
campo temático especializado. No âmbito do nosso método
de trabalho, as definições são geradas levando-se em
consideração algumas orientações. São elas: 1) o dicionário
terminológico tem a função precípua de facilitar a
comunicação, para tanto, o texto definitório deve ser
suficientemente claro e completo para que o consulente
entenda. Assim, ainda que os tipos de definição sejam
utilizados como orientação, eles não devem subjugar o texto.
Ao contrário, se tivermos de fazer concessões para que se dê
o entendimento do termo-entrada, essas concessões serão
feitas; 2) não estabelecemos com exatidão que a(s)
característica(s) intrínseca(s) deve(m) figurar na definição e

412
a(s) extrínseca(s) na informação enciclopédica, pois nem
sempre se pode classificar com segurança o que são
características (ou traços distintivos) intrínsecas e extrínsecas
do conceito cujo termo está sendo definido.
No que concerne à redação do texto propriamente
dita, temos considerado características que já são consenso
em Terminologia, mas que não explicitaremos aqui.
Gostaríamos de salientar, entretanto, que uma série de
procedimentos no tocante à redação da definição
terminológica podem se sistematizados, de modo a facilitar
tanto a elaboração quanto a validação.
Juntamente com a redação da definição, costuma-se
redigir também as informações enciclopédicas. Ambas são
tratadas de modo diferente porque normalmente a definição é
um campo obrigatório do verbete, e a informação
enciclopédica não. Ressalte-se, ainda, que tanto definições
quanto informações enciclopédicas são validadas pelos
especialistas. Depois de elaboradas e validadas, as
definições3 e as informações enciclopédicas (se for o caso)
devem ser inseridas nos campos correspondentes da ficha
terminológica, o que permitirá a edição final dos verbetes.
A edição dos verbetes nada mais é do que a seleção
de alguns campos da ficha para constarem do modelo do
verbete final. Via de regra, há nos verbetes informações
sistemáticas (obrigatórias em todos os verbetes) e não-
sistemáticas (informações não recorrentes). Um modelo de
verbete que nos pareceu bastante satisfatório é o apresentado
no Glossário de termos neológicos da economia, projeto
coordenado pela Profa. Dra. Ieda Maria Alves, USP-SP,
1998.
Essa seqüência de etapas, embora se tivessem
revelado úteis em termos metodológicos, apresentavam
alguns inconvenientes devido à maneira como vínhamos

3
Para saber mais sobre a definição, sugerimos a leitura da tese de
doutorado de Maria José Bocorny Finatto, intitulada Definição
terminológica: fundamentos teórico-metodológicos para sua descrição e
explicação. Porto Alegre: Instituto de Letras, Universidade Federal do
Rio Grande do Sul, 2001.

413
trabalhando. Com relação à extração manual de termos, esses
inconvenientes diziam respeito a: 1) dispêndio de tempo; 2)
critério semântico para a seleção dos termos que se tornariam
verbetes do dicionário, já que a extração manual inviabiliza a
utilização do critério freqüência; 3) impossibilidade de se
armazenar contextos relevantes sobre cada termo, o que
dificulta o processo, pois num trabalho terminográfico é de
extrema relevância o acesso a contextos para a elaboração da
definição, como já foi mencionado anteriormente.
Outros inconvenientes diziam respeito à quantidade
de programas utilizados: 1) para a elaboração da ontologia,
utilizava-se o Folio Views; 2) para a elaboração das fichas
terminológicas, o Access (Microsoft); 3) para a organização e
incremento da base definicional, redação da definição e
informações enciclopédicas, edição dos verbetes e
documentos gerados para controlar a interação com os
especialistas, utilizava-se o Word (Microsoft); e, finalmente;
4) para estabelecer contato com os especialistas, o Outlook
Express (Microsoft).
Há que se mencionar ainda a necessidade de todos os
integrantes da equipe estarem fisicamente no mesmo local
para terem acesso às bases terminológicas, inviabilizando a
participação de pessoas que, por alguma razão, não pudessem
estar presentes.
Assim, agregamos à nossa proposta metodológica a
contribuição advinda da Informática, não sem razão, já que o
crescimento de estudos e pesquisas na área de Lingüística
Computacional e Lingüística de Córpus e o conseqüente
aprimoramento e desenvolvimento de ferramentas
computacionais voltadas para o processamento de língua
natural (PLN) do português começam a interferir diretamente
na prática terminográfica.
Projetamos, então, um ambiente computacional,
denominado e-Termos4, para auxiliar a pesquisa

4
O projeto está sendo desenvolvido por Leandro Henrique Mendonça de Oliveira,
como tese de doutorado em Ciências de Computação e Matemática
Computacional, com orientação de Sandra Maria Aluísio. O e-Termos resultou de
um Projeto FAPESP (proc. no. 2003/06569-3) coordenado por Gladis Maria de

414
terminológica/terminográfica. Entendemos que fazer
Terminologia na era da Informática significa criar um
conjunto de procedimentos automatizados ou semi-
automatizados que dêem suporte àquelas tarefas do trabalho
terminológico anteriormente citadas.
Amparado pelos pressupostos da Terminologia de
orientação descritiva, o e-Termos é um ambiente
computacional que contempla as atividades de
desenvolvimento de terminologias. Como uma aplicação
Computer Supported Collaborative Work (CSCW), o e-
Termos é um Ambiente Web Colaborativo, composto por seis
módulos de trabalho independentes, mas inter-relacionados,
cujo propósito é automatizar ou semi-automatizar as tarefas
de criação e gerenciamento do trabalho terminológico.
Perfazendo desde a criação automática de córpus
especializados (Módulo 0) até a distribuição e intercâmbio do
conjunto de verbetes (Módulo 5), o principal diferencial do e-
Termos está na característica colaborativa que este ambiente
computacional implementa. Baseado nos processos de apoio
e cooperação de um conjunto diferenciado de profissionais, o
e-Termos possibilita o trabalho, a produção em conjunto e a
troca de informações para melhorar as atividades de grupos
de usuários com interesses e propósitos comuns. Além disso,
o aspecto colaborativo permite a sistematização e o
mapeamento do fluxo de atividades dos diversos
profissionais envolvidos na criação de produtos
terminológicos, produzindo resultados mais rápidos e fiáveis.
Em outras palavras, o e-Termos permite que os diferentes
integrantes de uma mesma equipe de pesquisa possam
acessar, editar, atualizar, inserir e retirar informações de
todos os Módulos (córpus, ontologia, fichas terminológicas,
base definicional, redação de definições, edição de verbetes),
bastando conectar-se à Internet, buscar a URL5 e utilizar uma

Barcellos Almeida e intitulado Extração automática de termos e elaboração


colaborativa de terminologias para o intercâmbio de conhecimento especializado
– TermEx.
5
“[Sigla do ingl. u(niform) (ou, originalmente, universal) r(esource) l(ocator),
‘localizador uniforme (ou universal) de recursos’.] Sigla que designa a localização

415
senha de acesso. O mesmo procedimento pode ser utilizado
para a interação com os especialistas da área-objeto, ou seja,
especialistas previamente selecionados podem opinar,
criticar, sugerir alterações, ratificar os dados (lista de termos,
definições, etc.) por meio de acesso à Internet, num processo
incremental de construção do produto terminológico.
Outras vantagens do e-Termos são:
1. A criação rápida e automática de córpus: esses córpus,
chamados de descartáveis, podem ser criados de maneira
relativamente simples a partir de consultas a um motor de
busca na Web6.
2. A possibilidade de análise qualitativa do córpus: ao
lado da compilação automática e manual de córpus, um
conjunto de ferramentas lingüísticas será implementado para
avaliar a qualidade do córpus compilado, já que este influi
diretamente na qualidade do produto final. Podemos afirmar
que essa é uma das etapas em que o projeto e-Termos
avançou bastante. Há que se registrar os benefícios que esse
projeto pode receber do Núcleo Interinstitucional de
Lingüística Computacional (NILC7). Durante os 12 anos de
existência do NILC, várias ferramentas de PLN foram
desenvolvidas. Por exemplo, no Projeto Lácio-Web8, foram
criados: contadores de freqüência de palavras que fazem um
tratamento de lexia complexa, contadores de freqüência de
uma única palavra ou expressão, concordanciadores9,

de um objeto na internet, segundo determinado padrão de atribuição de endereços


em redes.” (Novo Dicionário Eletrônico Aurélio, versão 5.0)
6
Nessa tarefa, utiliza-se o BootCat, um toolkit de domínio público. A partir dele,
é possível montar um córpus de modo iterativo, partindo de um conjunto pequeno
de termos de um dado domínio. Para saber sobre o BootCat, sugerimos a consulta
a BARONI, M. & BERNARDINI, S. 2004. BootCaT: Bootstrapping corpora and
terms from the Web. In: Proceedings of LREC 2004, Lisboa, Portugal, 2004,
1313-1316.
7
O NILC está sediado no Instituto de Ciências Matemáticas e de Computação
(ICMC) da Universidade de São Paulo (USP), câmpus de São Carlos, SP
(http://www.nilc.icmc.usp.br/nilc/).
8
http://www.nilc.icmc.usp.br/lacioweb/
9
Concordanciador é uma ferramenta que gera concordâncias. Em Processamento
de Língua Natural (PLN), “concordância é uma listagem das ocorrências de um
item específico, dispostas de tal modo que a palavra de busca (aquela que se tem
interesse em investigar) aparece centralizada na página (ou tela do computador).

416
etiquetadores (taggers); no Projeto ExPorTer10 foram
avaliados e disponibilizados quinze métodos de extração11 de
candidatos a termos de três abordagens: estatística, simbólica
e híbrida, sendo que uma delas se baseia na identificação de
n-gramas12; no Projeto ReGra13 foi criado um corretor
gramatical do português do Brasil que já foi incorporado em
outros projetos do NILC, por exemplo, o SCIPO14; nos
Projetos PESA15 e PEWA16 foram criados alinhadores de
sentença e de palavras a partir de córpus paralelos. Outras
ferramentas como segmentadores sentenciais, lematizadores
e identificadores de neologismos também estão disponíveis
no NILC. Todas essas ferramentas citadas, se bem
orquestradas, podem ajudar a avaliar a qualidade dos córpus,
dos córpus já compilados e trazidos para o ambiente do e-
Termos ou aqueles que podem ser criados automaticamente a
partir da concatenação de arquivos que foram trazidos para o
e-Termos. Essa combinação das ferramentas citadas e de
outras que se fizerem necessárias estará disponível a partir do
Módulo 1 do e-Termos. Por exemplo, ao ativar um corretor
gramatical, podemos avaliar a correção dos córpus criados a
partir de textos da Web, pois sabemos que a qualidade
gramatical dos textos da Web nem sempre é a esperada para
um projeto de terminologia. Ao aplicar um contador de
freqüência a um córpus, podemos ver as palavras mais
freqüentes, o índice vocabular de um córpus (token/type
ratio), as ocorrências dentro de um córpus que não são
palavras da língua em questão (e podem se caracterizar como

A palavra de busca é acompanhada do seu cotexto original, isto é, das palavras


que ocorreram junto com elas no corpus.” (BERBER SARDINHA, 2004:187)
10
http://www.nilc.icmc.usp.br/nilc/projects/termextract.htm
11
Para saber mais sobre extração de terminologias, sugerimos a leitura da tese de
doutorado de Rosa Estopà Bagot, intitulada Extracció de terminologia: elements
per a la construcció d’un SEACUSE (Sistema d’Extracció Automàtica de
Candidats a Unitats de Significació Especialitzada). Universidade Pompeu Fabra,
1999.
12
Lexias com número indeterminado de palavras.
13
http://www.nilc.icmc.usp.br/nilc/projects/regra.htm
14
http://www.nilc.icmc.usp.br/nilc/projects/scipo.htm
15
http://www.nilc.icmc.usp.br/nilc/projects/pesa.htm
16
http://www.nilc.icmc.usp.br/nilc/projects/PEWA.htm

417
erro de digitação, por exemplo) e outras informações
relacionadas.
3. A categorização e visualização dos termos em uma
ontologia: utilizando a visualização hiperbólica e de grafos
orientados, a categorização e a visualização dos termos em
uma ontologia permitirá ao terminólogo ou especialista a
identificação dos termos alocados em seus respectivos
campos nocionais, favorecendo a visualização das relações
conceituais. Outra vantagem dessa ontologia é a
possibilidade de visualizar fichas, imagens, tabelas e toda a
sorte de informações referentes aos termos, bastando para
isso posicionar o cursor sobre o termo na ontologia. Ressalte-
se ainda a possibilidade de estar acessível via Internet para o
público geral e especializado, possibilitando a qualquer
usuário criar e visualizar suas ontologias a qualquer tempo.
4. A criação customizada das fichas terminológicas:
devido à possibilidade de criação de vários produtos
terminológicos em paralelo, em diferentes áreas e com
diferentes equipes de trabalhos, o e-Termos também prevê a
criação flexível e customizada de fichas terminológicas,
podendo ser específicas e adequadas a cada produto ou
trabalho desenvolvido no Ambiente, possibilitando a
elaboração de variados produtos terminológicos, desde aos
mais simples (com menos campos) aos mais sofisticados.
5. O gerenciamento da base definicional: além de
possibilitar a constante atualização da base definicional, será
possível também acessar o córpus, de forma a obter contextos
que se mostrarem úteis para a elaboração das definições.
6. A redação assistida da definição terminológica: como
essa é uma tarefa bastante complexa numa pesquisa
terminográfica, e por isso exigirá mais esforço
computacional, para a implementação dessa ferramenta serão
consideradas as abordagens utilizadas em sistemas de ensino
apoiado por computador (ALUÍSIO et al., 2001).
7. A edição de verbetes: a partir dos campos previamente
selecionados nas fichas terminológicas, será possível gerar os
verbetes de forma automática.

418
Podemos afirmar com segurança que as etapas em que
o projeto e-Termos mais avançou estão relacionadas a: 1)
elaboração, suporte e análise da qualidade do córpus; 2)
ferramentas de extração automática de candidatos a termos;
3) edição de ontologias. Como o e-Termos ainda está em fase
de elaboração, nem todos os Módulos estão implementados.
Os recursos referentes a: criação customizada das fichas
terminológicas, gerenciamento da base definicional, redação
assistida da definição terminológica e edição de verbetes
ainda serão implementados.
Nosso desiderato é que o e-Termos17 satisfaça
algumas exigências básicas da pesquisa terminológica,
disponibilizando recursos para: 1) extração automática de
termos; 2) elaboração colaborativa do produto terminológico
através de criação, validação, alteração, importação de dados
e gerenciamento de todos os aspectos da base de dados
terminológica; 3) intercâmbio (exportação de terminologia
para outros sistemas de gerenciamento) e difusão de todo o
conhecimento especializado disponível.
Após essa breve explanação sobre o e-Termos, é
possível avaliar a sua importância para as pesquisas
terminológicas em língua portuguesa. Não só pelo fato de
tornar o trabalho terminológico mais ágil e fiável, mas
fundamentalmente pelo fato de o e-Termos constituir o
resultado prático de reflexões cuidadosas sobre a proposição
de um método em Terminologia, um método que procura
explicitar os postulados de uma Terminologia de orientação
descritiva, fundamentada em princípios da Lingüística, como
já mencionamos no início deste artigo.
Nesse sentido, ao oferecer uma solução metodológica
adequada e suficiente para as nossas demandas, esperamos
poder contribuir para as pesquisas terminológicas em língua
portuguesa.

17
O primeiro lançamento público do e-Termos deve acontecer em abril de 2006.
A previsão é de que a versão final e oficial esteja pronta para utilização a partir de
2009.

419
REFERÊNCIAS

ALMEIDA, G. M. B. Teoria Comunicativa da Terminologia:


uma aplicação. Araraquara, vol. I, 290 p.; vol. II, 86 p. Tese
(Doutorado em Lingüística e Língua Portuguesa) – Faculdade
de Ciências e Letras, Câmpus de Araraquara, Universidade
Estadual Paulista, 2000.
ALUÍSIO, S. M.; BARCELOS, I.; SAMPAIO, J.;
OLIVEIRA JR, O. N. How to Learn the Many Unwritten
‘Rules of the Game’ of the Academic Discourse: A Hybrid
Approach Based on Critiques and Cases to Support Scientific
Writing. In: IEEE International Conference On Advanced
Learning Technologies, 2001, Madison, Wisconsin/Los
Alamitos, CA: IEEE Computer Society, 2001. v. 1, p. 257-
260.
ALVES, I. M. Glossário de termos neológicos da economia.
São Paulo: Humanitas, FFLCH, USP, 1998.
BERBER SARDINHA, T. Lingüística de corpus. Barueri:
Manole, 2004.
CABRÉ, M.T. La terminología: representación y
comunicación – elementos para una teoría de base
comunicativa y outros artículos. Barcelona: Institut
Universitari de Lingüística Aplicada, 1999.
_____ Theories of Terminology: their description,
prescription and explanation. Terminology, v. 9, n. 2, 2003, p.
163-200.
KRIEGER, M. G.; BEVILACQUA, C. R. A pesquisa
terminológica no Brasil: uma contribuição para a
consolidação da área. Debate Terminológico, no. 1, 03/2005.
Disponível em http://www.riterm.net/ revista.
SAGER, J. C. Curso práctico sobre el procesamiento de la
terminología (trad. castelhana de Laura C. Moya). Madrid:
Fundación Germán Sánchez Ruipérez/Pirámide, 1993.

420