You are on page 1of 1

A co-indexao semntica das bases WordNet.Br e WordNet.Pr: alinhamentos por hiperonmia Alexandre Pompeo; Prof. Dr.

Bento Carlos Dias da Silva Centro de Estudos Lingsticos e Computacionais, Faculdade de Cincias e Letras, UNESP, Araraquara 1. Objetivos
A WordNet.Br (WN.Br), um base relacional de unidades e expresses lexicais do portugus do Brasil (DIAS-DA-SILVA et al., 2006), dever constituir um recurso para o estudo de lnguas, para aplicaes como sistemas de traduo automtica, motores de busca da WEB, processadores automticos de texto, aplicativos de recuperao de textos e de informao e dicionrios digitais porrtugusingls para acesso gratuito on-line na WEB. frequentemente encontradas na construo das conexes entre as bases da WN.Br e WN.Pr. Aqui ilustra-se um tipo dessas lacunas, a lacuna cultural (cultural gap), em especial a do verbo fandangar, presente na lngua portuguesa. Por se tratar de um movimento regional, uma dana tradicional nos estados do Nordeste ou do Sul do Brasil, uma particularidade que no encontra correspondncia na cultura e lngua norteamericana e inglesa. A soluo para tal empasse foi o alinhamento com o synset hipernimo {dance} do ingls, mais prximo do conceito almejado.

2. Material e mtodos
A construo da base da WN.Br se fundamenta na metodologia de construo rede WordNet de Princeton (WN.Pr), desenvolvida para o ingls norte-americano, e dos estudos aplicados por pesquisadores do Laboratrio de Cincias Cognitivas da Universidade de Princeton, Estados Unidos (FELLBAUM, 1999). Tais estudos serviram ainda de base para o desenvolvimento da base multilnge EuroWordNet, que interrelaciona as lnguas da Unio Europia (VOSSEN, 1998). As atividades desenvolvidas nesta atividade de IC envolvem anlises lxico-semntica e conceitual (CRUSE, 1986) e incluem a realizao de: especificaes (I) de cada synset de verbos do portugus; (II) de uma glosa para cada synset do portugus que melhor explicita o conceito lexicalizado pelas suas unidades lexicais e (IV) de alinhamentos entre cada synset da base da WN.Br e um synset semanticamente (quase)-equivalente da base da WN.Pr.

4. Concluses
A anlise e correta co-indexao semntica das bases da WN.Br e WN.Pr no representa algo trivial nos estudos lingsticos. Nesta breve descrio, v-se a complexidade e importncia de se preverem co-indexaes aproximadas para se preservar as especificidades lexicais das lnguas sob anlise.

5. Referncias Bibliogrficas
[1]CRUSE, D.A. Lexical semantics. Cambridge, Mass: Cambridge University Press, 1986. [2]DIAS-DA-SILVA, B.C., FELIPPO, A. Di, HASEGAWA, R. Methods and Tools for Encoding the WordNet.Br Sentences, Concept Glosses, and Conceptual-Semantic Relations. In: Carbonell, J, Siekmann, J. Lecture notes on artificial intelligence. Berlin / Heidelberg: Springer, 2006. p.120-130 [3] FELLBAUM, C. (Ed.). WordNet: an electronic lexical database. Cambridge, Massachusetts: Cambridge University Press, 1999. [4] VOSSEN, P. Introduction to EuroWordNet. Computers and the Humanities, Dordrecht, v. 32., n.2-3, p. 73-89, 1998.

3. Resultados e discusses
Conhecidas como gaps de alinhamento, as lacunas de equivalncia semntica constituem algumas das dificuldades