You are on page 1of 27

Copa 2014 FrameNet Brasil: Análise da unidade lexical “visitar” do frame de turismo

Maucha Andrade Gamonal SILEL Universidade Federal de Uberlândia 23 a 25 de novembro de 2011

Introdução

O Projeto FrameNet Brasil (SALOMÃO, 2009) vem sendo desenvolvido na Universidade Federal de Juiz de Fora, em associação com o International Computer Science Institute (EUA), visando cooperar com o projeto de criação de uma rede semântica (FrameNet), liderada pelo professor Charles Fillmore, na Universidade da Califórnia. O Projeto tem por objetivo a criação de um recurso lexical online (disponível em: www.framenetbr.ufjf.br/) para o Português do Brasil, baseado na Semântica de Frames (FILLMORE, 1982, 1985) e sustentado por evidência de corpus. Tal recurso possibilitará, além de contribuir com a base de dados da FN, atuar como tecnologias de aplicação em tarefas de tradução automática e extração automática de informações, por exemplo.

p.  . 111). um frame é “qualquer sistema de conceitos relacionados de tal forma que. 1977. para entender um deles. Na análise de Fillmore. é necessário entender toda a estrutura na qual ele se encaixa” (FILLMORE. 1979.Semântica de Frames  A Semântica de Frames (FILLMORE. denominadas frames. 1982. mas como estruturas complexas. 1982) é um programa de pesquisa em semântica empírica que toma emprestada da Inteligência Artificial a ideia de que o conhecimento não deve ser visto como uma coleção de fragmentos simples e desconexos.

pois esses disponibilizam as informações necessárias a respeito de como aquele é instanciado. a pessoa interessada em trocar mercadorias por dinheiro (o vendedor).Frame de Transação Comercial  Um exemplo clássico do autor é o frame de transação comercial: nele haverá uma cena em que está relacionada e incluída a pessoa interessada em trocar dinheiro por alguma mercadoria (o comprador). aquilo que o comprador poderá adquirir (as mercadorias) e o dinheiro adquirido pelo vendedor (o dinheiro). Podemos dizer que os elementos que constituem a cena são seus participantes e são chamados de elementos de frame. Um frame não poderia ser constituído sem a presença dos seus elementos.  .

um dicionário temático trilíngue (Português – Inglês –Espanhol) que irá abranger os domínios do Futebol e do Turismo.Projeto Copa 2014 FrameNet Brasil  O projeto Copa 2014 FrameNet Brasil é um projeto de inovação tecnológica que propõe desenvolver. terá como audiência privilegiada a imprensa esportiva internacional.  . pessoas envolvidas na organização da Copa do Mundo FIFA 2014. Tal dicionário. em meio eletrônico. na recepção aos turistas estrangeiros e também os próprios turistas. com foco no uso humano.

a organização dos verbetes e sistema de consulta acontecerá de modo diferente dos dicionários comuns.Qual a diferença desse dicionário para os demais?  Como nosso trabalho é guiado pela teoria da Semântica de Frames. . Possibilitará acesso a uma busca por cenas relevantes dos domínios do futebol e do Turismo.

Emprego de frames para realizar correspondência entre Uls  BOAS (2002) tratando da produção de um dicionário bilíngue InglêsAlemão: .

verbos. Substantivos.Diálogo com as WordNets  “WordNet é um grande banco de dados lexical do Inglês. cada um expressando um conceito distinto. hiperonímia.  . adjetivos e advérbios são agrupados em conjuntos de sinônimos cognitivos (synsets). antonímia. Synsets estão inter-ligados por meio de relações conceituais-semânticas e lexicais. dentre outras serão especificadas. uma vez que as relações lexicais de sinonímia.” Com esse diálogo nosso dicionário terá uma cobertura lexical ampliada.

(SWATOUT & TATE. 1999). .Interface com as ontologias  Ontologia: Conjunto de conceitos e termos que podem ser usados para descrever alguma área do conhecimento ou construir uma representação para o conhecimento.

Criação de uma ontologia para o domínio do EAD (MÜLLER. 2010): .

Nessa parceria. local onde é desenvolvido o projeto da FrameNet norte-americana. eles têm o objetivo de construir a contraparte do inglês do domínio do Turismo do dicionário.Parceria com ICSI Foi estabelecida uma parceria com International Computer Science Institute (EUA).  .

. Dra. em cujo âmbito se abriga o subprojeto Kicktionary-Br1. Rove Chishman.de). na UNISINOS. Thomas Schmidt para a linguagem do futebol (http://www. que tem como objetivo construir para o Português do Brasil a contraparte do recurso lexical multilíngüe criado no ICSI pelo Dr.Parceria com a UNISINOS  Foi estabelecida uma parceria com a equipe da Profa. que desenvolve o projeto FrameCorp.kicktionary.

Corpus  O corpus será formado de textos publicados em revistas de viagem. A saber:   . utilizou-se o corpus da FrameNet Brasil. Para a busca experimental realizada no atual trabalho. cadernos especializados de jornais e blogs de viajantes. guias de viagem. sites de órgãos governamentais de fomento à atividade turística. revistas de bordo de companhias aéreas.

epistolar e redações de alunos. após essa data. (ii) ECI-EBR: corpus criado pela ECI (European Corpus Initiative). (v) NURC-RJ: corpus constituído por entrevistas gravadas nas décadas de 1970 e 1990. . contendo pelo menos discurso literário. num total de 350 horas. sediado na Universidade Federal de Juiz de Fora. com informantes de nível superior completo.Corpus da FN-Br • • • • • (i) ANCIB: corpus criado a partir de mensagens enviadas para a lista homônima da Associação Nacional de Pesquisa e Pós-Graduação em Ciência da Informação (até Novembro de 2003) e para a lista abarreto-l. didático. (iv) LF (Legendas de Filmes): corpus criado pelo Projeto FrameNet Brasil.org. didático e oral cuidado (discursos políticos). baseado no Borba-Ramsey. (iii) NILC/São Carlos: contém textos brasileiros do registro jornalístico (do qual se originou o CETENFolha). É uma seleção de excertos de obras brasileiras. nascidos no Rio de Janeiro e filhos de pais preferencialmente cariocas. contém legendas de filmes em Português do Brasil cedidas pelo portal OpenSubtitles.

Análise inicial de dados:  Realizamos uma busca inicial pelo Unidade Lexical “Visitar” que evoca o frame de Turismo (Touring) previamente descrito na FrameNet. .

panfletos ou displays. . Normalmente.Frame de Turismo Definição: Um turista visita ou experiencia uma atração. Turista [per] O indivíduo que está buscando uma experiência em uma atração.um guia. com o objetivo de ver e aprender sobre ele. um local com uma história pecualiar ou o caráter individual reconhecido socialmente. [Phen] O local peculiar socialmente reconhecido que o turista visita. a atração tem uma fonte de informação tal como . Elementos de Frame: Nuclear Atração.

. Co-participante [] O Co-participante é quem participa de modo coordenado. no caso em uma turnê com o turista. Propósito [Pur] Alguma ação que o turista está tentando realizar com o turismo.Não Nuclear Lugar [] O local onde o turismo acontece. Tempo [Tim] O tempo que o turismo acontece. Isso geralmente é (no mínimo) para fins de entretenimento e aprendizado. o] Duração [Dur] A quantidade de tempo que dura a atividade de turismo. Meio [Mns] O Meio indica o método de Turismo que está sendo usado para participar da turnê.

Sumariamento dos dados levantados: Corpora Legenda de Filmes Domínio Público NURC ANCIB ECI-EBR NILC-São Carlos Total Sentido Alvo Sentido Figurado Adjetivo Substantivo Contexto Insuficiente Outros TOTAIS 18 17 44 8 12 99 - 1 41 11 53 162 202 69 3 4 440 7 18 1 26 218 127 82 317 28 772 399 394 224 329 44 1390 .

considera-se apenas os Elementos de Frame nucleares e suas realizações sintáticas. Para que um padrão de valência seja postulado.Padrões de valência:  Após o processo de anotação das sentenças. passa-se para o processo de determinar quais são os padrões de valência que ocorrem com essa Unidade Lexical. .

. 2º PADRÃO: • Elementos de Frame: Turista .Atração Obj/SN Camadas EF FG TS Outros os turistas VISITAM nossos monumentos e outros edifícios Turista Atração Externo Obj SN SN 1.Atração Obj/SN Camadas VISITAR o Pão de Açúcar EF Turista =IND Atração FG Obj TS SN Outros foi 1.Atração Realizações sintáticas: Turista IND . bem e/e o carioca é assim você vê.Atração Realizações sintáticas: Turista Ext/SN . .... [IND] . cê tem muita gente que já tá aqui há muitos anos e nunca foi VISITAR o Pão de Açúcar.O clima é muito bom e todos os turistas VISITAM nossos monumentos e outros edifícios.1º PADRÃO: • • Elementos de Frame: Turista .

Turista Ext/SN Camadas EF FG TS Outros os outros países Atração Obj SN Ant que Atração Obj SN Rel você VISITOU Turista Externo SN 1.Nenhuma visita a Nova York é completa.. E os outros países europeus que você VISITOU ? .Atração Obj/SN Camadas VISITAR o prédio mais automático do mundo EF Turista =INI Atração FG Obj TS SN Outros 1.sem VISITAR o prédio mais automático do mundo. . [INI] 4º PADRÃO: • Elementos de Frame: Atração – Atração – Turista Realizações sintáticas: Atração Obj/SN ..3º PADRÃO: • Elementos de Frame: Turista . .Atração Realizações sintáticas: Turista INI .

[INC] [IND] . Mas. fui VISITAR. e tem muita coisa interessante pra se ver.Atração IND Camadas VISITAR EF Turista=INC Atração=IND FG TS Verbo 1. um Jardim Botânico em Montreal.Atração Realizações sintáticas: Turista IND . é uma cidade que pode se VISITAR. visita-se e. muita coisa ainda até bem conservada.5º PADRÃO: • Elementos de Frame: Turista . e tinha o. o Jardim Japonês e tinha o Jardim Chinês. [IND] [IND] 6º PADRÃO: • Elementos de Frame: Turista . No Canadá tinha uma. é cercada.Atração Realizações sintáticas: Turista INC .Atração IND Camadas EF Turista=IND FG TS Verbo VISITAR Atração=IND fui 1. eh.

Tabelas de sumariamento Elemento de Frame Turista Número Anotado 99 Atração Coparticipante Descrição Duração Base Modo Meio Iteração específica Lugar Propósito Tempo 99 2 1 6 1 14 Realizações SN/Ext = (35) IND= (55) INI= (7) INC= (2) SN/Obj = (93) IND= (6) SP/Dep= (2) SAdv/Dep= (1) SP/Dep= (6) SP/Dep=(1) SS/Dep =(2) SAdv/Dep=(12) .

Número Anotados 28 TOTAIS (15) (1) (6) (2) (3) Padrões Turista SN Ext Turista SN Ext Turista SN Ext Turista SN Ext Turista SN Ext Turista SN Ext Turista IND Turista IND Turista IND Atração SN Obj Atração SN Obj Atração SN Obj Atração SN Obj Atração SN Obj Atração SN Obj Atração SN Obj Atração SN Obj Atração SN Obj (1) 51 TOTAIS (42) (5) (1) Coparticipante SP Dep Tempo SAdv Dep Tempo SS Dep Lugar SP Dep Tempo SAdv Dep Lugar SP Dep Tempo SAdv Dep Coparticipante SP Dep .

(1) (1) (1) 7 TOTAIS (6) (1) 7 TOTAIS 4 TOTAIS 2 TOTAIS Turista IND Turista IND Turista IND Turista INI Turista INI Atração SN Obj Turista IND Turista INC Atração SN Obj Atração SN Obj Atração SN Obj Atração SN Obj Atração SN Obj Turista SN Ext Atração IND Atração IND Modo SAdv Dep Lugar SP Dep Propósito SP Dep Lugar SP Dep .

uma vez que estamos em processo de busca por novos corpora que tenham foco maior na área do turismo. Essa busca retornou seis padrões. sendo que o que obteve mais ocorrências foi o padrão com 51 sentenças. E o de menor ocorrência foi com 2 sentenças.Considerações Finais:    Nossa primeira iniciativa prática na pesquisa com o Copa 2014 FrameNet Brasil foi a busca da Unidade Lexical “visitar” evocando o frame de Turismo (Touring) nos corpora da FN-Br. Esse trabalho servirá também para contribuir com o avanço no banco de dados de anotação da plataforma do projeto. . Entretanto esse dados não se encontram finalizados.

G. FrameNet Brasil: um trabalho em progresso. . 222-254.M.berkeley. 2009a SCHMIDT. 1982.M. Hans. 1987. Vol.2. (Ed). RUPPENHOFER. Charles. In: Linguistics in the Morning Calm. FrameNet II: Extended theory and practice. 7. (Ed. M. R. p. Seul: Hanshin Publishing Co.Methods and Applications.2. Charles.a multilingual lexical resource of football language. Multilingual FrameNets .6. Berlin/New York: Mouton de Gruyter. 2009. Heidelberg. 1985. & RADDEN. The Kicktionary . Charles J. Frames and the semantics of understanding.Referências:       FILLMORE. FILLMORE. In: Quaderni di Semantica. n. p. Disponível em: http://framenet. T. In: Calidoscópio. In: DIRVEN. In: BOAS. J. Frame semantics.111-137.edu/index. FILLMORE.et al.). SALOMÃO.icsi.php?option=com_wrapper&Itemid=126 Acesso em 3 de agosto de 2011.. v. Fillmore’s cases grammar: a reader.