You are on page 1of 7

Universidade Federal do Cear Centro de Humanidades Programa de Ps-Graduao em Lingstica Programa da disciplina HBP736 TPICOS EM LINGSTICA APLICADA II (Turma

3) Crditos: 4 Semestre 2011.2 Professor responsvel: Leonel Figueiredo de Alencar Araripe Homepage: http://www.leonel.profusehost.net/ Ementa: Estudos recentes sobre o processamento computacional da linguagem natural, com nfase em abordagens baseadas em corpora aplicadas na anlise automtica do portugus nos nveis morfolgico, lexical, sinttico, semntico e textual. Justificativa: O processamento computacional da linguagem natural (PLN) 1 uma das reas da Revue Franaise de Linguistique Applique, qual foi dedicado, por ex., o seguinte nmero temtico: http://www.rfla-journal.org/sommaire-2000-2-diversite-du-traitement-automatique-des-langues.html O PALN (sob o rtulo de "Computerlinguistik") constitui tambm uma das sees da Sociedade Alem de Lingstica Aplicada (ver http://www.gal-ev.de/index.php/sektionen). No Brasil, artigos na rea de PLN e lingstica computacional tm sido publicados com freqncia na revista Calidoscpio (Qualis A2), um dos principais peridicos de Lingstica Aplicada brasileiros. Esses so apenas trs exemplos da relevncia, para a Lingstica Aplicada, desse campo que constitui um dos fundamentos da tecnologia das lnguas naturais (natural language technology) e da lingstica de corpus, entre outras reas. Programa 1. Fundamentos computacionais a) Sistema de arquivos e comandos bsicos do sistema operacional UNIX b) Princpios e prtica de programao em Python
1 Sigla TAL em francs, de traitement automatique des langues; NLP em ingls, de natural language processing; em alemo, maschinelle Sprachverarbeitung.

c) Teoria das lnguas formais, gramticas e autmatos

2. Anotao de corpora lingsticos a) Nveis de anotao b) Tipos de anotao c) Sistemas de representao e de codificao da anotao lingstica d) Mtodos de anotao automtica e) Utilidades da anotao de corpora 3. Anotao morfossinttica em corpora de lngua portuguesa 4. Lematizao e Stemming 5. Anotao sinttica rasa ou parcial (chunking) 6. Anotao sinttica profunda a) Tipos b) Florestas sintticas (treebanks) 7. Construo de analisadores sintticos rasos 8. Construo de analisadores sintticos profundos 9. Anotao semntica 10. Tcnicas da anlise automtica de textos 11. Traduo automtica

Avaliao

Quesito i. Participao (pontualidade e assiduidade, resoluo de questes, elaborao de tarefas etc.) ii. Apresentao do primeiro seminrio iii. Resoluo da tarefa do primeiro seminrio iv. Apresentao do segundo seminrio2 v. Prova escrita

Quantidade mxima de pontos 3 1 1 2 5

Algoritmo para clculo da nota

Bibliografia

2 No caso de alunos de Mestrado, que apresentam um nico seminrio, a apresentao em si vale 2 pontos e a tarefa associada, 2 pontos.

ALENCAR, Leonel Figueiredo de. Complementos verbais oracionais: uma anlise lxico-funcional. Lingua(gem), Santa Maria, v. 1, n. 1, p. 173-218, jan./jun. 2004. ALENCAR, Leonel Figueiredo de. Linguagem e inteligncia artificial. In: MATTES, Marlene Gonalves (Org.). Linguagens: as expresses do mltiplo. Fortaleza: Premius, 2006. p. 11-53. ALENCAR, Leonel Figueiredo de. Automatische Satzanalyse fr Studierende der Germanistik bzw. des Faches DaF. In: ALENCAR, W. R. de (Org.). Akten des Seminars: Deutsch-Brasilianische Kulturbeziehungen und DaF / Relaes Culturais Brasil-Alemanha e o Ensino de Alemo como Lngua Estrangeira. Rio de Janeiro: ABRAPA, 2008. Disponvel em:<http://www.scribd.com/doc/33827910/Automatische-Satzanalyse-Alencar-2008> e <http://abrapa.org.br/congresso2009/11.html> ALENCAR, Leonel Figueiredo de. Tcnicas em software livre para explorao de corpora do portugus livremente disponveis na WWW. Veredas (UFJF. Online), Juiz de Fora, v. 13, p. 134-150, 2009. ALENCAR, Leonel Figueiredo de. Produtividade morfolgica e tecnologia do texto: aspectos da construo de um transdutor lexical do portugus capaz de analisar neologismos. Calidoscpio (UNISINOS), So Leopoldo, v. 7, p. 199-220, 2009. ALENCAR, L. F. de. Aelius: uma ferramenta para anotao automtica de corpora usando o NLTK. ELC 2010 IX Encontro de Lingustica de Corpus, PUCRS, Porto Alegre, 8 e 9 de outubro de 2010. Disponvel em: <http://corpuslg.org/gelc/elc2010.php> BEESLEY, K. R.; KARTTUNEN, L. Finite state morphology. Stanford: CSLI Publications, 2003. 510 p. BERBER SARDINHA, T. (org.). A lngua portuguesa no computador. Campinas: Mercado de Letras; So Paulo: Fapesp, 2005. 296 p. BIRD, S.; KLEIN, E.; LOPER, E. Natural language processing with Python: analyzing text with the Natural Language Toolkit. Sebastopol: OReilly, 2009. 502 p. BRANCO, A.; COSTA, F. LXGram: A Deep Linguistic Processing Grammar for Portuguese. In: PARDO, T. A. S. et al. (Eds.). INTERNATIONAL CONFERENCE ON COMPUTATIONAL PROCESSING OF THE PORTUGUESE LANGUAGE, n. 9, 2010, Porto Alegre. Proceedings... Berlin; Heidelberg: Springer, 2010. p. 86-89. BRANCO, A. et al. Developing a Deep Linguistic Databank Supporting a Collection of Treebanks: the CINTIL DeepGramBank. LANGUAGE RESOURCES AND EVALUATION CONFERENCE, n. 7, 2010, La Valletta, Malta. Proceedings... [s.l.]: ELRA, 2010. p. 1810-1815. Disponvel em: <http://www.lrec-conf.org/proceedings/lrec2010/pdf/154_Paper.pdf> Acesso em: 26. abr. 2011.

BURNARD, L.; SPERBERG-MCQUEEN, C. M. TEI Lite: Encoding for Interchange: an introduction to the TEI Revised for TEI P5 release. [Text Encoding Initiative Consortium]: [Charlottesville, Virginia], 2006. Disponvel em: <http://www.tei-c.org/release/doc/tei-p5exemplars/html/teilite.doc.html> Acesso em: 16. set. 2011. CAVALIERI, D. C. et al. Evaluation of Machine Learning Approaches to Portuguese Part-of-Speech Prediction. INTERNATIONAL CONFERENCE ON COMPUTATIONAL PROCESSING OF PORTUGUESE LANGUAGE, n. 9, 2010, Porto Alegre. Extended Activity Proceedings... Disponvel em: <http://www.inf.pucrs.br/~propor2010/proceedings/regular_papers/CavalieriEtAl.pdf> Acesso em: 5. ag. 2011. CLARK, A; FOX, C.; LAPPIN, S. (Eds.). The Handbook of Computational Linguistics and Natural Language Processing. Malden; Oxford; Chichester: Wiley & Blackwell, 2010. 800 p. DI FELIPPO, A.; DIAS-DA-SILVA, B. C. O processamento automtico de lnguas naturais enquanto engenharia do conhecimento lingustico. Calidoscpio, So Leopoldo, vol. 7, n. 3, p. 183-191, set./dez. 2009. FELDMAN, A.; HANA, J. A resource-light approach to morpho-syntactic tagging. Amsterdam; New York: Rodopi, 2010. 185 p. GARCIA, M.; GAMALLO, P. Using Morphosyntactic Post-processing to Improve POS-tagging Accuracy. INTERNATIONAL CONFERENCE ON COMPUTATIONAL PROCESSING OF PORTUGUESE LANGUAGE, n. 9, 2010, Porto Alegre. Extended Activity Proceedings... Disponvel em: <http://www.inf.pucrs.br/~propor2010/proceedings/regular_papers/GarciaGamallo.pdf> Acesso em: 2. jun. 2011. INDURKHYA, N.; DAMERAU, F. J. (Eds.). Handbook of Natural Language Processing. 2. ed. Boca Raton, FL: Chapman & Hall/CRC, 2010. 678 p. JURAFSKY, D.; MARTIN, J.H. Speech and language processing: an introduction to natural language processing, computational linguistics, and speech recognition. 2. ed. London: Pearson International, 2009. 1024 p. KLENK, U. Generative Syntax. Tbingen, Narr, 2003. 261 p. LEMNITZER, L.; ZINSMEISTER, H. Korpuslinguistik: eine Einfhrung. Tbingen: Narr, 2006. 220 p. LON, J. A Lingstica de Corpus: histria, problemas, legitimidade. Filologia e Lingustica Portuguesa, So Paulo, n. 8, p. 51-81, 2006. LOBIN, H.; LEMNITZER, L. (Eds.). Texttechnologie: Perspektiven und Anwendungen. Tbingen: Stauffenburg, 2004. 487 p. 5

LOBIN, H. Computerlinguistik und Texttechnologie. Paderborn: W. Fink, 2010. 124 p. MARTINS, R. T. E se as mquinas no precisarem de regras para aprender a linguagem humana? Veredas On Line, Juiz de Fora, vol. 15, n. 1, p. 66-77, 2011. MARTINS, R. T. O pecado original da lingustica computacional. Alfa, So Paulo, vol. 55, n. 1, p. 287307, 2011. MARTINS, R.; HASEGAWA, R.; NUNES, G. Curupira: um parser funcional para a lngua portuguesa. So Carlos: Ncleo Interinstitucional de Lingstica Computacional, 2002 Disponvel em: <http://www.nilc.icmc.usp.br/nilc/download/nilc-tr-02-26.zip> Acesso em: 1. jun. 2011. MARTINS, R.; NUNES, G.; HASEGAWA, R. Curupira: A Functional Parser for Brazilian Portuguese. In: MAMEDE, N. et al. (Eds.). INTERNATIONAL WORKSHOP ON COMPUTATIONAL PROCESSING OF THE PORTUGUESE LANGUAGE, n. 6, 2003, Faro. Proceedings... Berlin; Heidelberg: Springer, 2003. p. 179-183. MEHLER, A.; LOBIN, H. (Eds.). Automatische Textanalyse: Systeme und Methoden zur Annotation und Analyse natrlichsprachlicher Texte. Wiesbaden: Verlag fr Sozialwissenschaften, 2004. 290 p. MENUZZI, S. M.; OTHERO, G. A. Lingstica Computacional: teoria & prtica. So Paulo: Parbola, 2005. MITKOV, R. (Ed.). The Oxford handbook of computational linguistics. Oxford: Oxford University Press, 2004. MLLER, S. Grammatiktheorie. Tbingen: Stauffenburg, 2010. Disponvel em:<http://hpsg.fuberlin.de/~stefan/Pub/grammatiktheorie.html> Acesso em: 9. ag. 2011. OTHERO, G. A. Teoria X-barra: descrio do portugus e aplicao computacional. So Paulo: Contexto, 2006. PERKINS, J. Python Text Processing with NLTK 2.0 Cookbook. Birmingham, UK: Packt, 2010. 256 p. ROARK, B.; SPROAT, R. Computational approaches to morphology and syntax. Oxford: Oxford University Press, 2006. 316 p. RODRIGUES, E. S.; AUGUSTO, M. R. A. Modelos formais de gramtica: o Programa Minimalista vs. gramticas baseadas em restries HPSG e LFG. Matraga, Rio de Janeiro, v.16, n. 24, p. 133-149, jan./jun. 2009. SAG, I. A.; WASOW, T. ; BENDER, E. Syntactic theory: a formal introduction. 2. ed. Stanford: CSLI Publications, 2003. 608 p. 6

SALOMO, M. M. M. FrameNet Brasil: um trabalho em progresso. Calidoscpio, So Leopoldo, vol. 7, n. 3, p. 171-182, set./dez. 2009. SEARA, I. C. et al. Morphosyntactic Parser for Brazilian Portuguese: Methodology for Development and Assessment. INTERNATIONAL CONFERENCE ON COMPUTATIONAL PROCESSING OF PORTUGUESE LANGUAGE, n. 9, 2010, Porto Alegre. Extended Activity Proceedings... Disponvel em: <http://www.inf.pucrs.br/~propor2010/proceedings/regular_papers/SearaEtAl.pdf.pdf> Acesso em: 5. ag. 2011. SHEPHERD, T. ; BERBER SARDINHA, T. ; PINTO, M. V. (orgs.). Caminhos da lingustica de corpus. Campinas: Mercado de Letras, 2010. SILVA, J. et al. Out-of-the-Box Robust Parsing of Portuguese. In: PARDO, T. A. S. et al. (Eds.). INTERNATIONAL CONFERENCE ON COMPUTATIONAL PROCESSING OF THE PORTUGUESE LANGUAGE, n. 9, 2010, Porto Alegre. Proceedings... Berlin; Heidelberg: Springer, 2010. p. 75-85. SILVA, J.; BRANCO, A.; GONALVES, P. Top-Performing Robust Constituency Parsing of Portuguese: freely available in as many ways as you can get it. LANGUAGE RESOURCES AND EVALUATION CONFERENCE, n. 7, 2010, La Valletta, Malta. Proceedings... [s.l.]: ELRA, 2010. p. 1960-1963. Disponvel em: < http://www.lrec-conf.org /proceedings /lrec2010/pdf/136_Paper.pdf> Acesso em: 26. abr. 2011. TAGNIN, S. E. O.; VALE, O. A. (orgs.). Avanos da Lingustica de Corpus no Brasil. So Paulo: Humanitas, 2008. 437 p.

You might also like