/  15
 
Fundamentos de la lingüística de corpus
Concepción de los corpus y métodos de investigación concorpusPetra Procházkovápetra.prochazkova@gmail.com
Texto español revisado por 
Tomás Ramírez Minkerttrminkert@yahoo.de3 de noviembre de 2006
 
Índice
1. Introducción 22. Los corpus 4
2.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42.2. Aplicaciones de los corpus en la lingüística . . . . . . . . . . . . 62.3. Búsqueda en los corpus . . . . . . . . . . . . . . . . . . . . . . . 7
3. Corpus disponibles 8
3.1. Los corpus más conocidos . . . . . . . . . . . . . . . . . . . . . 83.2. Corpus españoles . . . . . . . . . . . . . . . . . . . . . . . . . . 8
4. Generación de los corpus 10
4.1. Adquisicn de datos para un corpus . . . . . . . . . . . . . . . . 104.2. Anotación de un corpus . . . . . . . . . . . . . . . . . . . . . . . 114.3. Procesamiento de un corpus . . . . . . . . . . . . . . . . . . . . 12
5. Conclusión 136. Referencias 14
1
 
1. Introducción
La lingüística de corpus trata de la concepción, tratamiento preliminar y análi-sis de los corpus, y plantea, por ejemplo, qué preguntas lingüísticas se puedenresponder por medio del uso de un amplio número de textos. La lingüística decorpus no cumple una función es sí misma, sino más bien se la considera otrométodo con el cual los lingüistas demuestran sus teorías.¿Cómo comprueban los lingüistas sus teorías e hipótesis? Para ese propósito,los investigadores tienen cuatro posibilidades: la introspección, los experimen-tos psicolingüísticos, las encuestas de datos y los corpus. Por medio de laintrospección, los lingüistas que tienen la competencia de un hablante nativoconfían en su juicio gramatical. Mediante los experimentos psicolingüísticos,los investigadores tienen a disposición, por ejemplo, la medida del tiempo dereacción ante lexemas seleccionados. Por su parte, el procedimiento de en-cuestas de datos consiste en la elaboración de un cuestionario y de la encues-ta de un grupo seleccionado. La tercera posibilidad es recoger datos hasta quese produzca un corpus. De esta manera, el cuarto método se cruza con el ter-cero.Se entiende hoy en día como corpus el conjunto de textos que están guar-dados de forma electrónica y que contienen amplia información lingüística. Launidad más pequeña de un corpus es un „token“ (véase en 4.3).2

Share & Embed

More from this user

Recent Readcasters

Add a Comment

Characters: ...