Professional Documents
Culture Documents
етапи створення корпусу
етапи створення корпусу
корпусу
Виконлала
Строцька Ліліана
Кожного року кількість корпусів для розв’язання різного
роду дослідницьких завдань невпинно зростає. Тому перед
тим, як починати створювати власний корпус, дослідник
повинен впевнитися, що на даний момент не існує корпусу,
який би відповідав його специфічній дослідницькій меті.
Якщо ж лінгвіст все-таки вирішив укласти власний корпус,
то технологічний процес його створення передбачає
поступове виконання таких кроків:
1.Визначення джерел лінгвального матеріалу. Дані для корпусу
можна відібрати з двох головних джерел: публічно доступних
текстів (джерел) та приватно доступних джерел. Публічно
доступні дані можна відібрати з низки джерел. Це передусім
газети, журнали, інтернет-сайти. Одна з головних проблем, з якою
стикнеться дослідник при відборі матеріалу для корпусу – це
авторські права. Дотримання авторських прав на матеріали
передбачає отримання дозволу на використання текстів для
дослідницьких цілей. Закони щодо авторських прав різняться у
різних країнах, тому укладач повинен знати про закони, що
охороняють авторські права не лише у своїй країні, але і в інших
державах. Найбезпечніший шлях уникнути проблем із
законодавством – це використати тексти із відкритих джерел,
наприклад, текстових архівів, що є у вільному доступі в Інтернеті,
як Project Gutenberg (детальніше про джерела текстів у вільному
доступі див.: www.copyright.gov/title17/ ).