You are on page 1of 5

Міністерство освіти і науки України

Національний університет “Львівська політехніка”

Кафедра ПЛ

Лабораторна робота № 1

“Морфологічна розмітка у корпусі ГРАК”

з дисципліни «Корпусна лінгвістика»

Виконала:
ст. гр. ФЛ–43
Олейко Олена
Прийняла:
асистент Турянська К.Ю.

Львів – 2020
Теоретичні відомості

Генеральний регіонально анотований корпус української мови (ГРАК) – це


велика, репрезентативна, структурована колекція текстів українською мовою у
супроводі програми, яка дозволяє будувати на базі корпусу власні підкорпуси,
шукати слова, граматичні форми та їх сполучення, а також обробляти
результати пошуку, сортувати, робити збалансовані вибірки і одержувати різну
статистичну інформацію.

Корпус призначений для здійснення лінгвістичних досліджень з граматики,


лексики, історії української літературної мови, а також для використання під
час укладання словників та граматик.

Корпус може бути використаний для вивчання мови на високому рівні, також
при підготовці навчальних матеріалів, підручників, навчальних словників та
вправ з використанням прикладів з реальних текстів, з урахуванням частотної
сполучуваності тощо.

Хід роботи

Знайшовши свої словосполучення та їхні відповідні теги морфологічної


розмітки, я провела наступний аналіз:

 Сидіти тихо: 1)verb:imperf:inf (дієсл., недок. вид, інф.) 2)adv:compb;


predic(присл., баз.ф., може бути предикативом).
 Цікавий сюжет: 1)adj:m:v_kly:compb (прикм., ч. р., К.відм., баз.ф.);
adj:m:v_naz:compb; predic (прикм., ч. р., Н.відм., баз.ф., може бути
предикативом); adj:m:v_zna:rinanim:compb (прикм., ч. р., Зн.відм. для
неістот (лише ч.р.), баз.ф.) 2)noun:inanim :m:v_naz (ім., неіст., ч. р.,
Н.відм.); noun:inanim :m:v_zna (ім., неіст., ч. р., Зн.відм.).
 Не журитися: 1) part (частка); 2) verb:rev:imperf:inf (дієсл.: зворотна
форма, недок. вид, інф.).

 Чи 1) conj:coord:subord; part (сполуч., сур., підр.; частка).


Висновки

Виконуючи лабораторну роботу, я використовувала корпус текстів ГРАК.


ГРАК працює на базі системи морфологічного аналізу. Програма аналізує текст
і для кожної словоформи визначає лему (лексему) і теги (граматичні ознаки). Я
проаналізувала 4 запити до корпусу та побудувала конкорданси. Для кожного
словосполучення корпус видав список використання цієї фрази у контексті та
провів морфологічний аналіз окремо кожного слова. У графі ‘морфологічна
розмітка’ я дізналась про всі існуючі теги у цьому корпусі, що допомогло мені
розібратись з отриманими конкордансами. Наприклад, для іменників
визначається істота/неістота, рід, відмінок, число та інше. Для дієслів —
інфінітив/час, доконаний/недоконаний вид і т.д. Для кожної з частин мов
проводиться детальна характеристика і навіть визначається можлива роль цієї
частини мови у реченні. Наприклад, ‘чи’ може виступати і часткою, і
сполучником. Тому, ознайомившись із морфологічною розміткою, я можу
успішно досліджувати різні словосполучення.

You might also like