Professional Documents
Culture Documents
«ЗАТВЕРДЖУЮ»
Заступник директора ННІФ
з навчально-методичної роботи
доц. Скрильник С.В.
______________________
«____»____________2022 р.
для студентів
галузь знань 03 «Гуманітарні науки»
(шифр і назва)
спеціальність 035 «Філологія (035.10 «Прикладна лінгвістика») »
(шифр і назва спеціальності)
спеціалізація 035.043 «Германські мови та літератури (переклад включно) –
перша німецька
освітній рівень бакалавр
(молодший бакалавр, бакалавр, магістр)
освітня програма «Німецька філологія та переклад, англійська мова»
(назва освітньої програми)
КИЇВ – 2022
1
Розробники:
канд. філол. наук, доцент Оксана ЗУБАНЬ, доцент кафедри української мови та прикладної
лінгвістики;
Валентина РОБЕЙКО, асистент кафедри української мови та прикладної лінгвістики
ЗАТВЕРДЖЕНО
Завідувач кафедри української мови та
прикладної лінгвістики
______________ Анатолій МОЙСІЄНКО
2
ВСТУП
1. Мета дисципліни – ознайомити студентів із проблематикою
комп’ютерної лінгвістики та основними методами досліджень у цій галузі,
розглянути теоретичні засади та практичні реалізації сучасних систем
автоматичного оброблення природної мови; дати студентам необхідні
знання про мову та мовлення з позицій комп’ютерної лінгвістики; окреслити
шляхи практичного застосування отриманих знань, умінь і навичок.
3
фахових компетентностей: ФК2. Здатність використовувати в професійній
діяльності знання про мову як особливу знакову систему, її природу, функції, рівні.
ФК7. Здатність до збирання й аналізу, систематизації та інтерпретації мовних фактів,
інтерпретації та перекладу тексту.ФК9. Усвідомлення засад і технологій створення
текстів різних жанрів і стилів державною та іноземними мовами. ФК10. Здатність
здійснювати лінгвістичний та спеціальний філологічний аналіз текстів різних стилів і
жанрів. ФК15.1. Здатність професійно застосовувати поглиблені знання у галузі
лінгвістики тексту та прикладної лінгвістики.
4
систем АОПМ. заняття, звіт по лабораторній роботі,
самостійна самостійна підготовка та
робота презентація доповіді,
модульна контрольна
робота,
тести
РН 3.1 Використовувати інформаційні Лекція, Відповідь на практичному 5%
технології та комунікативні стратегії в практичне занятті,
наукових дискусіях з питань заняття, звіт по лабораторній роботі,
автоматичного опрацювання самостійна самостійна підготовка та
природної мови. робота презентація доповіді
РН РН РН РН РН РН РН РН РН
Програмні результати навчання (за описом 1.1 1.2 1.3 2.1 2.2 2.3 3.1 3.2 4.1
освітньої програми)
ПРН6. Використовувати інформаційні й
комунікаційні технології для вирішення
+ + + + + + + + +
складних спеціалізованих задач і проблем
професійної діяльності.
ПРН10. Знати норми літературної мови та
+ + +
вміти їх застосовувати у практичній діяльності.
ПРН16. Знати й розуміти основні поняття,
теорії та концепції обраної філологічної
+ + + + + + + + +
спеціалізації, уміти застосовувати їх у
професійній діяльності.
ПРН21. Знати і розуміти соціальну значущість
майбутньої професії, прогнозувати
+ + + +
перспективи розвитку сфери професійної
діяльності у конкретній філологічній галузі.
ПРН22.1. Знати і розуміти предметну сферу, + + +
базові поняття, спеціальну термінологію та
5
основні напрямки розвитку прикладної
лінгвістики.
ПРН24.1. Використовувати технології
автоматизованих систем інформаційного
пошуку, обробки тексту та перекладу з метою + + + + +
вирішення прикладних проблем
термінознавства.
ПРН25.1. Знати і розуміти сутність майбутньої
професійної діяльності у галузі лінгвістики та + + + + + +
ділової комунікації.
7. Схема формування оцінки:
7.1. Форми оцінювання:
Семестрове оцінювання:
Контроль знань здійснюється за системою ECTS, яка передбачає
дворівневе оцінювання засвоєного матеріалу, зокрема оцінювання
теоретичної підготовки – результати навчання (знання 1.1 – 1.3), що
складає 40% від загальної оцінки, та оцінювання практичної підготовки –
результати навчання (вміння 2.1 – 2.3); (комунікація 3.1 – 3.2);
(автономність та відповідальність 4.1), що складає 60% загальної оцінки.
Оцінювання за формами контролю:
Види робіт та форми їх Результати Кількіс Кількість балів Сумарна кількість
контролю навчання які ть за вид роботи балів за семестр
оцінюються занять максима мінімальн максима мінімаль
льна а для льна на для
позитивно позитивн
ї оцінки
ої оцінки
Модуль 1. Основи автоматичного опрацювання природної мови (Natural Language Processing)
Відповідь на практичному Усі РН 4 3 2 12 8
занятті
Лабораторна робота РН 1.2; РН 1.3; 2 4 2 8 4
РН 2.1; РН 2.2; РН
2.3;
РН 3.1; РН 3.2;
РН 4.1
Підготовка та презентація РН 1.1; РН 1.2; РН 2 6 4 12 8
доповіді 1.3;
РН 2.1; РН 2.2; РН
2.3;
РН 3.1;
РН 4.1
Усього (Модуль 1) 32 20
Модуль 2. Основні типи систем автоматичного опрацювання природної мови
Відповідь на практичному Усі РН 3 3 2 9 6
занятті
Лабораторна робота РН 1.2; РН 1.3; 2 4 2 8 4
РН 2.1; РН 2.2; РН
2.3;
РН 3.1; РН 3.2;
РН 4.1
Підготовка та презентація РН 1.1; РН 1.2; РН 1 7 4 7 4
6
доповіді 1.3;
РН 2.1; РН 2.2; РН
2.3;
РН 3.1;
РН 4.1
Тести РН 1.1; РН 1.2; РН 2 2 1 4 2
1.3;
РН 2.1; РН 2.3; РН 2.3
28 16
ПІДСУМКОВА КОНТРОЛЬНА РОБОТА: РН 1.1; РН 1.2; РН 1.3; РН 2.1; 40 24
РН 2.2; РН 2.3; РН 3.1; РН 4.1
Усього 100 60
Критерії оцінювання:
2. Лабораторна робота
4 бали – студент ретельно виконує роботу в повному обсязі та без
помилок, у змозі її проаналізувати, зробити самостійні висновки та
обґрунтувати їх; використовує основні та додаткові джерела інформації для
досягнення поставленої мети; демонструє вміння застосовувати набуті
знання з опертям на методи автоматичного опрацювання природного
мовлення, бере участь у науковій дискусії з теми.
3,5 бала – студент старанно виконує роботу в повному обсязі із
незначними помилками, може проаналізувати її та зробити висновки,
частково обґрунтувати їх; використовує основні джерела інформації для
досягнення поставленої мети; демонструє вміння застосовувати набуті
знання з опертям на методи автоматичного опрацювання природного
мовлення, відповідає на питання, пов‘язані з темою роботи.
2,5-3 бали – студент виконує роботу й може зробити загальні
висновки, опираючись на здобуті результати, продемонструвати вміння
7
використовувати методи автоматичного опрацювання природного мовлення,
відповісти на типові питання, пов‘язані з темою роботи; робота не виконана
в повному обсязі або ж має суттєві недоліки.
2 бали – студент виконує роботу фрагментарно, допускаючи значні
помилки; студент не в змозі проаналізувати результати роботи,
продемонструвати вміння використовувати методи автоматичного
опрацювання природного мовлення, відповісти на типові питання, пов‘язані
з темою роботи.
4. Тести
2 бали – 90-100% правильно вирішених тестових завдань.
1,5 бала – 75-89% правильно вирішених тестових завдань.
1 бал – 50-74% правильно вирішених тестових завдань.
0,5 бала – 0-49% правильно вирішених тестових завдань.
8
6. Підсумкова контрольна робота
9
Комп’ютерна лексикографія: теоретичні засади, особливості
лексикографічного процесу.
Комп’ютерна лексикографія: предмет та об'єкт вивчення, етапи
розвитку, типологія комп’ютерних словників.
Українська комп’ютерна лексикографія: етапи розвитку,
лексикографічні установи, відомі комп’ютерні словники.
Автоматичний морфологічний аналіз: лінгвістичні засади, етапи
аналізу, типи аналізу, системи автоматичного морфологічного аналізу.
Поняття лематизації: характеристика текстової інформації на вході та
систематизація лінгвістичної інформації на виході цієї процедури.
Автоматичний морфемний аналіз: лінгвістичні засади, етапи аналізу,
типи аналізу.
Автоматичний синтаксичний аналіз: методи лінгвістичного
моделювання речення, етапи аналізу, типи аналізу, системи автоматичного
синтаксичного аналізу
Автоматичний семантичний аналіз: лінгвістичні засади, етапи аналізу,
типи аналізу, таксономічна методика семантичного аналізу лексики.
За Модулем 2:
Історія машинного перекладу.
Основні підходи до створення систем машинного перекладу.
Класифікації систем машинного перекладу.
Історія діалогових систем.
Класифікації діалогових систем.
Архітектура діалогової системи.
Історія синтезу мовлення за текстом.
Основні підходи до створення систем синтезу мовлення за текстом.
Розпізнавання мовлення.
Огляд і порівняння сучасних систем машинного перекладу.
Основні проблеми сучасного машинного перекладу.
Бази даних і знань для систем машинного перекладу.
Сучасні діалогові системи та ШІ: голосові помічники.
Огляд і порівняння сучасних систем синтезу мовлення за текстом.
Основні проблеми сучасних систем синтезу мовлення за текстом.
Основні проблеми сучасних систем розпізнавання мовлення.
Бази даних і знань для систем синтезу та розпізнавання мовлення.
Участь лінгвіста-експерта у створенні систем синтезу та розпізнавання
мовлення.
Підсумкове оцінювання: залік
7.2. Організація оцінювання:
Упродовж семестру здійснюється оцінювання відповідно до видів робіт та
форми контролю, описаних у п. 7.1. Залік виставляється за результатами
роботи студента впродовж усього семестру і не передбачає додаткових
10
заходів оцінювання. Студенти, які набрали мінімально позитивну кількість
балів – 60, отримують – “зараховано”. Студенти, які не набрали мінімально
позитивну кількість балів – 60, отримують – “незараховано”. Студентам, які
за семестр набрали сумарно менше ніж 60 балів, для складання заліку
необхідно скласти матеріал за темами, за якими виникла заборгованість,
у вигляді написання самостійних робіт, рефератів або ж за потреби
написати контрольну роботу.
7.3. Шкала відповідності підсумкових балів
№ Кількість годин
п/ Назва теми заняття
Лекції та Практичні Самостійна
п консультації заняття робота
Модуль 1. Основи автоматичного опрацювання природної мови (Natural Language Processing)
Вступ до дисципліни. Комп‘ютерна
1 лінгвістика як наука. АОПМ (NLP). 2 2 2
Комп’ютерна лексикографія: особливості
2 лексикографічного процесу. 2 2 2
3 Корпусна лінгвістика. 2 2 3
Автоматичний лінгвістичний аналіз:
3 морфологічний аналіз, морфемний аналіз, 4 2 3
синтаксичний аналіз, семантичний аналіз.
Лабораторні роботи з системами Корпусу
2 10
української мови
Усього за Модулем 1 10 10 20
Модуль 2. Основні типи систем автоматичного опрацювання природної мови
Машинний переклад: підходи до створення
4 4 2 5
систем МП та їх класифікація.
Діалогові системи та чат-боти: класифікації,
5 архітектура, бази даних і знань. Голосові 2 4 5
помічники.
Автоматичний синтез і розпізнавання
6 мовлення. Перспективи розвитку систем 2 4 10
АОПМ.
Усього за Модулем 2 10 10 20
Підсумкова контрольна робота 2 10
Усього за навчальною дисципліною 20 20 50
Загальний обсяг – 90 год.
У тому числі:
Лекцій – 20 год.
Практичних занять – 20 год.
11
Самостійна робота – 50 год.
9. Рекомендована література
Основні джерела
1. Вінцюк Т.К., Сажок М.М., Селюх Р.А., Федорин Д.Я., Юхименко
О.А., Робейко В.В. Автоматичне розпізнавання, розуміння та
синтез мовленнєвих сигналів в Україні. // Управляющие системы
и машины. – № 6 (278). – Киев, 2018. – С. 7-24.
2. Дарчук Н. П. Компʼютерне анотування українського тексту:
результати і перспективи. – Київ: Освіта України, 2013. 544 с.
3. Дарчук Н.П. Комп'ютерна лінгвістика (автоматичне опрацювання
тексту). Підручник. — К.: Видавничо-поліграфічний центр
"Київський університет", 2008. — 351 с.
4. Жуковська В. В. Вступ до корпусної лінгвістики: навчальний
посібник. – Житомир: Вид-во ЖДУ ім. І. Франка, 2013. – 142 с.
5. Карпіловська Є. А. Вступ до прикладної лінгвістики: комп'ютерна
лінгвістика. – Донецьк: Юго-Восток, 2006.
6. Тарануха В.Ю. Інтелектуальна обробка текстів: [навчальний
посібник]. Київ, 2014. 80 с.
7. Jurafsky Daniel, Martin James H. Speech and Language Processing
(3rd ed. draft). 2021. URL: https://web.stanford.edu/~jurafsky/slp3/
8. The Handbook of Computational Linguistics and Natural Language
Processing. Edited by Alexander Clark, Chris Fox, and Shalom Lappin.
Wiley-Blackwell, 2010. 800 p.
9. B. Srinivasa-Desikan. Natural Language Processing and
Computational Linguistics: A practical guide to text analysis with
Python, Gensim, spaCy, and Keras. – 2018, 371 р.
10.Malik, M., Malik, M.K., Mehmood, K. et al. Automatic speech
recognition: a survey. Multimed Tools Appl 80, 9411–9457 (2021).
https://doi.org/10.1007/s11042-020-10073-7
11.Michael McTear. Conversational AI: Dialogue Systems,
Conversational Agents, and Chatbots. 2020. 251 р.
12.Tan, X., Qin, T., Soong, F. and Liu, T.Y., 2021. A survey on neural
speech synthesis. arXiv preprint arXiv:2106.15561.
Додаткові джерела
1. Муковнін Є. В. Труднощі в роботі систем обробки природної
мови та основні методи їх вирішення. Сучасні філологічні
дослідження та навчання іноземної мови в контексті
міжкультурної комунікації (Х). Житомир. 2017. С. 343-347.
2. Партико З.В. Прикладна і комп'ютерна лінгвістика: Вступ до
спеціальності. Львів: Афіша, 2008. 224 с.
12
3. Робейко В.В. Моделирование особенностей спонтанной
украинской речи в системах автоматического распознавания
речевого сигнала. // Кибернетика и вычислительная техника:
Межведомственный сборник научных трудов. – Вып. 170. – Київ,
2012. – С. 76-85.
4. Goldberg Y. Neural Network Methods for Natural Language
Processing. Morgan & Claypool Publishers. 2017. 309 р.
5. Valeriy Pylypenko, Valentyna Robeiko, Mykola Sazhok, Nina
Vasylieva, Oleksandr Radoutsky. Ukrainian Broadcast Speech Corpus
Development. // Proc. of the 14th International Conference “Speech
and Computer: SPECOM’2011”. – Kazan, Russia, 2011. – P. 435-440.
6. M. Sazhok, V. Robeiko, D. Fedoryn. Distinctive features for Ukrainian
real-time speech recognition system. // Обробка сигналів і зображень
та розпізнавання образів: Дванадцята Всеукраїнська міжнародна
конференція. – Київ, 2014. – С. 66-70.
13