Professional Documents
Culture Documents
Course Paper On Applied Linguistics
Course Paper On Applied Linguistics
Курсова робота
на тему:
«Створення частотного словника новел «За простибі» та «Весільна»
Романа Іваничука»
Виконала:
ст. гр.ФЛПЛ-11
Гнатів Марія
Перевірила:
к. філол. н., доц. Таран О. С.
Львів 2020
1
Зміст
ВСТУП……………………………………………………………………..3
Розділ 1. ТЕОРЕТИЧНІ АСПЕКТИ УКЛАДАННЯ ЧАСТОТНИХ
СЛОВНИКІВ…………………………………………………………………….5
1.1.Загальна характеристика й принципи укладання частотних
словників…………………………………………………………………5
1.2. Переклад матеріалів з книги Ладислава Згасти «Manual of
Lexicography» (Розділ 6 (Monolingual dictionaries) ст. 224-231)……..7
1.3. Загальномовні / авторські частотні словники — Частотний
словник роману Івана Франка «Перехресні стежки» (Бук С., Ровенчак
А.), Частотний словник окремого корпусу текстів (Фольклорні
тексти; Демонологічні розповіді Буковини), Частотний словник
сучасної української публіцистики...…………………………………14
Розділ 2. СТВОРЕННЯ ЧАСТОТНОГО СЛОВНИКА МОВИ Р.
ІВАНИЧУКА (НОВЕЛИ «ЗА ПРОСТИБІ» ТА «ВЕСІЛЬНА»)…………21
2.1. Мікроструктура словникової статті……………………….21
2.2. Етапи укладання…………………………………………….22
2.3. Матеріали до частотного словника творів Р. Іваничука…25
Висновки………………………………………………………………….29
Список використаних джерел………………………………………….30
2
ВСТУП
Актуальність теми курсової роботи зумовлена великою сферою
застосувань частотних словників. З розвитком технологій інтерес до
статистичного обстеження великих сукупностей текстів постійно зростав і як
наслідок у науці лексикографії виникає нова галузь, яка одержала назву
статистичної. Статистична лексикографія, у свою чергу, сприяє
укладанню частотних словників. Статистичні дані парадигм слів, що наведені
у цьому виді словника, забезпечують можливість здійснення великого
спектру граматичних досліджень. За свою порівняно невелику історію
укладання (вона не налічує й століття), у світі видано понад 400 частотних
словників для майже усіх індоєвропейських мов. Спершу, метою укладання
таких словників було удосконалення систем стенографії та відбір лексичного
мінімуму. Тепер, укладання частотних словників зумовлене не лише
потребою суспільства у практичному застосуванні надбань мовознавства, а
також необхідністю детальніше пізнати закономірності функціонування
мовних одиниць у тексті. Надзвичайно корисним є застосування частотних
словників у машинному перекладі та інформаційному пошуку, однак сфера
використання є значно ширша. Особливим видом частотних словників є
словники мови письменника. У них представлено лексико-фразеологічний
склад одного, кількох або усіх творів певного письменника (рідше – багатьох
авторів). Ці словники використовують для вивчення творчості письменника,
дослідження відповідних етапів в історії національної літературної мови і
суспільної атмосфери певної епохи. В Україні вийшли: Словник мови
Шевченка, Словник мови творів Г. Квітки-Основ'яненка, Лексика «Енеїди»
І.Котляревського, Словник поетичної мови Василя Стуса, Лексика поетичних
творів І.Франка та багато інших. Над розробкою частотних словників
працювали Н. Дарчук, В. Перейбийніс, М.Муравницька, Т.Грязнухіна, С. Бук
та інші.
3
Курсова робота є частиною комплексної роботи з компʼютерної
лексикографії на кафедрі прикладної лінгвістики НУ «Львівська
політехніка».
Об’єкт дослідження — частотний словник.
Предмет дослідження — мікроструктура частотного словника.
Джерельною базою послугували друковані тексти новел Р.Іванчука
(«За простибі», «Весільна»). Вони були перетворені в електронний варіант
(обсяг — 2580 друкованих знаків з проміжками).
Мета курсової роботи — підготувати матеріали до частотного
словника мови творів Р.Іванчука («За простибі», «Весільна»).
Поставлена мета передбачає розв’язання таких завдань:
1. Описати теоретичне підґрунтя створення частотного словника мови
Р.Іванчука.
2. На основі проаналізованих частотних словників мови письменників
розробити мікроструктуру частотного словника творів Р.Іванчука
3. Визначити етапи й інструменти створення частотного словника.
4. Укласти матеріали до частотного словника мови творів Р.Іванчука
У курсовій роботі використано такі дослідницькі методи й прийоми:
аналізу – мислене або практичне розчленування цілого на
частини;
синтезу – мисленнєве або практичне з’єднання частин у ціле;
описовий, його мета – планомірна інвентиризація одиниць мови і
пояснення особливостей їх будови та функціонування на певному
етапі розвитку мови, тобто в синхронії. Суть методу полягає в
інвентаризації та систематизації мовних одиниць;
A також компʼютерна програма Exel.
Практичне значення курсової роботи полягає в тому, що укладені
матеріали до частотного словника творів Р.Іванчука є частиною майбутнього
частотного словника мови цього митця.
4
Розділ 1
ТЕОРЕТИЧНІ АСПЕКТИ УКЛАДАННЯ ЧАСТОТНИХ
СЛОВНИКІВ
1.1. Загальна характеристика і принципи укладання частотних
словників
Багато науковців та експертів не здивовані швидкістю, з якою
електронні словники замінили своїх друкованих попередників, адже це
відповідало вимогам часу та новітнім технологічним досягненням та
можливостям. Як влучно відмітив Б.Л. Ван-дер-Варден, «Сучасне
мовознавство все ширше застосовує математичний інструментарій та
комп’ютерні технології в контексті переходу від описових до аналітичних
методів дослідження. Відповідно до цього сучасна філологічна освіта
немислима без опертя на обчислювальну лінгвістику як для осмислення
отриманих наукових результатів, так і для проведення самостійного
лінгвістичного експерименту з використанням чисельних методів». Дійсно,
статистичний аналіз є найбільш поширеним та доступним кількісним
методом аналізу тексту. Проте, розробники електронних словників все ж
стикаються з деякими проблемами, найбільшою з яких є задоволення потреб
користувачів. Часові та фінансові витрати на збір матеріалу, його обробку,
емпіричні дослідження і так далі також є проблематичним моментом для
укладачів електронних словників. Незважаючи на це, укладання електронних
словників відбувається досить інтенсивно та плідно.
З розвитком мовознавства, в сукупності з іншими науками, з’являється
статистична лексикографія, яка у свою чергу дає початок створенню та
укладанню частотних словників. За визначенням, поданим Ю. Ковалем у
його Літературознавчій енциклопедії, частотний словник – це словник, у
якому щодо кожного слова визначено кількість його вживання в обмежених
текстах. Він упорядковується для мовознавчих студій на підставі теорії та
методів статистичної лексикографії. Використання частотних словників може
бути різноманітним та ефективним, якщо знати певні статистичні правила і
5
закони, нескладні й цілком доступні тим, хто не має вищої математичної
освіти.
Загалом, структура частотного словника має низку особливостей.
Одиницями частотних підрахунків найчастіше є словоформи і лексеми.
Частотний словник словоформ уважається простішим для укладання і менш
досконалим, оскільки він не вимагає лематизації. Характер вибірки кожного
словника визначається хронологічною та жанрово-тематичною
приналежністю. Обсяг вибірки може варіюватись (наприклад, в частотному
словнику сучасної української художньої прози - 500 000 слововживань, в
частотному словнику сучасної української поетичної мови - 300 000
слововживань, в частотному словнику сучасної української публіцистики -
300 000 слововживань). Характер подачі матеріалу у всіх словниках
алфавітно-частотний (звичайний або інверсійний). Вказуються такі
статистичні характеристики як абсолютна частота, середня частота, міра
коливання середньої частоти та коефіцієнт стабільності.
Сфера застосування частотних словників досить широка та
різноманітна. Частотний словник можна використати і для стилістичних
студій, і для атрибуції не підписаних рукописів, і для автоматичного
опрацювання текстової інформації. Частотні словники також сприяють
оптимізації процесу викладання іноземної мови. Було встановлено, що 1000
найбільш вживаних слів англійської мови покриває 80,5% слововживань у
середньостатистичних текстах, 2000 слів – приблизно 86% слововживань, а
3000 – відповідно 90%. Ще одною важливою сферою застосування частотних
словників є стилеметрія, тобто визначення приналежності даного тексту до
одного з фіксованих класів текстів.
Словник мови письменника – теж є видом частотних словників, який
має широкий спектр застосування: від реконструкції особливості мовлення
певного періоду (створення реєстру слів словника мови того часу) до
встановлення авторства творів чи їх фрагментів (оскільки кожен автор має
свої так звані «улюблені» слова чи конструкції, які в його творчості мають
6
найвищу частотність. І, навпаки, можна визначити ті слова, які не
функціонували в суспільстві у період його діяльності, тому не могли
трапитися в його творчості). Словник мови письменника також дає
інформацію про стилістичні особливості письменника (А. Бєлий уклав
частотні списки іменників, прикметників та дієслів на позначення сонця,
місяця, неба, повітря, води в поезіях А. Пушкіна, Є. Баратинського і Ф.
Тютчева. Після упущення слововживань, характерних усім трьом авторам,
оперуючи рештою з них, він показав особливості сприйняття природи
кожним із поетів).
15
наголос у словнику подається лише коли він відіграє
смислорозрізнювальну роль (СÁМИЙ і САМИ́Й);
лексеми, написані некириличною графікою лематизуємо відповідно
до граматики тієї мови, до якої вони належать. Числа, написані
цифрами, вважаємо окремим словом.
Частотний словник мови Франка багатий на інформацію як про
словоформи як такі, доступно їх роз’яснюючи. Він також дає змогу
характеризувати діалект визначного письменника.
Частотний словник окремого корпусу текстів (Фольклорні тексти;
Демонологічні розповіді Буковини)
Цей електронний частотний словник корпусу окремих текстів можна
знайти на онлайн-порталі MOVA.info. Інтерфейс словника побудований
досить просто і зрозуміло. Зліва бачимо список корпусів, з яких можемо
обрати. Серед них – Законодавчі тексти, Наукові тексти, Поетична мова,
Публіцистика, Фольклорні тексти та Художня проза. Посередині
знаходяться частотні словники словоформ та лексем.
16
Наступний крок – обираємо корпус тексту, який нас цікавить,
натискаючи на відповідну стрілочку. Я обрала Фольклорні тексти, зокрема
Демонологічні розповіді Буковини.
20
Розділ 2
СТВОРЕННЯ ЧАСТОТНОГО СЛОВНИКА МОВИ Р.
ІВАНИЧУКА (НОВЕЛИ «ЗА ПРОСТИБІ» ТА «ВЕСІЛЬНА»)
2.1. Мікроструктура словникової статті
Частотний словник мови Р. Іваничука розроблявся у програмі Excel,
адже вона має широкий спектр інструментів, які роблять оперування
інформацією зручним і доволі швидким.
Загалом, словникові статті новел розміщені на двох аркушах – «Лист 1»
для «На простибі», «Лист 2» – для «Весільна». Два наступні аркуші виділені
на власне розрахунки частотності різних частин мови («Лист 3» – для «За
простибі», «Лист 4» – для «Весільна»).
Присутні 7 стовпчиків з наступними назвами – Ім’я файла, Номер
речення, Речення, Номер словоформи, Словоформа, Лема та Частина мови.
Назва новели підписана у стовпчику Ім’я файла. Стовпчик Речення містить
кожне з речень новели, виписані з великої букви. Кожне з цих речень розбите
на словоформи, вони вписані під стовпчиком Словоформа у тій формі, в якій
вони трапляються у речення. Кожна з цих словоформ подана збоку у своїй
початковій формі (Лема):
Іменники – у називному відмінку (однини або множини, в
залежності від контексту);
Займенники – у називному відмінку (однини або множини, в
залежності від контексту);
Прикметники (а також займенники з властивостями прикметника,
дієприкметники та числівники) – у чоловічому роді називного
відмінку (однини або множини, в залежності від контексту);
Дієприслівники – без змін.
Усі слова, окрім власних назв вписуються з малої букви у стопчик
Лема.
Умовних позначень та скорочень немає, частина мови вписується
повністю.
21
2.2. Етапи укладання
Укладання частотного словника за відповідною структурою
здійснювалось у декілька етапів.
23
Мал.7 Розрахована частотність для новели «За простибі»
24
2.3. Матеріали до частотного словника Р. Іваничука
Нижче подаються фрагменти матеріалів до частотного словника Р.
Іваничука. Для прикладу обрала два рандомних речення. Перше речення
взято з новели «За простибі», друге – з новели «Весільна»
Старий кіт сидів у Маріїних ногах, підігнувши хвоста, він поблажливо
блимав на бабу зеленкуватими очима: смішні думки снує його газдиня, нікуди
вона не поїде, про тих своїх рідних онуків торочила й тоді, як Мурчик ще
малим кошеням дряпався по ліжнику, що он висить на жердці, вічно про них
балакала, а чужих колисала.
1 Старий старий прикметник
2 кіт кіт іменник
3 сидів сидіти дієслово
4 у у прийменник
5 Маріїних Марія іменник
6 ногах ноги іменник
7 підігнувши підігнути дієслово
8 хвоста хвіст іменник
9 він він іменник
10 поблажливо поблажливо прислівник
11 блимав блимати дієслово
12 на на прийменник
13 бабу баба іменник
14 зеленкуватими зеленкуваті прикметник
15 очима очі іменник
16 смішні смішні прикметник
17 думки думки іменник
18 снує снувати дієслово
19 його він займенник
20 газдиня газдиня іменник
21 нікуди нікуди прислівник
22 вона вона займенник
23 не не частка
24 поїде поїхати дієслово
25 про про прийменник
26 тих ті займенник
27 своїх свої займенник
28 рідних рідні іменник
29 онуків онуки іменник
30 торочила торочити дієслово
31 й й сполучник
32 тоді тоді прислівник
33 як як частка
25
34 Мурчик Мурчик іменник
35 ще ще прислівник
36 малим малий прикметник
37 кошеням кошеня іменник
38 дряпався дряпатись дієслово
39 по по прийменник
40 ліжнику ліжник іменник
41 що що сполучник
42 он он частка
43 висить висіти дієслово
44 на на прийменник
45 жердці жердка іменник
46 вічно вічно прислівник
47 про про прийменник
48 них вони займенник
49 балакала балакати дієслово
50 а а сполучник
51 чужих чужі прикметник
52 колисала колисати дієслово
Дерево трупішіє на землі, лежать нікому не потрібні мерці, вміли зрубати,
та не змогли стягти звідси ялиці, і назвали люди дикий цвинтар Погарем —
згарищем, і кублились на ньому тепер лише гадюки, а небо хмурилось тут
завжди, дивлячись на людське безглуздя.
1 Дерево дерево іменник
2 трупішіє трупішіти дієслово
3 на на прийменник
4 землі земля іменник
5 лежать лежати дієслово
6 нікому ніхто займенник
7 не не частка
8 потрібні потрібні прикметник
9 мерці мерці іменник
10 вміли вміти дієслово
11 зрубати зрубати дієслово
12 та так сполучник
13 не не частка
14 змогли змогти дієслово
15 стягти стягти дієслово
16 звідси звідси прислівник
17 ялиці ялиці іменник
18 і і сполучник
19 назвали назвати дієслово
20 люди люди іменник
21 дикий дикий прикметник
22 цвинтар цвинтар іменник
26
23 Погарем Погар іменник
24 згарищем згарище іменник
25 і і сполучник
26 кублились кублитись дієслово
27 на на прийменник
28 ньому він займенник
29 тепер тепер прислівник
30 лише лише частка
31 гадюки гадюки іменник
32 а а сполучник
33 небо небо іменник
34 хмурилось хмуритися дієслово
35 тут тут прислівник
36 завжди завжди прислівник
37 дивлячись дивлячись дієприслівник
38 на на прийменник
39 людське людський прикметник
40 безглуздя безглуздя іменник
27
Висновки до Розділ 2
Цей розділ повністю присвячений практичній частині курсової, а саме
– укладанню частотного словника мови Романа Іваничука на базі двох з його
новел – «За простибі» та «Весільна» з допомогою програми Excel.
Детально описано мікроструктуру словника: як виглядають словникові
статті, яка інформація присутня у таблицях та що містить кожен заголовок.
Зокрема, розписано яка саме робота проводилась над самим текстом та над
присутніми в ньому словоформами.
Подано етапи укладання частотного словника. Усі 5 етапів пояснено та
розкрито: від одержання матеріалів, їх обробки і до здійснення основного
завдання практичної частини курсової – розрахунок частотності.
У розділі присутні знімки екрану, які наглядно демонструють виконану
роботу.
Також додані матеріали до частотного словника Романа Іваничука у
вигляді тексту з програми Excel.
28
Висновки
Розвиток гуманітарних та точних наук, а також революційні технології
впливають і видозмінюють світ довкола. Не уникнула змін і наука
лексикографії, з якої поступово відгалузилась статистична лексикографія.
Електронні словники почали швидко заміняти своїх друкованих
попередників. Прагнення суспільства до практичного застосування
мовознавчих надбань та досліджень мовних одиниць у тексті маніфестує себе
в створенні та укладанні частотних словників. Частотний словник — це тип
словника, в якому наводиться частота вживання слів, словоформ чи
словосполучень у певній сукупності текстів. Сфера їх застосування досить
об’ємна і не вимагає у користувачів глибоких математичних знань, тобто
вони є зрозумілі та відносно прості у користуванні. Словники мови
письменників також є корисними для суспільства – з їх допомогою бачимо
стилістичні особливості письменника, його індивідуальність.
Аналіз частотних словників авторів показав, що мікроструктура
кожного з них містить словоформи або лексеми, алфавітно-частотний
(звичайний або інверсійний) характер подачі матеріалу, абсолютну та/або
середню частоту та ін. Деякі словники також можуть подавати роз’яснення
до певних лексем (як наприклад це робить Частотний словник окремого
корпусу текстів).
29
Список використаних джерел
1) Бук С. Квантитативна параметризація текстів Івана Франка:
Проект та його реалізація, Вісник Львівського університету.
Серія філологічна. 2013. Випуск 58. С. 290–307
2) Бук С., Ровенчак А. Частотний словник роману Івана Франка
«Перехресні стежки»
3) Єрмолова Я. А., Частотні словники та їх використання, 2012 р., м.
Харків. — Х. : ХНУ ім. В. Н. Каразіна, 2012. — С. 116–117
4) Ковалів Ю. Літературознавча енциклопедія: У двох томах, Т.2,
2007. С. 574
5) Корпус текстів української мови [Електронний ресурс]. URL:
http://www.mova.info/corpus2.aspx
6) Частотний словник [Електронний ресурс]. URL:
https://uk.wikipedia.org/wiki/%D0%A7%D0%B0%D1%81%D1%82
%D0%BE%D1%82%D0%BD%D0%B8%D0%B9_%D1%81%D0%
BB%D0%BE%D0%B2%D0%BD%D0%B8%D0%BA
7) Частотний словник сучасної української публіцистики
[Електронний ресурс]. URL:
http://www.mova.info/Page2.aspx?l1=91
8) Частотні словники [Електронний ресурс]. URL:
http://www.mova.info/article.aspx?l1=69&DID=75
9) Zgusta, Ladislav «Manual of Lexicography», 1962
30