You are on page 1of 35

Державний вищий навчальний заклад

« Прикарпатський національний університет імені Василя Стефаника»


Кафедра німецької мови

КУРСОВА РОБОТА
на тему:
«Квантитативні методи у лінгвістичних дослідженнях.
Полісемія»

Студентки
ІІІ курсу, групи Н-31(б)
Сірко Наталії Михайлівни
Науковий керівник: Венгринович В.В.

м. Івано-Франківськ - 2020 рік


ЗМІСТ
ВСТУП………………………………………………………………………………3
РОЗДІЛ 1 . ЛІНГВОСТАТИСТИКА ТА ЇЇ РОЛЬ У МОВОЗНАВСТВІ…..5
1.1 Основні ідеї та рівні лінгвостатистики…………………………………………5
1. 2 Основні методи квантитативних досліджень…………………………………8
1.3 Лінгвостатистичний експеримент……………………………………………..11
РОЗДІЛ II. ВИКОРИСТАННЯ СТАТИСТИЧНИХ МЕТОДІВ У
ЛІНГВОСТАТИСТИЧНИХ ДОСЛІДЖЕННЯХ. ПОЛІСЕМІЯ…………….
2

2.1 Полісемія. Структурні відношення між значеннями багатозначного


слова…………………………………………………………………………………15
2.2 Проблеми полісемії у квантитативній лінгвістиці…………………………19
2.3 Використання методів кількісного аналізу у лінгвістичних
дослідженнях……………………………………………………………………….27
ВИСНОВКИ………………………………………………………………………32
СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ…………………………….......34
3

ВСТУП
Для будь-якого сучасного лінгвістичного дослідження актуальним
залишається загальнонаукове і філософське твердження про органічну єдність
якісного та кількісного визначення предметів і явищ: «пізнати – означає
виміряти». У наукознавстві підкреслюється, що саме дія закону переходу
кількості у якість служить важливою умовою виявлення закономірностей
існування об’єктів та явищ, у тому числі мовних. Тому погоджуюся із думкою
В. К. Журавльова, що комплексне застосування різних методів, у тому числі
статистичних, допоможе отримати нову інформацію про лінгвістичні об’єкти,
конкретизувати факти, знайдені на інших шляхах історико-лінгвістичного
пізнання.
Aктуальність дослідження. Серед науковців, які зробили свій внесок
у розвиток квантитативної лінгвістики, варто назвати таких людей : Н. Г.
Єсипенко, В. І. Кушнерик, В. В. Левицький, О. Д. Огуй, І. Перебийніс, Б.
Тошович, В. В. Венгринович та ін., серед зарубіжних : Д. Алтман, К. Беста, К.
Мертен. Використання квантитативних методів при наукових дослідженнях
дозволяє глибоко проникати у їх сутність. Оскільки деякі елементи мови і
мовлення зумовлюються певною частотою і величиною, то мовленнєвий
процес, відповідно, досліджується за допомогою методів математичної
статистики. Проте, багато питань, які стосуються дослідження методів
квантитативної лінгвістики, залишаються нерозглянутими та викликають
дискусії серед вчених лінгвістів, наукознавців, філологів, перекладознавців.
Мета дослідження: дослідити особливості застосування
квантитативних методів у лінгводослідженнях ; проаналізувати роль,
проблематику та місце полісемії в лексикології німецької мови.
Досягнення мети дослідження передбачало розв’язання таких завдань:
Завдання:
1) охарактеризувати основні ідеї та принципи лінгвостатистики;
2) проаналізувати основні методи квантитативних досліджень;
4

3) розглянути важливість лінгвостатистичного експерименту у


квантитативній лінгвістиці;
4) дослідити місце полісемії в мовознавстві, а також її роль, функції та
проблеми;
5) визначити основні напрями застосування квантитативних методів
лінгвостатистичних досліджень.
Об’єкт дослідження: методи кількісного аналізу у лінгвістичних
дослідженнях. Полісемія.
Предмет дослідження: особливості застосування методів
квантитативних досліджень у лінгвостатистиці, їх ефективність та важливість.
Роль та місце полісемії.
Методи дослідження. Для вирішення поставлених завдань були
використані наступні методи: теоретичні: аналіз, синтез, систематизація,
зіставлення, класифікація науково-психологічних джерел інформації, що
дозволило узагальнити та систематизувати погляди вчених на проблему, яка
розглядається.
Структура курсової роботи. Курсова робота складається зі вступу,
двох розділів, висновку та списку використаної літератури (20). Загальний
обсяг курсової роботи становить сторінок 36 , з них основного тексту - 29
сторінки.
Перший розділ присвячується теоретичним засадам дослідження
квантитативних методів лінгвостатистики.
У другому розділі я аналізую застосування цих методів, роблю
характеристику полісемії, досліджую її проблематику та функції.
5

РОЗДІЛ I . ЛІНГВОСТАТИСТИКА ТА ЇЇ РОЛЬ У МОВОЗНАВСТВІ.


1.1 Основні ідеї та рівні лінгвостатистики
Як прийнято говорити у сучасному мовознавстві, мова - це деяке
системно - структурне утворення. Окремі підсистеми мови називають рівнями,
які представлені відповідними одиницями : фонемами, морфемами, лексемами,
синтагмами . Оскільки одиниці кожного рівня мови знаходяться у залежності
від одиниць вищеназваних рівнів, то зрозуміло, що, наприклад, число слів в тій
чи іншій мові буде залежати від кількості афіксів (префіксів і суфіксів) з
дериваційним значенням, а кількість морфем - від кількості фонем. У той же
час число фонем в різних мовах не збігається. Ці прості приклади показують,
що мова характеризується певними якісними і кількісними ознаками . [1, ст.
189].
Якісний мовний аналіз представляє собою ніщо інше, як його
категоризацію , а точніше виокремлення в мові мовних класів, представлених
відповідними якісними ознаками. Цими ознаками ( категоріями) можуть бути,
як зазначено вище одиниці мови( фонеми, морфеми, лексеми), граматичні
категорії, граматичні способи ( афіксація, словотворення і т.д), типи слів
( діалектизми, вульгаризми, архаїзми , неолізми і т.д. ), види речень ( складні,
прості, складносурядні, складнопідрядні і т. д).
Проте будь - яка категоризація, тобто якісний мовний аналіз, невід’ємно
пов’язана з квантифікацією мови - його кількісним аналізом. Аналізуючи
мовні категорії, ми говоримо, що в німецькій мові, на відміну від української, є
не 6, а 4 відмінка. Таким чином, немає ніякого сумніву в тому, що мова поряд з
якісними ознаками володіє і кількісними.
У сучасній науці розрізняють так звані "добре організовані системи" і
"погано організовані (дифузні) системи" . До добре організованих систем
належить, наприклад, рух планет. Завдяки чіткій впорядкованості цієї системи
можна точно повідомити і і передбачити час сонячного затемнення . До
погано організованих системам належить інтелектуальна діяльність людини , а
разом з нею і «мовна поведінка», тобто використання мови. Вважається, що
6

найбільш ефективними методами вивчення погано організованих систем є


методи математичної статистики . [2, с. 189]
Таким чином, мова може бути досліджена за допомогою кількісних і
якісних методів. Галузь науки, яка займається кількісним аналізом мови і
мовлення, називають в сучасній науці по-різному. Найчастіше
використовуються чотири терміни: математична лінгвістика, квантитативная
лінгвістика, статистика мови, лінгвостатистика. Зрозуміло, що при всій
схожості цих найменувань між ними існують певні відмінності. В самому
математичному апараті, а точніше , в сукупності математичних методів можна
умовно розрізняти «кількісні» і «некількісні» методи. За допомогою
некількісних методів (теорія множин, теорія алгоритмів, математична логіка)
доцільно вивчати, перш за все, систему мови (langue). Цей розділ науки
отримав назву «комбінаторна лінгвістика». За допомогою кількісних методів
(насамперед, теорія ймовірності і математична статистика) доцільно
досліджувати мову (текст), тобто рагоle.
Цей другий напрям і називають квантитативною лінгвістикою. Таким
чином, можна було б вважати, що математична лінгвістика є більш ширшим
поняттям, порівняно з квантитативною лінгвістикою; тому що математична
лінгвістіка включає і комбінаторну і квантитативну лінгвістику, але все ж
квантитатитивна лінгвістика – це ширше поняття, порівняно з статистикою
мови чи лінгвостатистикою. На практиці ж поняття «математична лінгвістика »і
«квантитативна лінгвістика» співпадають. [3, с. 44]
Якщо, таким чином, розглядати лінгвостатистику, як одну з основних
частин квантитативної лінгвістики, стає зрозумілим той факт, що між
лінгвостатистикою і квантитативною ( математичною ) лінгвістикою існує
помітна різниця, а саме: кількість об'єктів і набір методів у лінгвостатистиці
вивчаються грунтовніше і поглиблиніше, ніж в матиматичній лінгвістиці в
цілому. [4, с. 189]
Слід зазначити, що в західноєвропейській літературі термін
«квантитативна лінгвістика» позначає ту галузь знань, яку в українському
7

мовознавстві називають « лінгвостатистика», « статистика мови». Тобто, ці


поняття тотожні.
По ступені математизації мавознавчої науки, дослідження в області
квантитативної лінгвістики можна чисто умовно поділити на три рівні.
Верхній рівень- це рівень використання апарату математичної
лінгвістики ( теорія множень, теорія алгоритмів, математична логіка і т. д) . Цей
рівень потребує спеціальної математичної освіти. Роботи, які відносяться до
« верхнього рівня» характеризуються пошуками « моделей і законів» розподілу
частот мовних одиниць, використання складних формул, публікації наукових
досліджень, область яких, ще недостатньо вивчена лінгвістами. Результати,
отримані в роботах такого змісту, обговорюються та використовуються
лінгвістами в їх подальших дослідженнях.
Середній рівень характеризується використанням таких статистичних
показників як середнє арифметичне, середнє квадратичне відхилення. Цей
рівень пропонує оперування такими поняттями, як беноміальні, нормальні та
інші типи розподілу , правило трьох сигм, коефіцієнт варіацій, коефіцієнт
поширенності , критерії хі- квадрат, коефіцієнт кореляцій, критерій Стьюдента
і т. д. Для оволодіння цим рівнем не обов'язково мати спеціальну математичну
освіту, проте, без сумніву, потрібне поглиблене вивчення статистичних
методів в лінгвістиці. Можна скористатись науковими посібниками [ Носенко,
1981], [ Перебийніс , 2002].
Нижній рівень можна було б обмежити вмінням збирати елементарні
дані в частоті зустрічних мовних фактів і представляти їх в відсотковому
співвідношенні, яке спостерігається, наприклад, в кандидатських дисертаціях ,
автори яких, вирішили звернутись до кількісного мовного аналізу. Проте,
використання «відсотків» для кількісного аналізу не є цілком достатнім, так як
це не дозволяє отримати надійні та обґрунтовані висновки. Для успішного
квантитативного аналізу матеріалу, було б достатнім ( на нижчому рівні
квантифікації) використовувати критерії хі - квадрат, коефіцієнти кореляції та
8

варіації та інших простих, доступних для лінгвіста прийомів та понять. [1, с.


192].
Отже, квантитативна лінгвістика чи лінгвостатистика - це сукупність
методів і прийомів, за допомогою яких можна здійснити кількісний аналіз мови
та мовлення.

1.2 Основні методи квантитативних досліджень


Якщо природничі науки порівняно давно «заговорили» мовою
математики, то гуманітарні звернулися до неї значно пізніше: тільки у 40-50-их
роках ХХ-го століття, при цьому першою з них була саме лінгвістика. І. А.
Бодуен де Куртене, підводячи підсумки розвитку мовознавства ХІХ століття,
наголошував на тому, що потрібно все частіше застосовувати у мовознавстві
кількісне математичне мислення і таким чином більше наблизити його до
точних наук [5, с. 345] . Дане твердження науковця виявилося беззаперечним,
тому у наші дні виявлено основне: «для мови безсумнівним є квантитативний
фактор». Використання квантитативних методів при наукових дослідженнях
дозволяє глибоко проникати у їх сутність. Оскільки деякі елементи мови і
мовлення зумовлюються певною частотою і величиною, то мовленнєвий
процес, відповідно, досліджується за допомогою методів математичної
статистики. Учені-лінгвісти не могли не помітити статистичних характеристик
елементів мовлення, тому зародження лінгвістичної статистики із
використанням різних лінгвістичних методів і прийомів було неминучим.
Одним з найважливіших методів квантитатативної лінгвістики є
критерій хі-квадрат. Цей критерій отримав в статистиці протилежне по
значенню найменування - критерій відмінності, критерій згоди і відповідності. І
це не випадково, так як за допомогою критерія хі-квадрат можна визначити в
наявності відповідність, і наявність розбіжності між розподілом частот наявних
величин. Позначається цей критерій за допомогою грецької букви  χ - хі ( звідси
і назва хі-квадрат). Найбільш розповсюдженою формулою для обчислення  χ2
є формула
9

,
де О - фактично спостережувальні величини; Е- теоретично очікуване.
Отже, критерій χ2 (хі квадрат) перевіряє значимість розбіжності
емпіричних (спостерігаються) і теоретичних (очікуваних) частот. Більше того,
його пристосували для вирішення широкого кола завдань. Перш за все, це
аналіз категоріальних даних, тобто таких, які виражаються не кількістю, а
приналежністю до якоїсь категорії. Наприклад, клас автомобіля, стать учасника
експерименту, вид рослини і т.д. До таких даних не можна застосовувати
математичні операції на кшталт додавання і множення, для них можна тільки
підрахувати частоти. [6]
Необхідно підкреслити, що сам хі-квадрат є лише показником наявності
чи відсутності зв'язку, а як міру зв'язку використовують коефіцієнт взаємної
спряженості К, або, як його ще називають, "коефіцієнт Чупрова", який
обчислюється за формулою:

де К — коефіцієнт взаємної спряженості, N — сума частот у вихідній таблиці, χ


2 – величина хі-квадрата, df – кількість ступенів вільності. Величини
коефіцієнта К коливаються від 0 до 1. Зазначимо, що при вирахуванні
однотипних коефіцієнтів, коли величини N та df ідентичні для всіх таблиць, як
умовну міру зв'язку можна допустити величину 1. Для перевірки лінгвістичних
гіпотез, коли специфіка досліджуваного матеріалу не дозволяє отримати
достатню кількість вибірок, будують чотирипільну таблицю спряжених ознак.
Представимо схему таблиці спряжених ознак:

При цьому числа у таблиці повинні бути розташовані так, щоб a ≥ b, a c ≥ d.


Сума χ 2 у даному випадку обчислюється за формулою:
10

де a, b, c, d – емпіричні величини у таблиці спряжених ознак, N – загальне


число спостережень. Для чотирипільних таблиць коефіцієнт взаємної
спряженості К обчислюється за наступною формулою:

де N — загальне число спостережень,сума частот у вихідній таблиці, χ 2 –


величина хі - квадрата. Для визначення залежностей між різними одиницями і
встановлення причинного зв’язку використовуємо метод кореляційного аналізу,
метою якого є виявлення спільних тенденцій, тобто, прямого та зворотнього
кореляційного зв’язків досліджуваних нами фоносемантичних явищ. Мова іде
про пряму кореляцію, коли при збільшенні частоти одного явища збільшується
частота інших параметрів, і про зворотню – коли при збільшенні частоти
одного явища частота інших параметрів навпаки зменшується. Для обчислення
рангового коефіцієнту, який є найпростішим видом кореляційного аналізу, В. І.
Перебийніс подає наступну формулу:

де ߩ – критичне значення, n – кількість зіставлюваних рядів [2, с. 90]. В. В.


Левицький стверджував, що величина коефіцієнта кореляції вказує на ступінь
зв’язку між явищами, а його знак демонструє характер зв’язку. Тому учений
подає наступну найпоширенішу формулу для обчислення коефіцієнта
кореляції:
11

де r – коефіцієнт лінійної кореляції, ∑ − сума величин, отриманих у результаті


певної операції, х ଵ – значення першої ознаки, у ଵ – значення другої ознаки,
х ത – середня (теоретична) величина значень першої ознаки, у ത – середня
(теоретична) величина для іншої ознаки . [1, ст. 173]
Слово «вибірка» в українській мові має два значення « процес відбору
матеріалу» та «сукупність отриманих в результаті відбору елементів» (в
німецькій мові перше значення передається словами Auswahl, Erhebungseinheit).
Наприклад, в якості одиниці аналізу дослідник вибирає складне речення.
Мета аналізу - вивчення частоти використання складного речення в
публіцистиці та прозі. Тоді одиницями вибірки в публіцистиці може бути ,
наприклад, редакційна стаття на перших, головних рядках газети, або всі статті
під в газеті під визначеною рубрикою. Одиниця аналізу, як видно із наведеного
прикладу , - це не лінгвістична одиниця, яку лінгвіст збирається аналізувати.
Одиниця вибірки - це фрагменти текстів, об’єднаних деякими ознаками (ці
ознаки можуть бути формальними, змістовними чи кількісними). В залежності
від того, яким чином відбувається вибір досліджуваного матеріалу , виділяють
різні типи вибірки: випадкова, механічна і серійна. Крім того, розрізняють
структурні, неструктурні та типові вибірки. Є також й інша категоризація
вибірки, представлена К. Мертеном. Він визначає такі основні способи відбору
матеріалу: довільний, усвідомлений (мається на увазі, завчасно встановлений),
спосіб ймовірностей.
Проте, при формуванні групи текстів чи відрізків текстів в лінгвістиці
використовуються різні види вибірки. [1, ст. 197]

1.3 Лінгвостатистичний експеремент


Одним із важливих понять лінгвістичної статистики є поняття
лінгвістичного експерименту. Слово «експеримент» використовується в
12

сучасній науці в досить таки широкому значенні. В загальному виді під


експерементом розуміють наукове дослідження, за допомогою якого можна
щось відкрити, підтвердити, довести чи продемонструвати.
В соціальній психології та інших загальних науках під експериментом
розуміють « частину дослідження, яке полягає в тому, що дослідник здійснює
маніпуляцію змінними і наглядає ефекти, вироблені цим впливом, спостерігає
та аналізує інші зміни».
Звичайно, лінгвістичний та статистичний експеримент відрізняються від
експериментів у фізиці чи хімії. Основна мета лінгвостатистичних
експериментів полягає найчастіше у встановленні того , істотно чи неістотно
відрізняються один від одного генеральні сукупності (однорідний масив або
корпус деяких одиниць, які належить обстежити), отримані під час
експерименту ряди ( фонем, морфем, слів і т. д), а також того, за рахунок яких
фактів та ознак між названими попередньо рядами знайдено розбіжності.
Також, під час проведення експерименту лінгвістів цікавлять й інші питання,
наприклад, яким чином та за допомогою яких статистичних законів
розподіляються отримані ряди чистот та інші.
Одним з найважливіших вимог до експериментального вивчення того
чи іншого об’єкта є повторюваність, відтворюваність експерименту та
звичайно ж отримання результатів, дотримуючись умов під час дослідження.
Це означає, що, наприклад, якщо біолог успішно провів у своїй лабораторії
експеримент по клонуванні вівці, то при дотриманні всіх умов цього
експерименту - аналогічні чи схожі результати повинні бути і в іншій
лабораторії, яка проводила такий же експеримент. [2, ст. 17]

Лінгвіст повинен отримати не тільки будь-які якісні характеристики


досліджуваного об’єкта, але також і встановити за допомогою спеціальних
статистичних прийомів достовірність статистичних результатів.
Існують, умовно кажучи, «польові» та «лабораторні» типи
експериментів. Для прикладу, лінгвіст ставить перед собою завдання, дослідити
13

«гендерну» різницю в мовленні людей, тобто дослідити, чи існують будь - які


синтаксичні, лексичні, прагматичні відмінності в мові чоловіків та жінок. Під
час цього експерименту дослідник може використати «приховану камеру» чи
«прихований диктофон» і записати діалоги між чоловіками та жінками чи між
особами однієї і тої ж статі - в супермаркеті, на автобусній зупинці і т.д.
Лаболаторна техніка збирання матеріалу в даному випадку буде
полягати в тому, що дослідник використає деякі зразки готових текстів,
наприклад, діалоги персонажів з фільму. За таким самим принципом можуть
бути створені умови в лабораторії експериментальної фонетики для
відтворення та вивчення різних типів інтонації в різних типах речень
(лабораторний експеримент). Обидва методи зібрання та аналізування
матеріалу мають свої переваги та недоліки. Проте, в лабораторних умовах
складність мовних утворень спрощується, але при тому, з поля зору дослідника
можуть випасти важливі « зміни» величин чи факторів. Тим не менше,
більшість лінгвостатичних експериментів – це скоріш за все лабораторні
експерименти. [7, с. 40-42].
Отже, розпочинаючи лінгвостатистичний експеримент мовознавець
повинен чітко визначити, що рахувати, тобто, що є об’єктом дослідження; для
чого рахувати, інакше кажучи, з якою метою виконується аналіз; і як рахувати
чи, які методи застосовуються для розрахунків. Це означає, що дослідник, по-
перше, визначає ті лінгвістичні одиниці, форми та категорії, які будуть
статистично обстежуватися в експерименті. Підрахункам можуть підлягати
одиниці будь-якого рівня – фонеми або звуки, літери, сполуки звуків, фонем
або літер, склади, морфеми, слова, словосполучення, синтаксичні конструкції,
тексти тощо. По - друге, мовознавець визначає мету і завдання, які стоять перед
статистичним дослідженням, тобто істотні чи неістотні розходження між
вибірками. І останнє завдання лінгвіста передбачає визначення обсягу
досліджуваного матеріалу для отримання статистично вірогідних результатів,
знання правил організації вибірки, обчислення статистичних характеристик,
14

зіставлення статистичних параметрів різних сукупностей, застосування методів


визначення зв’язку досліджуваних одиниць у сукупності тощо. [2, с. 111]
15

РОЗДІЛ II. ВИКОРИСТАННЯ СТАТИСТИЧНИХ МЕТОДІВ У


ЛІНГВОСТАТИСТИЧНИХ ДОСЛІДЖЕННЯХ. ПОЛІСЕМІЯ.
2.1 Полісемія. Структурні відношення між значеннями багатозначного
слова.
У мові є слова з одним значенням, але частіше слова мають два і більше
значень. Слова з одним значенням називають однозначними, або
моносемічними (від гр. monos "один" і sema "знак"), а слова з двома і більше
значеннями — багатозначними, або полісемічними.
Полісемія (від гр. polysemos "багатозначний") — наявність різних
лексичних значень у одного й того ж слова відповідно до різних контекстів.
Деякі слова мають більше двадцяти значень. Так, слово "брати" вживається в
22, а "йти" — у 30 значеннях. Англійське "to take" тільки в
безприйменниковому вживанні має 51 значення: "брати", "захоплювати",
"привласнювати", "користуватися", "діставати, добувати", "приймати",
"сприймати, реагувати", "розуміти", "охоплювати", "захоплювати, подобатися",
"записувати", "містити", "діяти", "твердити", "наймати, орендувати", та ін.
Подібну багатозначність має семантично близьке до to take німецьке слово
nehmen. Загалом полісемія дуже поширене явище в усіх мовах світу. Так,
зокрема, за даними І.В. Арнольд, тисяча найуживаніших слів англійської мови
має 25 тисяч значень. [7, с. 147]
Самі лінгвісти прагнуть акцентувати когнітивну спрямованість своїх
досліджень, керуючись думкою про те, що «Причина самого існування
полісемії в природній мові - когнітивна ». Полісемія розглядається і як прояв
принципу економії (використання старих слів для позначення нових понять), і
як прояв принципу оптимізації (зберігання інформації про пов'язаних, з точки
зору людини, явищах в одній «Упаковці»). «Сам факт існування полісемії є
головним доказом когнітивної природи цього явища ». Полісемію розглядають
у сучасній лінгвістиці як одну з мовних універсалій. Проте варто мати на
увазі, що її існування визнають не всі лінгвісти . Заперечення полісемії
представлені у вигляді двох протилежних концепцій, які можна умовно звести
16

до деякого "семантичного роз'єднання" та "семантичного об'єднання" . До


представників першої концепції можна зокрема назвати О. О. Потебню, який
вважає, що слово по контексті набуває іншого значення, і вживається як інше
слово. Отже існує не багатозначність, а багатолексемність. Ця концепція не
тільки не суперечать експериментально доведеним фактам, які свідчать про те ,
що носії мови відчувають зв'язок між окремими значенням слова і отже
сприймають сукупність значень не як різні слова, а як варіанти деякого єдиного
лексико-семантичного комплексу, але, що не менш важливо, не може знайти
практичне втілення лексикографії, бо неможливо укласти словник, у якому
було б перераховано не окремі значення слова (зведені до деякої множини), а
нескінченну кількість контекстів у яких уживаються ці слова. Представники 2
концепції, до яких зокрема належать львівський лінгвіст С.Є Гурський ,
навпаки, вважають, що слово має тільки одне, загальне значення, а те, що
традиційно називають різними значеннями слова є лише варіантом цього
загального значення [9, с. 49]
Найважливішою ознакою полісемії є семантична цілісність слова , яка
забезпечена наявністю зв'язку між значеннями багатозначного слова. У
семасіології неодноразово звертали увагу на те , що міжсемемні зв'язки не
варто зводити до одного типу , вони можуть утворювати різні конфігурації .
По-перше, представлені у тлумачних словниках переліки значень
багатозначного слова є певною мірою лиш більш-менш наближеною до
дійсності схемою. Проте, насправді, одне значення багатозначного слова
частково перекриває інше значення. По-друге як показав W. Schmidt , зв'язок
різних другорядних значень з головним може здійснюватись так , що лінії цього
зв'язку набувають різної конфігурації, розходячись від центру в різні
напрямки. По-третє, не всі значення можуть бути пов'язані з основним.
Спостерігають і такі випадки, коли значення багатозначного слова пов'язані не
з ядерним (центральним) значенням , а одне з одним, утворюючи свого роду
ланцюжки. [10, с. 49]
17

Сукупність значень багатозначного слова розуміють у сучасній


лінгвістиці як деяку ієрархічно організовану структуру, що складається з
основного ( Haupt-) та другорядних ( Neben-), прямого і переносних, вільних і
фразеологічнo пов'язаних значень.
Наприклад, у сполученнях, der grüne Wald, grünes Laub, Gras, grüne Blätter,
тощо, слово grün виступає у своєму основному , прямому, номінативному
значенні "von grünen Farbe", інші значення цього слова є другорядними і, як
правило, переносними: grünes Obst, grüne Äpfel( "unreif"), ein grüner junge
("unerfahren"). Наслідуючи В. В. Виноградова, в лінгвістиці розрізняють також
вільні і фразеологічного зв'язані значення.
Так у сполученнях ein blinder Mensch (Man, Kind, Tier, usw) значення
слова blind є вільним (це слово може вживатися в сполученні з досить великою
кількістю іменників що позначають живих істот) , а в сполученні blinder Alarm
або ein blinder Passagier значення слова blind є фразеологічно пов'язаним (його
сполучуваність у значенні "verborgen" або "vorgetäuscht" обмежена великою
кількістю іменників, так що ці сполучення наближаються до стійких
словосполучень (feste Wortverbindungen). [11, с. 307]. У радянському
мовознавстві до того ж, досить широкого вжитку набули поширення термін
"лексико-семантичний варіант слова" (lexikalisch-semantische Variante des
Wortes), - скорочено ЛСВ (LSV), під яким розуміють ту одиницю у значенні
багатозначного слова , яку традиційно називають (окремим) значенням
багатозначного слова. Так , наприклад, слово " stark" , як одиниця мови , тобто
інваріантна одиниця (Lexem ), виступає в мові у вигляді кількох варіантів,
кожен з яких складається з двох планів - плану вираження та плану змісту. Для
позначення тільки плану змісту в кожному з таких ЛСВ використовують термін
семема (Semem). Oтже, Semem - це тільки зміст у кожному з лексико -
семантичних варіантів слова.
Семема складається з дрібніших одиниць плану змісту, які називають
семами. Отже, сема - це структурна одиниця семеми; семема - це змістовний
18

план лексико-семантичного варіанта слова. Cистемі термінів бракує термінa на


позначення змістовного аспекту лексичного інваріантна, тобто лексеми.
Змістовий аспект лексичного інваріанта ми позначаємо словом
семантема (Semantem). Отже , коли існує потреба позначити інваріантність та
варіант і лексичні одиниці , що включають і план вираження і план змісту, в
лінгвістиці використовують терміни Lexem i LSV. У деяких європейських
студіях для позначення одиниці рівної Semem, іноді використовують термін
Lesart, започаткований в американській дослідження в галузі семантики.
Якщо враховувати відмінності семантичних одиниць за їхнім обсягом та
ієрархічним статусом, то їхнє співвідношення має такий вигляд:
Semantem → Semem→ Sem
Це означає, що семантема складається з семи, а семема - із сем. Отже
сукупність значень багатозначного слова розуміють як деяку ієрархічно
організовану структуру що складається з основного та другорядних, прямого
та переносних значень. Проте існують і інші погляди на смислову структуру
слова. [9, с. 53]. Так В. А. Звегинцев, розвиваючи теорію ЛСВ запропонував
виділяти у будь-якої мовної одиниці єдине значення (інваріант), яке
модифікується в залежності від контексту (варіанти), визнаючи при цьому
рівноправність і незалежність варіантів і абстрактність інваріанту, тобто
неможливість його реалізації у мовленні. [3, с. 27].
Загалом, у сучасній лексикології панують два погляди: 1- у структурі
лексичного значення існує ієрархія і значення слова нерівноправні ; 2- всі
значення слова рівноправні. За допомогою традиційних методів аналізу
неможливо віддати перевагу першому чи другому погляду. Стало очевидним,
що на допомогу потрібно залучити експериментальні методи, які почали
проникати до мовознавства разом із розвитком і поширенням психолінгвістики.
У циклі праць Левицького В.В., присвячених експериментальному вивченню
смислової структури слова, було показано, що коли ізольовано називають
слово, одне з його значень ( ЛСВ) частіше за інші першим спливає у свідомості
більшості носіїв цієї мови. Це значення як правило збігається з тим, яке
19

лексикографи визначають як основне, головне значення слова. Тим самим було


експериментально підтверджено гіпотезу яку висловив ще Г. Пауль: " Ohne
Mitwirkung besonderer Umstände wird man, wenn man ein Wort hört, zunächst an
die gewöhnlichste unter den verschiedenen Bedeutungen desselben oder an die
Grundbedeutung denken. Beides fällt häufig zusammen. Wo aber mehrere ungefähr
gleich häufige Bedeutungen neben einander stehen, da wird nach einem allgemeinen
psychologischen Gesetze die Grundbedeutung eher in das Bewußtsein treten als eine
abgeleitete, ja dies wird selbst oft der Fall sein, wo eine abgeleitete gewöhnlicher ist".
[17, с. 20].
Отже, у ході проведення експериментів і спостережень над фактами
мови було виявлено, що в деяких випадках у семантичній структурі слова буває
важко виокремити головне і другорядне значення. Віддаючи перевагу перші
концепції ( значення слова нерівноправні), не варто повністю відкидати і другу
(значення слова рівноправні). Зрештою можна погодитись з обережністю
інтерпретацією В. Шнайдера: " Die verschiedenen Sememe können aufgrund
unterschiedlicher Häufigkeit bzw psycholinguistischer Auffälligkeit durchhaus in
unterschiedlichem Ausmaß "wichtig" bzw " prominent" sein. [13, с. 77].

2.2 Проблеми полісемії у квантитативній лінгвістиці.


Сучасна лінгвістика перебуває у стані постійного дослідження
структурних та семантичних особливостей мови. Дослідження семантики є
пізнанням мовної картини світу, мовної культури та свідомості, спосіб
мислення та пізнання навколишнього світу. Полісемія, або здатність слова мати
два і більше значення, є головною властивістю лексичних одиниць та однією з
важливих універсалій мов. За допомогою формальних обмежених засобів
розкриваються особливості процесу пізнання світу та потенції мови. Останнім
часом з’явилася низка досліджень, що розглядає питання системної полісемії,
формування ядра та ознак полісемії в рамках однієї лексико – семантичної
групи. (ЛСГ)
20

Усі дослідження полісемії, які проводились до цього часу, можна


поділити на три групи:
І. Загальнотеоретичні, у яких полісемія розглядається як складне та
багатогранне явище як на рівні мови, так і на рівні мовлення. Важливими для
розуміння полісемії в цьому плані є наступні питання: 1) асиметрія мовного
знака і полісемія, 2) причини і джерела появи ; 3) смислова структура
багатозначних слів ; 4) полісемія і омонімія ; 5) лексикографічна обробка
значень слова - полісеманта; 6) полісемія і контекст.
ІІ. Дослідження полісемії за допомогою традиційних лінгвістичних
методів. Тут основною проблемою є визначення об’єктивних критеріїв
розмежування значень слів-полісемантів. Для цього застосовуються
найрізноманітніші методи: лінгвістичні, психолінгвістичні, психофізіологічні та
ін. На думку М.П. Кочергана, їх можна звести до двох видів: змістові
(визначають і порівнюють інтенсіонали значень) і формальні (звертаються до
відмінностей у дистрибуції, валентностях, трансформаціях, субститутах та
перекладах) .
ІІІ. Статистичні дослідження полісемії, в основі яких лежить теза
про те, що системність мови в цілому передбачає системність її лексики.
Лексика є системою особливого роду – вірогіднісною. Закони, що діють у такій
системі, не є строго детермінованими, а виступають лише як тенденції, що
характеризують масові явища. Вони можуть не виконуватись в окремому
випадку, але виконуються в більшості випадків, пробиваючись крізь випадкові
відхилення й винятки. Сáме вірогіднісний характер лексико-семантичної
системи мови передбачає можливість її дослідження за допомогою
статистичних методів, зокрема, різного виду розподілів кількісних
характеристик її об’єктів. [8, с. 16].
У квантитативній лінгвістиці досліджують та обговорюють такі
проблеми полісемії.
✓ середня кількість значень слова в різних мовах;
✓співвідношення кількості значень слова і частоти їх вживання в тексті;
21

✓співвідношення кількості значень слова і його довжини;


✓співвідношення кількості значень слова і його належності до певного
морфологічного класу;
✓співвідношення кількості значень слова і його належності до певного
семантичного підкласу;
✓співвідношення кількості значень слова і його належності до певного
стилістичного підкласу
✓співвідношення кількості значень слова і кількості слів з такою кількістю
значень у словнику.
Середня кількість значень слова в тому чи іншому фрагменті словника,
або у словнику залежить загалом , як показано в низці досліджень, насамперед
від ступеня аналітичності мови і від належності слова до того чи іншого
морфологічного класу (частини мови).
Так, наприклад А. А. Полікарпов встановив, що більшій мірі
аналітичності мови відповідає більший ступінь полісемічності слова. Крім
того спостерігають істотні розбіжності між середньою кількістю значення слів,
що належать до різних частин мови. Для угорської мови за даними тлумачного
словника угорської мови у дієслів середня кількість значень становить χ2 = 2,3,
у прикметників χ2 = 1.9, у іменників χ2 = 1, 6; для англійської мови (за даними
тезауруса Роже) у дієслів χ2 = 3,5 у прикметників χ2= 2,5; у іменників χ2 = 2,
1; для німецької ( непохідні слова у словнику Duden, Universalwörterbuch) -
для дієслів χ2 =2,09 для іменників χ2 = 2,08, для прикметників χ2 = 2, 3. Середня
кількість значень іменника за даними Ш. Шіргольца χ2 = 2.49. [10, с. 53].
Співвідношення між кількістю значень слова і його частотою вперше
досліджував G. K. Zipf. Це співвідношення залежить очевидно від обсягy
словника і типу мови. У словнику розподіл багатозначних слів наближається до
геометричної прогресії: тобто кількість слів з двома значеннями буде вдвічі
менша, ніж кількість слів з одним значенням і так далі. Це дає змогу розрізняти
такі природні зони (ступені) полісeмічності як нульовий ступінь, (1 значення),
2 - 4 значення, 5 - 9 значень, 10-16 значень. [14, с. 20].
22

Залежність між кількістю значень слова і його належністю до певного


семантичного підкласу вивчено вкрай незадовільно. На матеріалі словника
Duden Universalwörterbuch залежність між кількістю значить необхідних дієслів
іменників і прикметників та їхньої належності до одного з семантичних
підкласів вивчено в праці ( Levickij/ Drebet/ Kijko,1999).
Співвідношення між кількістю значень слова і його належністю до
певного підкласу вивчає обмежене коло дослідників . А. А. Полікарпов і В. Я.
Курлов ретельно обстежили лексику російської мови на матеріалі
чотиритомного тлумачного словника. Було досліджено розподіл маркованої і
не маркованої лексики відповідно до словникових позначок). Всього було
виокремлено чотири стилістичні "класи": розмовна, книжно - спеціальна,
застаріла і обласна лексика. Загальна закономірність, яку встановили автори ,
полягає в тому, що ступінь багатозначності обернено пропорційно ступеню
маркування, тобто найбільш маркованими виявились слова з невеликою
кількістю значень. [15, с. 269].
Ряд дослідників вивчали залежність між ступенем полісемічності і
належністю слово до одного зі стилістичних підкласів на матеріалі німецької
мови. За допомогою критерію і коефіцієнтів спряженості виявлено статистично
значущі зв'язки між певною " кількістю полісемічності " і одним зі
стилістичних підкласів на матеріалі німецької мови. За допомогою критерію χ2 і
коефіцієнтів спряженості виявлено статистично значущих зв'язки між певною
кількістю "полісемічності" і одним зі стилістичних підкласів. Так, іменники з
числом значень 1-3 найтісніше пов'язані зі стилістичним підкласом [ діалект ] у
Полікарпова - "обласна лексика"), а прикметники з тою самою кількістю
значень 1-3 найтісніше пов'язані з підкласом [ експресивно- емоційна лексика].
Однозначні дієслово марковані переважно або позначками [ derb, fam.,. salopp
тощо] ( низький стиль) , або позначками [ gehoben, dichter., Fachw] (високий
стиль). [16, с. 307].
Для прикладу, розглянемо дієслівну лексику. Дослідження дієслова як
лексико-граматичного класу слів відбувалося з різних точок зору: проводяться
23

аспектологічні дослідження, розглядаються парадигматичні зв’язки дієслів


всередині ЛСГ. Значну кількість робіт присвячено вивченню багатозначності
саме дієслова. У сучасній мові дієслово посідає перше місце серед частин мови
за багатозначністю. Широко розвинута багатозначність є проявом лексико-
граматичних властивостей дієслова як частини мови. «Дієслівні лексичні
одиниці, - пише А. М. Кузнецов, – як правило, мають складну системну
структуру, в якій ознаки, що відображають предметне лексичне значення, тісно
переплітаються з семантичними характеристиками, які розкривають зв’язки
дієслівної дії або підпадають їм. Ці суб’єктно - об’єктивні зв’язки дієслова
постійно реалізуються в конкретних мовленнєвих висловах, закріплюються в
значенні дієслівної одиниці як одиниці номінацій, переходячи в розряд
системнообумовлених семантичних характеристик. [17, с. 18].
Отже, цілком зрозумілим буде те, що ядром ЛСГ дієслів мовлення буде
сема sich unterhalten, яка передбачає акт комунікації, передавання інформації.
Відповідно до класифікацій обраної лексико-семантичної групи дієслів
мовлення ми допускаємо зміну слова - ідентифікатора на sprechen або sagen
через їхню нейтральність у визначенні та особливості лексико-граматичного
складу німецької мови (також див. нижче). Зразком можуть бути такі приклади:
plaudern - sich gemütlich u. zwanglos unterhalten; schwatzen - sich zwanglos mit
Bekannten über oft belanglose Dinge unterhalten; lügen - bewusst u. absichtsvoll die
Unwahrheit sagen; lallen – mit versagender Zunge, undeutlich artikulierend sprechen;
stammeln - aus Unsicherheit, Verlegenheit\ Erregung o. Ä stockend| stotternd,
unzusammenhängend sprechen. [8, с. 18]. Тлумачення багатозначного слова
викликає особливу складність. Так наприклад, В.О. Андросенко відзначав
«неправомірну дрібність» тлумачних словників при виділенні багатозначного
слова. Причиною цього є змішування значень та вживання слова, тобто елемент
оточення приймається за елемент значення. Відповідно до дослідження
класифікації дієслів В.П. Бахтіної дієслова ЛСГ мовлення за їх основним
значенням було поділено на три основні групи: 1.) дієслова, що позначають
саме процес мовлення; 2.) дієслова, що позначають процес мовлення і
24

характеризують його в залежно від завдань комунікації; 3.) дієслова, що


позначають процес мовлення та пов’язані з іншими сторонами життя та
діяльності людини. Перша група дієслів представили собою нечисленний клас
нейтральних дієслів. До її складу ввійшли дієслова sagen (13 значень), sprechen
(7 значень), reden (5 значень), sich unterhalten (5 значень). Їхня особливість
полягала в тому, що вони демонстрували акт мовлення сам по собі. У лексико-
семантичній структурі дієслів цієї групи були відсутні елементи, що позначали
будь-який аспект мовлення. [18, с. 66].
Лексико-семантична структура цих дієслів проста, і тому їх можна
використовувати як ядро групи. Кожне значення було пов’язане з основним
значенням, тобто дієслова цієї групи є прикладом радіальної регулярної
полісемії. Друга група дієслів мовлення об’єднала групу конкретизуючих
дієслів та стала за кількісною ознакою найчисельнішою. Основне призначення
дієслів цієї групи – конкретизувати комунікативний намір мовця.
Спрямованість є основною характеристикою мовленнєвої діяльності, а
комунікативний намір мовця є критерієм класифікації мовного акту, мовних
дій. Конкретизуючі дієслова залежно від комунікативної мети суб’єкта
мовлення поділяються на такі розряди: дієслова повідомлення (напр. gestehen,
berichten, informieren та ін. ); дієслова спілкування (напр. besprechen, raten,
schwatzen та ін.); дієслова волевиявлення (напр. absagen, verzichten, erfehlen та
ін. ); дієслова емоційного впливу (напр. schimpfen, sticheln та ін. ); дієслова
мовного етикету (напр. grüßen, gratulieren, wünschen та ін. ). Розглядаючи
лексико-семантичну структуру цих дієслів, можна зробити висновок, що до цієї
групи увійшли дієслова переважно з нульовим – першим ступенем полісемії (за
умови припущення вербального характеру семи äußern). Дієслова цієї групи з
широко розвинутою полісемією передусім багаті зразками радіально -
ланцюжкової та радіальної регулярної та нерегулярної полісемії. Третя група
дієслів об’єднує дієслова, які позначають ті сторони мовного акту, що
стосуються саме зовнішньої аспекти мовлення. Вони описують манеру
мовленнєвої поведінки суб’єкта мовлення, спосіб мовлення, напр. brummen,
25

heulen, splatzen та ін. До складу цієї групи увійшли переважно дієслова з


полісемією нульового ступеня, оскільки вони переважно позначають відтінок
значення. [19, с. 40].
Отже, аналіз дієслівних одиниць німецької мови свідчить, що полісемія
є однією з важливих характеристик мови, вона може виявити особливості
формування значення слова та є одним із шляхів розвитку мови. Ці особливості
демонструють специфіку формування лексичної системи мов. [20, с. 201].
Проте, квантитативне дослідження полісемії не тільки не завершене -
воно лише починає розгортатися. Більш-менш надійні результати отримано при
дослідженні співвідношення кількості значень частоти і довжини слова, а також
співвідношення кількості значень і кількості слів з таким значенням у словнику.
Загалом розподіл зазначених параметрів укладається в синергетичнy модель P.
Kелера. Водночас треба врахувати, що на статус багатозначного слова у мові
та мовленні впливає безліч випадкових позамовних і внутрішньомовних
чинників, " обурливий " вплив яких постійно виявляємо у відхиленнях
спостережуваних статистичних розподілів від очікуваних закономірностей.
Співвідношення ступеня полісемічності слова та його належності до того чи
іншого семантичного, стилістичного, або морфологічно підкласу вимагає
подальшого вивчення. Не вивченими залишаються також проблема зміни
полісемічності слова в процесі розвитку мови, а також закономірності, що
описують співвідношення прямих і переносних значень (метафори і метонімії)
в семантичній структурі слова. А втім, не з'ясовано ще й багато інших питань.
Для розмежування різних значень багатозначного слова використовують
структурні та психологічні методи, проте найефективнішим методом такого
розмежування є контекстологічний аналіз. Застосування цього методу полягає
в групуванні всіх мікроконтекстів, у яких трапляється слово в різних текстах, на
основі сематичної подібності слів - партнерів, з якими сполучається
досліджуване слово. Такі угруповання слів партнерів називають
консенсуальним набором слова. Від того скільки таких угруповань виокремлює
дослідник, серед усіх контекстуальних наборів слова, залежить кількість
26

поданих у словнику значень багатозначного слова. Зв'язок між окремими


значеннями багатозначного слова може бути втрачений. У цьому випадку
відбувається розпад , внаслідок чого виникають слова омоніми ( слова, однакові
за звучанням, але різні за значенням). Омоніми можуть виникнути в результаті
протилежного процесу - зближення форми двох і більше слів, які раніше мали
різну звукову форму. Наявність/відсутність зв'язку між значенням
багатозначного слова або між значеннями омонімів може бути вивчити за
допомогою психолінгвістичних методів. Встановлено що відмінності між
полісемією та омонімією мають градуальний характер. [20, с. 58].
Отже, як зауважив також В. В. Левицького, полісемія, будучи
незаперечним фактом мови і - більш того - однією з мовних універсалій,
продовжує ставити перед дослідниками цілий ряд питань. Так, зокрема, не
ясно, якими відносинами пов'язані один з одним значення полісемантичного
слова, панують чи тут ієрархічні відносини, які проявляються в тому, що одне
значення виступає в ролі головного, а інші - в ролі другорядних, або ж все
значення рівноправні. Невирішеним залишається питання і про те, якими
методами можна відмежувати одне значення багатозначного слова від іншого.
Семасіологія покликана відповісти також і на питання, від чого залежить
кількість значень слова - від того, яку групу предметів або понять позначає
слово, від його стилістичного статусу, частоти вживання, типологічних
особливостей мови або чогось ще. Пошук відповідей на ці та інші питання
вимагає розробки методів дослідження, техніки вивчення аналізованого об'єкта,
без яких будь-яка, навіть добре сформульована теорія, стає безпорадною. На
думку В.В. Левицького, відповідь на цілий ряд питань, постійно обговорюваних
в «традиційній» семасіології, повинні дати експериментальні (об'єктивні)
методи аналізу семантики.

2.3 Використання методів кількісного аналізу у лінгвістичних


дослідженнях.
27

За допомогою квантитативних методів можна досліджувати всі рівні


мови та тексту. В більшості випадків лінгвіст повинен вирішувати ( коли в
роботі використовується кількісний аналіз) два основні завдання - встановити
схожість і різницю між отриманими кількісними сукупностями. З цією метою
застосовується невелика кількість методів: критерій хі-квадрат, коефіцієнт
спряженості, критерій Стьюдента та ще деякі непараметричні методи.
Використання того чи іншого статистичного методу і прийома
підпорядковано перш за все виконанню завдання, яке поставлене в дослідженні,
і залежить від умов експеремента. Проте, не в останню чергу вибір
відповідного статистичного методу, може залежати від смаків та звичок
дослідника; від степені складності розрахунків, пов’язаних з використанням
цього методу, і в наш час, звичайно, від наявності спеціальної комп’ютерної
програми, яка дозволяє використовувати цей метод. [12, с. 25].
На початку 70-х років працівники математичного факультету
Чернівецького університету Ясинский та Супрунюк створили для кафедри
німецької мови програму для розрахунку на машині БЕСМ-4 критерія
Стьюдента, коефіцієнта кореляції та хі-квадрат. Досвід використання цих
методів в ЧГУ показав, що критерій хі-квадрат має визначені переваги .
Цей критерій використовується для вирішення більш широкого кругу
завдань, ніж критерій Стьюдента; по - друге вирахування хі-квадрата дозволяє
визначити величину коефіцієнта взаємної спряженості К; по-третє якщо
розрахунки проводяться "вручну", вирахування суми хі- квадрата не настільки
велике, як вирахування критерії Стьюдента. З цієї причини в кінцевому
результаті надається перевага критерію хі-квадрат, для розрахунку якого в наш
час можна застосувати спеціальну комп'ютерну програму.
Використання квантитаивних методів аналізу мови у Чернівецькому
університеті підпорядковано власне лінгвістичним завданням, для яких не
знаходилось рішення протягом багатьох років.
Результати досліджень на кафедрі німецької мови Чернівецького
університету були отримані, як правило, під час виконання дисертаційних та
28

дипломних робіт. В ході досліджень було отримано нові, обгрунтовані


результати, а не методи, за допомогою яких вони б були отримані.
Необхідно також підкреслити, що використання методів аналізу в роботі
не є визначальними факторами при кваліфікації цієї роботи.
Наприклад, дослідження, в якому використані психолінгвістичні методи, не є
частиною психологічної науки; використання квантитативних методів не
відносять до розряду математичних. Методи лінгвогеографії чи сучасні методи
експериментальної фонетики не означають, що використавши їх в своїй роботі,
дисертант повинен відзначити свою роботу в галузі географії чи фізики.
Квантитативні методи названі одними з перших серед методів вивчення
лексичного складу мови в книзі (Бородина /Гак, 1979: 88-89). Проте, було б
неправильним вважати цих авторів представниками метематичної лінгвістики.
[4, с. 314].
Критерій Стьюдента застосовується найчастіше при аналізі лексики,
наприклад, для вирішення питань відмінностей частот уживаного слова, а
також як показник степені їх спорідненості. Для цього вводиться коефіцієнт l
t−t 2
який визначається по формулi: l = t
де, t - отримала в експерименті

величина, t2 - таблична величина. Сенс цієї формули полягає в тому, що


дослідник встановлює наскільки відрізняється емпірична величина t від «
теоретично» можливої, і цю різницю робить відносною величиною, поділивши
її на t. За допомогою цієї формули можна виміряти відстань між словами
( попарно), якщо, звичайно попередньо знайдено всі величини, необхідні для
отримання t. Ця формула може бути використана також при дослідженні
функціональних стилів, а критерій Стьюдента і правило трьох сигм - при
дослідженні фонетичного рівня мови, середньої довжини слова і речення,
морфологічних і синтаксичних властивостей тексту.
Кореляційний аналіз служить в лінгвістиці для встановлення схожості
і зв'язків між одиницями мови та мовлення, якщо відома частота цих
зустрічних одиниць. Слід окремо зупинитись на процедурі застосування
кореляційного аналізу при вивченні парадигматичних відношень в лексиці.
29

Використання кореляційного аналізу для встановлення парадигматичних


зв'язків між словами заснована на допущенні , що чим більша степінь
співпадіння лексичної сумісності 2 слів, тим в більшій степені проявляється
семантична схожість між цими словами. Досвід дослідження в Чернівецькому
університеті показує, що при використанні кореляційного аналізу для
встановлення парадигматичних відношень в лексиці необхідно розрізняти два
основні процедурні варіанти:
а) формальна процедура, коли аналіз реалізується на основі частоти
співпадіння одиниць без будь-якої додаткової семантичної обробки та їх
групування.
б) напівформальна процедура, куди аналіз проводиться на основі спільної
зустрічності досліджуваних одиниць з семантичними підкласами слів,
групування і розмежування яких здійснюється дослідником неформальним
способом.
Також, за допомогою кореляційного способу можна дослідити зв'язки
між одиницями мови на фонетичному морфологічному та синтаксичному рівні.
В зарубіжних роботах критерій хі-квадрат використовується найчастіше
для знаходження моделі розподілення частот. Також критерій хі-квадрат і
коефіцієнти спряженості застосовуються для встановлення гомогенності /
гетерогенності розподілення величин в будь-яких сукупностя, а також для
знаходження зв'язку між якісними ознаками. Також використовується "
змішаний " критерій.
Різні автори отримували різні результати. Вважається, що найбільш
підходящими моделями розподілу лексичних одиниць в тексті є " негативні
гіпергеометричні" та "негативні біноміальні" розподіли.
[1, с. 201]. Проте , проаналізувавши роботи виконані в Чернівецькому
університеті, стає зрозуміло, що зовсім інші завдання вирішуються за
допомогою критерій хі-квадрат і коефіцієнтів спряженності.
Лексичний рівень. На цьому рівні вивчались три основні проблеми: полісемії,
синонімії та лексичної сумісності. Розглянемо дослідження полісемії.
30

При дослідженні полісемії з позицій квантитативної лінгвістики в


мовознавстві розглядаються, як правило, такі питання: середнє значення слова
в різних мовах; співвідношення числа значень слова і його довжини;
співвідношення числа значень слова і частоти його вживання; розподіл
багатозначних слів в словнику. Проте, як уже було згадано та проаналізовано
вище, мене за все вивчена проблема, яка стосується залежності числа значень
слова і його належності до відповідного семантичного підкласу. Результати
статистичного аналізу полісемічних іменників, прикметників та дієслів,
здійснені в Чернівецькому університеті В. В. Дебетом та С. В. Кийко за
допомогою критерія хі-квадрат і коефіцієнта спряженості, показали, що
степінь полісемічності слів, які належать до різних семантичних підкласів,
неоднакова. Тобто, число значень слова залежить від того, що це слово
означає. [7, с. 23].
Найменшу міру полісемічності у сфері іменників мають підкласи [назви
страв і напоїв], [риси характеру людини], [ назви тварин], [явища природи],
[організації та установи] тощо, тобто підкласи з "конкретним" значенням.
Проте, істотних відмінностей між середньою кількістю значень іменників з
конкретним і абстрактним значенням не виявлено. Мабуть, сформульована А.
А. Полікарповим та іншими дослідниками закономірність (" що вищий ступінь
абстрактності, то більше значень має слово) дійсна лише, коли зіставляють
різні граматичні класи слів. Варто також мати на увазі, що самій категорії
"абстрактність значення" важко дати формальне визначення, тож результати
квантитативного аналізу цієї категорії від початку будуть неоднозначними.
[12, с. 22].
Синтаксичний рівень. Цей рівень досліджується найчастіше з метою
отримання даних про типи розподiлу довжини речення в різних моваx.
Зрозуміло що довжина речення може залежати від різних факторів( жанр,
функціональний стиль, тип речення і т. д). В Чернівецькому університеті
довжина і структура речення вивчалась на матеріалі німецької і англійської
мови. Дослідників цікавили наступні проблеми: залежність вживання різних
31

типів речення від функціонального і авторського стилю; залежність довжини і


глибини речення від структури і від авторської функціонального стилю;
вивчення взаємозв'язків вказаних структурних і стилістичних факторів
здійснено в роботах О. Павличко, Ю. Бойко і Т. Джурюк. На матеріалі
німецької мови встановлено, що Ремарк віддає перевагу підрядним присудкам,
Кант - підрядним умовним, порівняльним та допустовим реченням, Белль -
підрядним часу і місця. Авторський і функціональний стиль характеризується
також неоднаковим вживанням складних і простих речень, разом з тим довгих
середніх і коротких речень. За даними О. Павличко, Ремарк віддає перевагу
простим реченням, Т. Маннт - складнопідрядним , Г. Кант і Г. Белль-
складносурядним. [20, с. 225].
Ю. П. Бойко дослідила також залежність між довжиною реченнями і
видом тексту ( авторська мова, діалог, і власне пряма мова). Найдовшими
виявились речення в авторській мові, найкоротшими - в діалозі. Якщо такий
результат можна було передбачити, то розподіл довжини речення в залежності
від хронологічного фактора, тематики, жанру, гендерного фактора та інших
факторів поки що залишається незрозумілим. [10, с. 22].
Власне, є ще багато інших методів квантитативної лінгвістики, які
дозволяють доповнити ряд потрібних досліджень. Так, отримавши нові дані,
можна аналізувати та знаходити вирішення проблем, які цікавлять сучасних
лінгвістів, мовознавців, філологів тощо.

ВИСНОВКИ
32

Якщо природничі науки порівняно давно «заговорили» мовою


математики, то гуманітарні звернулися до неї значно пізніше: тільки у 40-50-их
роках ХХ-го століття, при цьому першою з них була саме лінгвістика. І. А.
Бодуен де Куртене, підводячи підсумки розвитку мовознавства ХІХ століття,
наголошував на тому, що потрібно все частіше застосовувати у мовознавстві
кількісне математичне мислення і таким чином більше наблизити його до
точних наук. Дане твердження науковця виявилося беззаперечним, тому у наші
дні виявлено основне: «для мови безсумнівним є квантитативний фактор».
Важливість застосування статистичних методів у лінгвістиці
беззаперечна, адже багато мовних закономірностей не можна розглядати лише,
як абсолютні закони, їх слід трактувати як правила, які випливають із
статистичної ймовірності. Слід сказати, що неможливо у мові обійтись без
таких категорій, як мало та багато; несуттєво, суттєво; правило, виняток.
Фактично вони є джерелом квантитативної лінгвістики, яка намагається надати
поняттям, пов’язаним із кількісними показниками, точного змісту. Значить,
мову необхідно розглядати за допомогою чітких статистичних методів для
аналізу мовного матеріалу і його систематизації. Таким чином, імовірно-
статистична методика дозволяє отримувати результати та на їх підставі робити
змістовні лінгвістичні висновки, які дозволяють глибше проникати у природу
досліджуваного явища і прослідковувати певні тенденції у мовних фактах щодо
характеру функціонування мовних одиниць у мовленні.
Тенденція щодо застосування статистичних прийомів при дослідженні
лінгвістичних явищ обґрунтовується наступними чинниками: -
об’єктивною властивістю мови і кількісних характеристик;
- внутрішньою залежністю, яка існує між якісними і кількісними
характеристиками мовної структури;
- підвладністю частоти різних елементів мови у мовленнєвому потоці тим чи
іншим статистичним законам.
Використання квантитативних методів при наукових дослідженнях
дозволяє глибоко проникати у їх сутність. Оскільки деякі елементи мови і
33

мовлення зумовлюються певною частотою і величиною, то мовленнєвий


процес, відповідно, досліджується за допомогою мові методів математичної
статистики. Учені-лінгвісти не могли не помітити статистичних характеристик
елементів мовлення, тому зародження лінгвістичної статистики із
використанням різних лінгвістичних методів і прийомів було неминучим.
Існування тісного взаємозв’язку між кількісними та якісними характеристиками
мови передбачає застосування математичного апарату статистичної
лінгвістики, яка займає вагоме місце у вирішені проблем мовознавства.
Що стосується багатозначності слова, у сучасній німецькій мові
реалізуються різні моделі полісемії, що призводить до розширення
синтагматичних зв’язків слів і зміни їх значень. Німецька лексика, в тому числі
й полісемія , має біль «парадигматичний», регулюючий характер, ніж
українська. Однієї з найважливіших причин цього є надзвичайна
продуктивність німецького словотворення.
Отже, у підсумку можна зробити висновок, що за допомогою
статистичних методів можна дослідити всі рівні мови. Застосування того чи
іншого статистичного метода підкоряється перш за все виконанню завдань, які
поставлені в дослідженні і залежать від умов експерименту.

СПИСОК ВИКОРИСТАНОЇ ЛІТЕРАТУРИ


34

1. Левицкий В.В. Квантитативные методы в лингвистике / В.В. Левицкий. –


Черновцы: Рута, 2004. – C. 189 - 200 с.
2. Перебийніс В. І. Статистичні методи для лінгвістів : навч. посіб. / В. І.
Перебийніс. – Вінниця : Нова книга, 2001. C. 268.
3. Гиро П. Проблемы и методы статистической лингвистики // Общее
языкознание / П. Гиро. – Минск, 1976. – С. 44-63.
4. . Попова З.Д. Когнитивная лингвистика / З.Д. Попова, И.А. Стернин. –
М.:АСТ: Восток–Запад, 2010 – C. 314
5 . Ченки А. Семантика в когнитивной лингвистике // А. Ченки //
Фундаментальные направления современной американской лингвистики: Сб.
обзоров / под ред. A.A.- 5 C. 225
6. [Електронний ресурс] Режим доступу: https://statanaliz.info/statistica/proverka-
gipotez/kriterij-soglasiya-pirsona-khi-kvadrat/
7. 1965. Кочерган М. П. Лексична сполучуваність і полісемія / М. П. Кочерган //
Мовознавство. – 1977. - C. 21
8. Köhler R., Altmann G. Aims and Methods of Quantitative Linguistik//Altmann
G.,Levickij V., Perebyjnis V.2005. Проблеми квантитативної лінгвостатистики.-
Чернівці: Рута,2005, р.12-41
9. Арапов М. В. Квантитативної лингвистика. - М.: Наука,1988.
10. Левицкий В. В. Семасиология.- Винница: Нова книга, 2006.
11. Schippan T. Lexikologie der deutschen Gegenwartssprache [Text] / Thea
Schippan. – 2., durchges. Aufl. – Leipzig : Bibliographisches Institut, 1987. – 307 S
12. Левицкий В. В. Лексична полісемія та квантитативний методи її
дослідження// Мовознавство. 2003. С.17-25
13. Best K. - H. Quantitative Linguistik. Eine Annährung. Göttingen: Peust/
Gutschmidt Verlag, 2003. p.77
14. Кантемір С. Деякі проблеми зіставлення багатозначних слів [Текст] / Сергій
Олександрович Кантемір // Науковий вісник Чернівецького університету : зб.
наук. праць. – Вип. 441–443 : Германська філологія. – Чернівці : ЧНУ, 2009. –
С. 16–20.
35

15. Fraaß I. Polysemie und Homonymie in einsprachigen Wörterbüchern der


portugiesischen Gegenwartssprache [Text] / Ingrid Fraaß. – Berlin : Univ. Diss. A,
1985. – 269 S.
16. Schippan T. Lexikologie der deutschen Gegenwartssprache [Text] / Thea
Schippan. – 2., durchges. Aufl. – Leipzig : Bibliographisches Institut, 1987. – 307 S
17. [Кузнецов 1979, с.14]. Кузнецов А.М. О семантике глаголов с широкой
понятийной основой (на материале английского языка) / А.М. Кузнецов //
Исследования семантической структуры слов и их лексической сочетаемости:
Сб.науч. тр.-М., 1979.- С. 10-25
18. Андросенко В.О. Соотношение содержательной и формальных признаков
при многозначности слова / В.О. Андросенко // Слово в словаре и тексте / Под
ред. Ю. И. Сусловой. – М.:Изд-во Моск. ун-та, 1991.- С. 66-77.
19. Ю. Д. Апресян - М.:1974. Бахтина В.П. Лексико-грамматическая
сочетаемость глаголов речи в литературном языке ІІ половины XIX века.
20. Кійко С. В. Полісемія дієслів сучасної німецької мови.- АКД.- Київ, 1999.
21. Гіков Л. В. Особливості вживання лексико-граматичних і лексичних
одиниць в авторському стилі( на матеріалі німецької художньої прози)- А.К.Д-
Львів, 2003- C. 225

You might also like