You are on page 1of 29

Тема: Методи аналізу взаємозв’язків

Викладач:
Іщук Ярослава Володимирівна
кандидат економічних наук,
доцент кафедри статистики
Усі явища навколишнього світу,
соціально-економічні зокре­ма,
взаємозв’язані й взаємозумовлені. У
складному переплетенні всеохоплюючого
взаємозв’язку будь-яке явище є наслідком
дії певної множини причин і водночас —
причиною інших явищ.
ВИДИ ВЗАЄМОЗВ’ЯЗКІВ І ЇХ ОСОБЛИВОСТІ

Результативна ознака у за наявності зв’язку


Факторна ознака
хі
функціонального стохастичного кореляційного

х1 у1 у1 у2 y1
х2 у2 у1 у2 у3 y2
х3 у3 у2 у3 у4 y3
... ... ... ...

хm уm уm – 1 уm ym
Регресійний аналіз
 Важливою характеристикою кореляційного
зв’язку є лінія регресії — емпірична в моделі
аналітичного групування і теоретична в моделі
регресійного аналізу.
 Емпірична лінія регресії представлена
груповими середніми результативної ознаки ,
кожна з яких належить до відповідного інтервалу
значень групувального фактора хj.
 Теоретична лінія регресії описується певною
функцією яку називають рівнянням регресії, а Y
— теоретичним рівнем результативної
ознаки.
Регресійний аналіз
 Якщо зі зміною фактора х результат у змінюється
більш-менш рівномірно, такий зв’язок описується
лінійною функцією:
Y  a  bx

 Коли йдеться про нерівномірне співвідношення


варіацій взаємозв’язаних ознак (наприклад, коли
прирости значень у зі зміною х прискорені чи
сповільнені або напрям зв’язку змінюється),
застосовують нелінійні регресії, зокрема:
Y  ax b
 степеневу ;
b
 гіперболічну Y a
x ;
Y  a  bx  cx 2
 параболічну тощо.
Нелінійна регресія

з прискоренням з уповільненням зі зміною напряму


зв’язку
Види та взаємозв’язки дисперсій
Загальна дисперсія

 y  y 
2

 2
y 
n

Вимірює загальний розмір варіації


результативної ознаки, сформовану під
впливом усіх можливих факторів

Факторна дисперсія
 y  Y 
2

 2
Y 
n

Вимірює розмір варіації


результативної ознаки, зумовленої
фактором
Залишкова дисперсія

 y  Y 
2

  y  Y 
2
 2
 e2
e  n
Вимірює розмір nваріації результативної
ознаки, зумовленої дією усіх інших
факторів

 2  2  2
Взаємозв’язок дисперсій називають правилом
декомпозиції варіації
Розрахунок кореляційного відношення
Рангова кореляція
 Взаємозв’язок між ознаками, які можна
зранжувати, передусім на основі бальних
оцінок, вимірюється методами рангової
кореляції. Рангами називають числа
натурального ряду, які згідно зі значеннями
ознаки надаються елементам сукупності і
певним чином упорядковують її. Ранжування
проводиться за кожною ознакою окремо:
перший ранг надається найменшому значенню
ознаки, останній — найбільшому або навпаки.
Кількість рангів дорівнює обсягу сукупності.
Рангова кореляція
Чарльз Едвард Спірмен запропонував
формулу для коефіцієнта рангової
кореляції: n 2
6 d j
  1 1
n ( n 2  1)

Цей коефіцієнт змінюється в межах від


– 1 до + 1, водночас оцінює щільність
зв’язку та вказує на його напрям.
d 2j

ДО РОЗРАХУНКУ КОЕФІЦІЄНТА РАНГОВОЇ


КОРЕЛЯЦІЇ
Експертні оцінки, балів Ранги


з/п Ефективність
Ступінь dj = Rxj – Ryj d 2j
політичного Rxj Ryj
економіки
ризику
(mах = 10)
(mах = 100)

1 6,6 64,5 1 7 –6 36
2 5,8 57,8 2 6 –4 16
3 2,9 23,6 6 1 5 25
4 3,4 36,2 5 4 1 1
5 4,5 45,3 3 5 –2 4
6 2,7 28,4 7 2 5 25
7 4,2 32,7 4 3 1 1
Разом      108
ДО РОЗРАХУНКУ КОЕФІЦІЄНТА
РАНГОВОЇ КОРЕЛЯЦІЇ
 Коефіцієнт рангової кореляції
6  108 648
  1  1  0,928
7( 49  1) 336
 Значення коефіцієнта рангової кореляції свідчить
про наявність зворотного і досить високого рівня
зв’язку між ефективністю економіки і ступенем
політичного ризику.
 Критичне значення коефіцієнта рангової кореляції
0,95 (7)
для рівня істотності  0=,71.
0,05 іn=7

 Отже,з імовірністю 0,95 істотність зв’язку


доведено.
Оцінка узгодженості
варіації атрибутивних ознак
Взаємозв’язки між атрибутивними
ознаками аналізуються на підставі
таблиць взаємної спряженості
(співзалежності).
РОЗПОДІЛ РЕСПОНДЕНТІВ ЗА ВІКОМ І
СХИЛЬНІСТЮ ДО РИЗИКУ

Тип інвестора у
Вік
Разом fi0
х Ризикований Обережний Неризикований

молодь 24 12 4 40

середній 20 50 30 100

старший 6 18 36 60

Разом f0j 50 80 70 200

Характер розподілу частот, концентрація їх уздовж головної


діагоналі свідчать про наявність стохастичного зв’язку між віком і
схильністю до ризику.
Оцінка щільності стохастичного зв’язку
ґрунтується на відхиленнях частот (часток)
умовного та безумовного розподілів, тобто на
відхиленнях фактичних частот fij від теоретичних
Fij, пропорційних до підсумкових:
fi0 f 0 j
Fij 
n

де fi0 — підсумкові частоти за ознакою x;


f0j — підсумкові частоти за ознакою ;
 mx my 
 
n — обсяг сукупності .  n   f i0   f 0j
 i j 
 
2 Пірсона
Абсолютну величину відхилень
фактичних частот fij від пропорційних
Fij характеризує квадратична
спряженість 2 Пірсона:
2
  

fij  Fij  2 

 n  
f 2
ij


 1
i j Fij  i j fi0 f 0 j 
 

За відсутності стохастичного зв’язку


2 = 0.
На основі розподілу ймовірностей 2
перевіряється істотність зв’язку.
Критичні значення  02,95 (4)  9,49
для  = 0,05 і числа ступенів свободи
k = (mx – 1) (my – 1) = (3 – 1) (3 – 1) = 4
фактичне значення значно перевищує
критичне, а отже, з імовірністю 0,95
істотність зв’язку між віком і схильністю
до ризику доведено:
 24 2 12 2 4 2 20 2 50 2
2
  200      
 40  50 40  80 40  70 100  50 100  80

30 2 62 18 2 36 2 
     1  49,5
100  70 60  50 60  80 60  70 

Коефіцієнт взаємної спряженості
(співзалежності)
Відносною мірою щільності
стохастичного зв’язку слугує
коефіцієнт взаємної спряженості
(співзалежності). За умови, що mx = my
використовують формулу Чупрова:
2
C
n (mx  1)(m y  1)

де mx — число груп за ознакою x;


my — число груп за ознакою y.
Коефіцієнт взаємної спряженості
(співзалежності)
.У разі, коли mx  mx, віддають
перевагу коефіцієнту спряженості
Крамера:
2
C
n (mmin  1)

де mmin — мінімальне число груп (mx


або my).
Оцінка узгодженості
варіації атрибутивних ознак
Результати Exit poll на виборах президента
в 2016 р. в США, осіб

Стать Hillary Donald Інші Разом


виборців Clinton Trump
чол 30 114 6 150

жін 202 44 4 250

Разом 232 158 10 400

142,88
C  0,598  02,95 (2)  5,99
400(2  1)
Коефіцієнт контингенції або
асоціації
Якщо обидві взаємозв’язані ознаки
альтернативні, тобто кількість груп
mx = my = 2, то за відсутності зв’язку
добутки діагональних частот однакові:
f11 f22 = f12 f21.
Саме на відхиленнях добутків частот
ґрунтуються характеристики зв’язку:
2 f11 f 22  f12 f 21
C 
n f01 f02 f10 f 20
Коефіцієнт контингенції або
асоціації
У літературі зі статистики коефіцієнт
для 4-клітинкової таблиці називається
коефіцієнтом контингенції або
асоціації.
Очевидно, що за змістом він
ідентичний коефіцієнту взаємної
спряженості, а з 2 пов’язаний
функціонально:
2 = nC2.
РОЗПОДІЛ ПАЦІЄНТІВ КЛІНІКИ ЗА РЕЗУЛЬТАТАМИ ЛЕГЕНЕВИХ ПРОБ

Результати легеневих проб


Наявність звички Разом
палити
Аномальні Нормальні

Палить 20 5 25

Не палить 10 15 25

Разом 30 20 50

20  15  10  5 250
C   0,408
30  20  25  25 612,3

2 2
  nC  50  0,408  8,32
2
 02,95 (1)  3,89

Значення 2перевищує критичне . Істотність зв’язку доведено з імовірністю 0,95.


Корисною мірою при аналізі 4-
клітинкових таблиць взаємної
спряженості є відношення перехресних
добутків або відношення шансів
f11 f 22
W
f12 f 21

Відношення шансів характеризує міру


відносного ризику.
Завдання для
відпрацювання
пропусків (за
бажанням)))

 1. Визначте
чисельність
респондентів (осіб).
 2. Обґрунтуйте
наявність
взаємозв’язків між
статтю, віком
респондентів та
результатами
виборів.
 3. Перевірте
істотність зв’язків з
ймовірністю 0,95.
 4. Оцініть щільність
зв’язків.
Статистичні критерії для перевірки статистичних гіпотез

Область Число підгруп або Види шкал Критерій


застосування вибіркових
сукупностей
Одна Номінальна χ2

Дві та більше Номінальна χ2


Гипотези про
частоту
розподілу Одна Порядкова Критерій
Колмогорова—
Смірнова

Одна (велика Метрична Z — критерій


Гипотези про выборка, n>30)
середні
величини Одна (мала Метрична t — критерий
виборка)

You might also like