You are on page 1of 46

Мацуга О.М. Кореляційний аналіз.

Випадок двох показників x та y

 Кореляція (лат. correlatio) – взаємозв'язок, співвідношення

 Задача кореляційного аналізу – виявлення та оцінка


взаємозв'язків між показниками у наборі даних

2
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

x y Обидва показники кількісні

x1 y1

x2 y2

… …

xN yN

3
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Функціональний, тобто y = f(x)


 між вагою у кілограмах та вагою у фунтах кг = 2,2·фунт
 між радіусом та площею круга Площа = 3,14·Радіус2

 Стохастичний, тобто y = f(x) + 


 між вагою та зростом Вага = Зріст – 110 + 

Примітка. Математична статистика вивчає стохастичний зв'язок, а функціональний


розглядає як граничний випадок стохастичного

4
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Візуально по кореляційному полю

 За допомогою коефіцієнтів кореляції


 Пірсона
 кореляційного відношення
 рангового коефіцієнта Спірмена
 рангового коефіцієнта Кендалла

5
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

Немає зв'язку Лінійний зв'язок


стохастичний

функціональний

6
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

Нелінійний зв'язок Неоднорідні дані


стохастичний

немонотонний монотонний

функціональний Дані з викидами

7
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

Коефіцієнт Який тип зв'язку Особливості


кореляції виявляє
Пірсона лінійний нормальний розподіл даних,
чутливість до викидів

Спірмена монотонний застосування як до кількісних,


так і якісних порядкових показників
Кендалла монотонний застосування як до кількісних,
так і якісних порядкових показників
кореляційне нелінійний переформування масиву даних
відношення

8
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Особливості
 є мірою лінійного зв'язку
є лінійний зв’язок є лінійний зв’язок, але немає лінійного зв'язку
нелінійний сильніший

 рекомендують застосовувати до нормально розподілених даних


 чутливий до викидів

9
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Властивості
 r   1; 1
 якщо r  0 , то поміж показниками немає лінійного зв'язку
 якщо r  1, то між показниками x та y лінійний функціональний зв'язок
(значення відмінні від 0, 1 свідчать про стохастичний зв'язок)

функціональний стохастичний немає стохастичний функціональний


зв'язок зв’язок лінійного зв'язку зв’язок зв'язок

–1 –0,5 0 +0,5 +1
кореляція

10
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 знак коефіцієнта свідчить про наявність додатного чи від'ємного зв'язку


 модуль коефіцієнта свідчить про силу лінійного зв'язку

сильний слабкий слабкий сильний

–1 0 +1
від'ємний немає додатний
зв'язок лінійного зв'язку зв'язок

r = –1 r = –0,85 r = –0,6 r=0 r = 0,6 r = 0,85 r = +1

11
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Визначення
E   x  Ex  y  Ey   cov  x, y 
r 
D x  D y   x y

 Оцінка точкова за даними вибірки xi , yi ; i  1, N  


xy  x  y
rˆ  ,
ˆ ˆ
Sx  S y
де
1 N 1 N 1 N
x   xi y   yi xy    xi  yi 
N i 1 N i 1 N i 1

1 N 1 N
 i    i  
2 2
Sˆx  x  x Sˆ y  y  y
N i 1 N i 1

12
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Оцінка інтервальна
Інтервал  rн ; rв  з імовірністю (1– ) містить справжнє значення коефіцієнта
rˆ 1  rˆ 2  1  rˆ 2
rн,в  rˆ  ∓ u1 2
2N N 1

 Перевірка на рівність нулю (незначущість)


0 : r  0
Гіпотеза
1 : r  0
rˆ N  2
Статистика t  
p  2 1  F  t , N  2 
1  rˆ 2
функція розподілу Стьюдента

t  t1 2, N 2 (p  )  H0 не відхиляють (кореляція незначуща, лінійного зв'язку немає)


t  t1 2, N 2 (p < )  приймають H1 (кореляція значуща, є лінійний зв'язок)

13
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

кореляція
 Порівняння двох коефіцієнтів однакова?
 0 : r1  r2
Гіпотеза
1 : r1  r2
z1  z2 1 1  rˆj
Статистика u  z j  ln , j  1, 2
1 1 2 1  rˆj

N1  3 N 2  3

u  u1 2  H0 не відхиляють, інакше відхиляють на користь H1

 Порівняння k коефіцієнтів  k 
2

   N j  3 z j 
 0 : r1  r2  …  rk k
 j 1 
Статистика     N j  3  z j 
2 2
Гіпотеза k
1 :  rj  rs , j  s j 1
  N j  3
j 1

 2  1 ,k 1  H0 не відхиляють, інакше відхиляють на користь H1

14
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Особливості
 виявляє нелінійний зв’язок, хоча і не будь-який
 розраховують за масивом вигляду

x , y
l l, j ; j  1, ml , l  1, k 
 Властивості
  y x   0;1
2

 якщо 2y x  0 , то між показниками немає стохастичного зв'язку


 якщо 2y x  1 , то між показниками існує функціональний зв'язок
 2y x  r 2
 якщо 2y x  r 2 , то між показниками існує лінійний зв'язок
 2y x  2x y

15
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Визначення відношення

y x 

D E  y x  дисперсії середніх значень y в групах
до загальної дисперсії показника y
D y

 Оцінка точкова за масивом xl , yl , j ; j  1, ml , l  1, k  


k

 ml  yl  y 
2
2
S
ˆ y x   l 1
y
2 k ml

  y  y
S y
2
l, j
l 1 j 1
де
mi
1 1 k
yl 
ml
y j 1
l, j y   ml yl
N l 1

16
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Перевірка на рівність нулю (незначущість)


 0 : 2y x  0 ˆ 2y x  k  1
Гіпотеза Статистика f  p  1  F  f , k  1, N  k 
1 :  y x  0
2
1  ˆ 2y x   N  k  функція розподілу Фішера

f  f1,k 1, N k (p  )  H0 не відхиляють (кореляція незначуща, стохастичного зв'язку немає)


f  f1 ,k 1, N k (p < )  приймають H1 (кореляція значуща, є стохастичний зв'язок)

 Перевірка на рівність коефіцієнту Пірсона (лінійний зв’язок)

Гіпотеза
 0 : 2y x  r 2
Статистика f 
 ˆ  rˆ   k  2 
2
yx
2

p  1  F  f , k  2, N  k 
1 :  2
yx
r 2
1  ˆ   N  k 
2
yx функція розподілу Фішера

f  f1 ,k 2, N k (p  )  H0 не відхиляють (зв'язок лінійний)


f  f1 ,k 2, N k (p < )  приймають H1 (зв'язок нелінійний)

17
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

x, y; i  1, N 
i i  x , y
l l, j ; j  1, ml , l  1, k 
 Розбивають показник x на k класів:
1) кількість класів k  1  1, 44  ln N
x  xmin

2) ширина кожного класу h  max
k
3) класи 1   g1 ; g 2 
...
 l   g l ; g l 1     l  1  h, l  1, k  1
g l  xmin
...
 k   g k ; g k 1 
4) середини класів – це xl у новому масиві
xl  0,5   g l  g l 1 

 Для кожної точки  xi, yi  , i  1, N визначають її належність до


одного з класів: якщо xi   l , то у новому масиві yl , j  yi

18
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

rˆ  0,059 * rˆ  0,68 rˆ  0,894 rˆ  1


ˆ y x  0,131* ˆ y x  0,682 ˆ y x  0,885 ˆ y x  0,993

rˆ  0,559 rˆ  0,061* rˆ  0,061* rˆ  0,044 *


ˆ y x  0,914 ˆ y x  0,899 ˆ y x  0,176 * ˆ y x  0,813

* – помічені незначущі кореляції 19


Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 2 коефіцієнти
 Спірмена с
 Кендалла к

20
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Особливості
 виявляють монотонний зв'язок
монотонний зв’язок немонотонний зв'язок

 використовують не числові значення показників, а їх ранги


 x , y ; i  1, N   rx , ry ;i  1, N 
i i i i

 можна застосовувати як до кількісних, так і якісних порядкових показників (для


порядкових показників немає потреби у переході до рангів)

21
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Ранг – порядковий номер елемента у відсортованій послідовності


x: 12 7 1 13 5 Відсортовані x : 1 5 7 12 13
Ранги x : 4 3 1 5 2 Порядкові номери (= ранги) x : 1 2 3 4 5 нумерація з 1

 Якщо в послідовності є в'язки з однакових елементів, то ранг кожного елементу


в'язки дорівнює середньому арифметичному їх порядкових номерів
в'язка в'язка
x: 12 7 5 12 1 13 12 5 Відсортовані x : 1 5 5 7 12 12 12 13
Ранги x : 6 4 2,5 6 1 8 6 2,5 Порядкові номери x : 1 2 3 4 5 6 7 8
Ранги x : 1 2,5 2,5 4 6 6 6 8

 Для двовимірного масиву слід враховувати, що елементи йдуть парами


x y Відсорт. x Ранги x Відсорт. y Ранги y rx ry rx (відсорт.) ry
10 13 3 1 5 1,5 4 5 1 1,5
7 5 7 2,5 5 1,5 2,5 1,5 2,5 1,5
11 9 7 2,5 8 3 5 4 2,5 3
3 5 10 4 9 4 1 1,5 4 5
7 8 11 5 13 5 2,5 3 5 4
12 15 12 6 15 6 6 6 6 6
22
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Властивості
 лежать в межах  1; 1
 якщо дорівнюють 0, то монотонного зв'язку між показниками немає
 рівність +1 має місце при повній узгодженості між елементами послідовностей
x та y (повному збігу рангів)
 рівність –1 має місце при повній неузгодженості між елементами послідовностей
x та y (протилежному впорядкуванні рангів)
 знак вказує напрямок монотонного зв'язку (додатний чи від'ємний)

23
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Визначення
Дорівнює коефіцієнту кореляції Пірсона між рангами показників
c  r  rx, ry 

 Оцінка точкова за масивом rxi , ryi ; i  1, N  


Коли немає в'язок
N
6
 i i  
2
ˆ с  1  rx  ry
N  N 2  1 i 1
12
 N 2
      
N 2 N
Виведення формули: c  r  rx, ry    rxi  rx ryi  ry   rxi  rx  ryi  ry 
ˆ
i 1  i 1 i 1 
1 N
N 1 N
N  N  1 2 N  1
Коли немає в'язок rx  ry   i  . Враховуючи, що  i 2  ,
N i1 2 i 1 6
N N N
 N 1
2
N  N 2  1
   
2 2
для знаменника маємо:  rxi  rx   ryi  ry    i   
i 1 i 1 i 1  2  12
N N

i 1

Для чисельника можна показати, що  rxi  rx ryi  ry  1   6
N  N  1 i1
2   rxi  ryi 
2

Це в результаті приводить до формули ̂c .


24
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 
Оцінка точкова за масивом rxi , ryi ; i  1, N 
Коли є в'язки
N
N  N  1    rxi  ryi   A  B
1 2 2

6 i 1
ˆ с 
1  1 

6
N  N 2
 1  2 A 
 6
N  N 2
 1  2 B 

де
1 z 1 p
A    A3j  Aj  B    Bk3  Bk 
12 j 1 12 k 1
z – кількість в’язок серед елементів x
j – порядковий номер в’язки
Aj – кількість однакових значень x у j-й в’язці
p, k, Bk – те саме, але для показника y

25
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Перевірка на рівність нулю (незначущість)


 0 : c  0
Гіпотеза
1 : c  0

ˆ c N  2
Статистика t 
1  ˆ 2

p  2 1  F  t , N  2 
c функція розподілу Стьюдента

t  t1 2, N 2 (p  )  H0 не відхиляють (кореляція незначуща, монотонного зв'язку немає)


t  t1 2, N 2 (p < )  приймають H1 (кореляція значуща, є монотонний зв'язок)

26
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Визначення
 
кількість узгоджених пар   кількість НЕузгоджених пар   S
к
максимальна кількість пар max S x y
1) 10 2
Пари (xi, yi) та (xj, yj) узгоджені, якщо xi  xj  yi  yj або xi  xj  yi  yj 2) 12 6
3) 13 7
Приклад: пара 1-2 узгоджена, пара 3-4 НЕузгоджена
4) 17 5

 
Оцінка точкова за масивом rxi , ryi ; i  1, N , в якому rx 
впорядковані за зростанням
Коли немає в'язок
S
ˆ к 
1
N  N  1
2
N 1 N 1, якщо ryi  ry j ,
S    i, j i, j  
i 1 j i 1 1, якщо ryi  ry j

27
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 
Оцінка точкова за масивом rxi , ryi ; i  1, N , в якому rx 
впорядковані за зростанням
Коли є в'язки
S
ˆ к 
1  1 
 N  N  1  C  N  N  1  D 
2  2 
де

1, якщо ryi  ry j та rxi  rx j


N 1 N

S    i, j i , j  1, якщо ryi  ry j та rxi  rx j
i 1 j i 1 
0, інакше

1 z 1 p
C   Aj  Aj  1 D   Bk  Bk  1
2 j 1 2 k 1

28
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Перевірка на рівність нулю (незначущість)


 0 : к  0
Гіпотеза
1 : к  0

ˆ k 9 N  N  1
Статистика u  
p  2 1 F  u  
2  2 N  5 функція стандартного нормального розподілу

u  u1 2 (p  )  H0 не відхиляють (кореляція незначуща, монотонного зв'язку немає)


u  u1 2 (p < )  приймають H1 (кореляція значуща, є монотонний зв'язок)

29
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Між коефіцієнтами Спірмена та Кендалла на практиці часто


мають місце співвідношення
 ˆ с  ˆ к
 ˆ с  1,5  ˆ к – при N  , коли оцінки не дуже близькі до 1

30
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

rˆ  0,005* rˆ  0,059 * rˆ  0,445 rˆ  0,68


ˆ с  0,042 * ˆ с  0,058 * ˆ с  0,42 ˆ с  0,689
ˆ к  0,028 * ˆ к  0,039 * ˆ к  0, 29 ˆ к  0,494

rˆ  0,894 rˆ  1 rˆ  0, 279  б/в +0, 434  rˆ  0,188


ˆ с  0,887 ˆ с  1 ˆ с  0,303  б/в 0,383 ˆ с  0,307
ˆ к  0,704 ˆ к  1 ˆ к  0, 215  б/в 0, 264  ˆ к  0,216

* – помічені незначущі кореляції 31


Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

rˆ  0,867 rˆ  0,839 rˆ  0,559 rˆ  0,891


ˆ с  0,944 ˆ с  0,931 ˆ с  0,71 ˆ с  1
ˆ к  0,827 ˆ к  0,812 ˆ к  0,563 ˆ к  1

rˆ  0,731 rˆ  0,061* rˆ  0,044 * rˆ  0,748


ˆ с  0,725 ˆ с  0,083* ˆ с  0,038* ˆ с  0,741
ˆ к  0,577 ˆ к  0,058* ˆ к  0,039 * ˆ к  0,497

* – помічені незначущі кореляції 32


Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

 Відсутність кореляції не доводить, що зв'язку взагалі немає


 може існувати складний нелінійний зв'язок,
який коефіцієнти кореляції не в змозі виявити
 у випадку неоднорідних даних не можна довіряти
коефіцієнтам кореляції

 Кореляціний зв'язок не є причинно-наслідковим


 існує від'ємна кореляція між твердістю асфальтного покриття та кількістю порцій
морозива, що були з'їдені у певні дні, – причиною зв'язку є третій фактор
«температура повітря»
 існує сильна додатна кореляція між кількістю пожежних машин в районах
Нью-Йорку та кількістю пожеж – пожежні машини не є причиною пожеж, але
пожежні машини є наслідком пожеж
 ФАКТ КОРЕЛЯЦІЇ НІЧОГО НЕ ГОВОРИТЬ ПРО ТЕ, ЯКА ПОДІЯ Є ПРИЧИНОЮ, А
ЯКА НАСЛІДКОМ ІНШОЇ, І ВЗАГАЛІ, ЩО ТАКИЙ ПРИЧИННО-НАСЛІДКОВИЙ
ЗВ'ЯЗОК ІСНУЄ

33
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

Тип одного з Тип іншого Коефіцієнт для виявлення взаємозв’язку


показників показника
кількісний кількісний - коефіцієнт Пірсона
- кореляційне відношення
- коефіцієнт Спірмена
- коефіцієнт Кендалла
кількісний або якісний ранговий з - коефіцієнт Спірмена
якісний ранговий з достатньою - коефіцієнт Кендалла
достатньою кількістю градацій
кількістю градацій
кількісний якісний з двома - коефіцієнт бісеріальної кореляції
градаціями - коефіцієнт точково-бісеріальної кореляції
(бінарний)
кількісний якісний з декількома немає
градаціями

34
Мацуга О.М. Кореляційний аналіз. Випадок двох показників x та y

Тип одного з Тип іншого Коефіцієнт для виявлення взаємозв’язку


показників показника
якісний з двома якісний з двома - коефіцієнт контингенції Ф
градаціями градаціями - тетрахоричний коефіцієнт
- коефіцієнт асоціації Юла
- відношення шансів
якісний з декількома якісний з декількома - коефіцієнти спряженості на основі статистики
(у т.ч. двома) (у т.ч. двома) 2 (Пірсона, Крамера, Чупрова)
градаціями градаціями - міри зв'язку  Гутмана (Guttman)
- міри зв'язку  та  Гудмана–Краскала
(Goodman-Kruskal)

Примітка. Зв’язок між якісними показниками не називають кореляцію, а називають асоціацією,


спряженістю або контингенцією. Виявляють його на основі таблиці спряженості
y=0 y=1
x=0 n11 n12
– таблиця спряженості
x=1 n21 n22

35
Мацуга О.М. Кореляційний аналіз. Випадок багатьох показників x1, x2, … , xp та y

x1 x2 … xp y Усі показники
кількісні
x1,1 x1,2 … x1,p y1

x2,1 x2,2 … x2,p y2

… … … … …

xN,1 xN,2 … xN,p yN

36
Мацуга О.М. Кореляційний аналіз. Випадок багатьох показників x1, x2, … , xp та y

 Парний y 
 xj

Кіл-ть
 Частинний y 
 xj Твердість 
асфальту
 проданого
морозива
xd Температура

 Множинний   x1 , x2 ,..., x p 
y 

37
Мацуга О.М. Кореляційний аналіз. Випадок багатьох показників x1, x2, … , xp та y

 Парний – між y та одним xj (або xs та xj, s  j)


 кореляційне поле
 коефіцієнти Пірсона, Спірмена, Кендалла, кореляційне відношення
Матриця кореляційних полів

Матриця парних коефіцієнтів


 1 rˆx1 , x2 ⋯ rˆx1 , x p rˆx1 , y 
 
 rˆx2 , x1 1 ⋯ rˆx2 , x p rˆx2 , y 
 
R ⋮ ⋮ ⋱ ⋮ ⋮ 
 rˆx , x rˆx p , x2 ⋯ 1 rˆx p , y 
 p 1 
 rˆy , x rˆy , x2 ⋯ rˆy , x p 1 
 1 

38
Мацуга О.М. Кореляційний аналіз. Випадок багатьох показників x1, x2, … , xp та y

 Частинний – між y та xj без урахування їх зв'язків з іншими x


(або між xs та xj, s  j без урахування їх зв'язків з іншими x)
 частинний коефіцієнт кореляції

39
Мацуга О.М. Кореляційний аналіз. Випадок багатьох показників x1, x2, … , xp та y

 Особливості
 виявляє лінійний зв'язок між y та xj без урахування їх зв'язків з показниками із
множини c
 бажано, щоб розподіл усіх показників був нормальний

 Властивості
 ry , x c   1;1
j

 якщо ry , x j c  0 , то немає лінійного зв'язку між y та xj, коли виключити їх зв'язки з


показниками із множини c
 якщо ry , x j c  1, то зв’язок є функціональним
 знак коефіцієнта вказує на додатний чи від'ємний зв'язок

40
Мацуга О.М. Кореляційний аналіз. Випадок багатьох показників x1, x2, … , xp та y

 Оцінка точкова
 рекурентне визначення
rˆy , x j c  rˆy , xd c rˆx j , xd c
rˆy , x j c 
1  rˆ  1  rˆ
2
y , xd c
2
x j , xd c 
де с  с  xd , с – множина показників
 тривіальний випадок
rˆy , x j  rˆy , xd rˆx j , xd
rˆy , x j xd 
1  rˆ  1  rˆ 
2
y , xd
2
x j , xd

rˆy , x j , rˆy , xd , rˆx j , xd – коефіцієнти кореляції Пірсона

41
Мацуга О.М. Кореляційний аналіз. Випадок багатьох показників x1, x2, … , xp та y

 Оцінка інтервальна
Інтервал  rн ; rв  з імовірністю (1 –  ) містить справжнє значення коефіцієнта
exp  2vн,в   1 1 1  rˆy , x j c u1 2
rн,в  , vн,в  ln ∓
exp  2vн,в   1 2 1  ry , x j c
ˆ N w3
де w – потужність множини c

 Перевірка на рівність нулю (незначущість)


 0 : ry , x j c  0 rˆy , x j c N  w  2
Гіпотеза
1 : ry , x j c  0
Статистика t  
p -value  2 1  F  t , N  w  2  
1  rˆ 2
y , x j c функція розподілу Стьюдента

t  t1 2, N  w2 (p-value  )  H0 не відхиляють (частинна кореляція незначуща)


t  t1 2, N w2 (p-value < )  приймають H1 (частинна кореляція значуща)

42
Мацуга О.М. Кореляційний аналіз. Випадок багатьох показників x1, x2, … , xp та y

 Множинний – між y та множиною x1, x2, …, xp


 множинний коефіцієнт кореляції

43
Мацуга О.М. Кореляційний аналіз. Випадок багатьох показників x1, x2, … , xp та y

 Особливості
 виявляє лінійний зв'язок показника y з показниками x1, x2, …, xp
 бажано, щоб розподіл усіх показників був нормальний

 Властивості
 ryx ,..., x   0;1
1 p

 якщо ryx1 ,..., x p  0 , то немає лінійного зв'язку показника y з x-показниками


 якщо ryx1 ,..., x p  1 , то лінійний зв'язок є функціональний, тобто
y  a0  a1 x1  a2 x2  ...  a p x p

 ryx1  ry , x1 , де ry , x1 – коефіцієнт кореляції Пірсона

 ryx1 ,..., x p  ry , x j c для j, c, де ry , x j c – частинний коефіцієнт кореляції

44
Мацуга О.М. Кореляційний аналіз. Випадок багатьох показників x1, x2, … , xp та y

 Оцінка точкова

rˆyx1 ,..., x p  1 
*
 *– визначник матриці коефіцієнтів кореляції Пірсона між усіма показниками,
* – визначник матриці коефіцієнтів кореляції Пірсона між х-показниками
(інакше: алгебраїчне доповнення до елементу p+1,p+1)

1 rˆx1 , x2 ⋯ rˆx1 , x p rˆx1 , y 1 rˆx1 , x2 ⋯ rˆx1 , x p


rˆx2 , x1 1 ⋯ rˆx2 , x p rˆx2 , y rˆx2 , x1 1 ⋯ rˆx2 , x p
 
*

 ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋮ ⋱ ⋮
rˆx p , x1 rˆx p , x2 ⋯ 1 rˆx p , y rˆx p , x1 rˆx p , x2 ⋯ 1
rˆy , x1 rˆy , x2 ⋯ rˆy , x p 1

45
Мацуга О.М. Кореляційний аналіз. Випадок багатьох показників x1, x2, … , xp та y

 Перевірка на рівність нулю (незначущість)


 0 : ryx1 ,..., x p  0
Гіпотеза
1 : ryx1 ,..., x p  0

rˆy2x1 ,..., x p N  p 1
Статистика f   p -value  1  F  f , p, N  p  1
1  rˆ 2
y x1 ,..., x p p
функція розподілу Фішера

f  f1 2, p , N  p1 (p-value  )  H0 не відхиляють (множинна кореляція незначуща)


f  f1 2, p , N  p1 (p-value < )  приймають H1 (множинна кореляція значуща)

46

You might also like