You are on page 1of 100

ТЕМА 1.

Багатофакторні
економетричні моделі та їх
використання в економіці
та управлінні
Розрахунок параметрів моделі в
матричної формі
Етапи побудови багатофакторної моделі

1. постановка задачі;
2. специфікація моделі;
3. формування масиву інформації;
4. оцінка параметрів моделі методом 1МНК;
5. перевірка моделі та її параметрів на
адекватність;
6. аналіз отриманих результатів,
прогнозування
Помилки специфікації моделі

• невключення в модель чинника (чинників),


який (які) істотно впливає (впливають);
• включення в модель чинника (чинників),
який (які) несуттєво впливає (впливають);
• використання видів залежностей, які не
відповідають істинній формі зв'язку.
Позначення
Y  вектор-стовпець спостережень залежної
змінної

X  матриця спостережень незалежних змінних



A - вектор-стовпець параметрів, що
оцінюються

u  вектор-стовпець залишків
Виходячи з

Y  AX  u
та
 
Y  XA


u  Y  XA
Сума квадратів залишків

/ 
 
 u  u u  Y  XA Y  XA 
2 /

/ /  / 
 Y Y  2 A X Y  AX XA
/
 u u 
/

  2 X Y  2 X XA  0
/ /

A


A  X X  X Y
/ 1 /
Приклад

• Необхідно визначити, як товарообіг мережі


магазинів залежить від їх торгової площі та
середньоденної інтенсивності потоку
покупців
Магазин Товарообіг, сотен Торгівельна площа, Середньоденна інтенсивність
тис. грн. тис. м2 потоку покупців, тис. осіб

1 2,93 0,31 10,24

2 5,27 0,98 7,51

3 6,85 1,21 10,81

4 7,01 1,29 9,89

5 7,02 1,12 13,72

6 8,35 1,49 13,92

7 4,33 0,78 8,54

8 5,77 0,94 12,36

9 7,68 1,29 12,27

10 3,16 0,48 11,01

11 1,52 0,24 8,25

12 3,15 0,55 9,31


1 0,31 10,24   2,93 
   
1 0,98 7,51   5,27 
1 1,21 10,81   6,85 
   
1 1,29 9,89   7,01 
1  7,02 
 1,12 13,72   
1 1,49 13,92   8,35 
X   Y  
1 0,78 8,54   4,33 
1 0,94 12,36   5,77 
   
1 1,29 12,27   7,68 
1  3,16 
0,48 11,01   
 
1 0,26 8,25   1,52 
1  3,15 
 0,55 9,31   
 1 1 1 1 1 1 1 1 1 1 1 1 
 
X   0,31 0,98 1,21 1,29 1,12 1,49 0,78 0,94 1,29 0,48 0,24 0,55 
/

10,24 7,51 10,81 9,89 13,72 13,92 8,54 12,36 12,27 11,01 8,25 9,31 
 
Розрахуємо добуток матриць ( 𝑋 𝑋 )

=
Знайдемо обернену матрицю

 2,47452 0,18978  0,2403


 
X X    0,18978 0,74547  0,0801
/ 1

  0,2403  0,0801 0,02925 


 
Розрахуємо ( 𝑋 ′ 𝑌 )

( )
.
6 3 , 04
( 𝑋 ′ 𝑌 ) = 66,0611
704,692

Знайдемо A

  0,8319
  
A   4,74295 
 0,17499 
 
Регресійна модель


y  0,8319  4,74295x1  0,17499x2
Інтерпретація моделі

• при зміні розміру торгівельної площі на одну


тис. м2, при інших рівних умовах, товарообіг
збільшиться на 4,74 сотень тис. грн.

• при збільшенні середньоденного потоку


покупців на одну тис. осіб, при інших рівних
умовах, товарообіг зросте на 0,175 сотень
тис. грн.
Властивості оцінок параметрів

1. незміщеність;

2. обґрунтованість;

3. ефективність;

4. інваріантність.
• Оцінки параметрів моделі будуть
незміщеними, якщо математичне
сподівання їх обраних значень,
знайдених при багаторазовому
повторенні вибірки, не
відрізняється від істинного

значення

1

M A A
Зміщення


QM A A
Перевірка зміщеності


a
  10% ????
i

ai

• Вибіркова оцінка A зветься
обґрунтованою, якщо для будь-якого як
завгодно малого числа  0
виконується співвідношення

lim
n 
P 

A  A    1 
2

• Вибіркові оцінки вектору A будуть тільки
тоді ефективними, коли їх дисперсії будуть
найменшими

3
Теорема Гаусса-Маркова

• функція оцінювання за методом 1МНК покомпонентно

 всіх лінійних незміщених функцій


мінімізує дисперсію
вектору оцінок A
 
2

A
2
A

 2

A
 дисперсія оцінокA , визначена
методом 1МНК,
 2
A
A
 дисперсія оцінок , визначених
іншими способами
!!!
• Функція оцінювання 1МНК в класичній лінійній
моделі є найкращою лінійно незміщеною
функцією оцінювання

(з англ. BLUE  Best Linear Unbiased Estimator)


Поняття інваріантності
Інваріантність
- це властивість деякого класу (безлічі) математичних
об'єктів, яке залишається незмінним при перетвореннях
певного типу
- це незалежність фізичних закономірностей від конкретних
ситуацій, в яких вони встановлюються, і від способу опису
цих ситуацій

• Оцінка Aпараметрів Aзветься інваріантною
(незмінною, постійною), якщо для довільно
заданої функції g оцінка параметрів функції
представляється у виглядіg  A

g A
4
• Коефіцієнти кореляції, детермінації,
еластичності

covx j , y 
ry 
varx j var y 
xj


cov x j , x l 
rx j 
xl
 
var x j varx l 
1. Нормування

yi  y
y 
*

y
i

xij  x j
x 
*

x
ij
j
2. Розрахунок коефіцієнтів парної кореляції

ry xj
n
 
1 * / *
 Y Xj

rxl xj
n
 
1 * / *
 Xl X j
Середні та СКВ

y  5,25 x1  0,89 x2  10,65

 y  2,11  x  0,4
1
 x  2,01
2
Нормування

y1  y 2,95  5,25
y  *
  1,1
y
1
2,11
y 2  y 5,27  5,25
y 
*
  0,008
y
2
2,11
і так далі
Нормовані значення змінних

* * *
Спостереження y x1 x 2
1 1,100378 1,457381 0,205323
2 0,007894 0,226145 1,564188
3 0,756214 0,804073 0,078396
4 0,831994 1,005091 0,379536
5 0,836730 0,577927 1,526856
6 1,466645 1,507636 1,626407
7 0,437309 0,276400 1,051502
8 0,244704 0,125636 0,849913
9 1,149319 1,005091 0,805115
10 0,991445 1,030218 0,177947
11 1,768183 1,633272 1,195851
12 0,996182 0,854327 0,668233
Коефіцієнти парної кореляції

  1,4574 
 
1  0,2261 
ry x1    1,1003 0,0079   0,9962      0,9843
12 
 
  0,8543 
 
  0,2053 
 
1   1,5642 
ry x2   1,1003 0,0079   0,9962      0,65141
12 
 
  0,6682 
 
  0,2053 
 
1   1,5642 
rx1 x2    1,4574 0,2261   0,8543     0,5424
12 
 
  0,6682 
 
Матриця коефіцієнтів парної
кореляції

 1 0,9843 0,65141
 
r   0,9843 1 0,5424 
 0,65141 0,5424 1  

Коефіцієнт множинної детермінації


n

 
yi  y 
2

2 i 1
R 


n

 yi  y 
2

i 1

або

n

 yi  yi  2

2 i 1
R  1


n

 yi  y 
2

i 1
Скоригований коефіцієнт множинної
детермінації (з урахуванням числа
ступенів свободи)

𝑛− 1
𝑅 =1 − ( 1 − 𝑅 ) ∙
2 2
𝑛 −𝑚
Коли застосовується скоригований
коефіцієнт детермінації?
• Скоригований коефіцієнт детермінації застосовується для оцінки
реальної тісноти зв'язку між результатом і факторами, і
порівняння моделей з різним числом параметрів.
• У першому випадку звертають увагу на близькість скоригованого і
нескоригованого коефіцієнтів детермінації. Якщо ці показники
близькі до одиниці і розрізняються незначно, модель вважається
гарною.
• При порівнянні різних моделей перевагу, за інших рівних умов,
віддають тій, у якій більше скоригований коефіцієнт детермінації.
Коефіцієнт множинної кореляції

R R 2

R0
Показує тісноту зв’язку між усіма незалежними
змінними і залежною змінною
  
y  y  y  y  y  y y  y  y  y  y  y 2
Магазин y y  y y  y  2
y 2

1 2,93 -2,32 5,40 2,4302 -2,82 7,97 6,55896 0,50 0,2498

2 5,27 0,02 0,00 5,1303 -0,12 0,02 -0,00205 0,14 0,0195

3 6,85 1,60 2,55 6,7986 1,55 2,39 2,46734 0,05 0,0026

4 7,01 1,76 3,09 7,017 1,76 3,11 3,09833 -0,01 0,0001

5 7,02 1,77 3,12 6,8809 1,63 2,65 2,87553 0,14 0,0193

6 8,35 3,10 9,59 8,6709 3,42 11,7 10,5830 -0,32 0,1030

7 4,33 -0,92 0,85 4,3619 -0,89 0,79 0,82303 -0,03 0,0010

8 5,77 0,52 0,27 5,7893 0,54 0,29 0,27690 -0,02 0,0004

9 7,68 2,43 5,89 7,4336 2,18 4,75 5,29068 0,25 0,0607

10 3,16 -2,09 4,38 3,3713 -1,88 3,54 3,93974 -0,21 0,0446

11 1,52 -3,73 13,94 1,750 -3,50 12,3 13,0790 -0,23 0,0529

12 3,15 -2,10 4,42 3,4058 -1,85 3,41 3,88594 -0,26 0,0654

Сума 53,50 52,8765 0,6194


52,9
R  0,98842
2

R  0,98585
2

R  0,98842  0,99419314
Варіація включених в
модель факторів на
98,585% пояснює
варіацію залежної
змінної
Коефіцієнт еластичності

y x j
Ey xj  
x j y
Середні

y  5,25333 x1  0,89

x 2  10,6525
Коефіцієнти еластичності

y x1  x1
Ey x    a1  
1
x1 y y

0,89
 4,74295  0,80353
5,25333
y x2  x2
Ey x    a2  
2
x2 y y

10,6525
 0,17499  0,35483
5,25333
Збільшення торгівельної площі на 1%, за
інших рівних умов, тягне за собою
зростання товарообігу на 0,80353%, а
збільшення середньоденної інтенсивності
потоку покупців також на 1%, за інших
рівних умов, спричинить зростання
товарообігу на 0,35483%.
• Дисперсійно-коваріаційна матриця

( )
^ 2𝑎^
𝜎 ^0 , 𝑎
𝑐𝑜𝑣 ( 𝑎 ^ 1) ⋯ ^0,𝑎
𝑐𝑜𝑣 ( 𝑎 ^𝑚 )
0

^ 1, 𝑎
𝑐𝑜𝑣 ( 𝑎 ^ 0) ^ 2𝑎^
𝜎 ⋯ ^1 , 𝑎
𝑐𝑜𝑣 ( 𝑎 ^ 𝑚)
𝐶𝑜𝑣 ( ^
𝐴 ) =𝜎
−1
^ 2𝑢 ( 𝑋 ¿ 𝑋 ) = 1

⋮ ⋮ ⋮ ⋮
^𝑚 , 𝑎
𝑐𝑜𝑣 ( 𝑎 ^ 0) ^𝑚 , 𝑎
𝑐𝑜𝑣 ( 𝑎 ^ 1) ⋯ ^ 2^𝑎
𝜎 𝑚
Оцінка дисперсії залишків

^ 𝑢
𝑢 ^¿
𝑌 𝑌 − ^
𝐴
¿¿
𝑋
¿
𝑌
^ 𝑢=
𝜎 2
=
𝑛 −𝑚 𝑛 −𝑚

n – m  число ступенів свободи


 2,43   0,5 
   
 5,13   0,14 
 6,799  0,051 
   
 7,017   0,007 
 6,881  0,139 
   
  8,671   0,321 
Y   u 
 4,362   0,032 
 5,789    0,019 
   
 7,434  0,246 
 3,372    0,211 
   
 1,75    0,23 
 3,406    0,256 
   
Y Y  384,666
/

/ /
A X Y  384,04664


Y Y  A X Y  0,61936
/ / /

2
 u  0,06882
=

=
2 
 a  0,17029
0
 a  0,41266
0

2 
 a  0,0513
1
 a  0,2265
1

2 
 a  0,00201
2
 a  0,04487
2
Визначаємо наявність зміщення оцінок

a 0,41233
   0,496
0

a0  0,8319

a 0,2265
   0,048
1

a1 4,74295

a 0,04487
   0,256
2

a2 0,17499
Висновок:
 
оцінки a0 і a2 є зміщеними
• Перевірка значущості моделі та її параметрів

1. Перевірка значущості моделі за критерієм Фішера

MSR
Fроз. 
MSE
2
𝑅
𝑀𝑆𝑅=
𝑚 −1
2
1−𝑅
𝑀𝑆𝐸=
𝑛− 𝑚

2
𝑅 ( 𝑛 −𝑚 )
𝐹 роз . =
( 1 − 𝑅 2 ) (𝑚 − 1 )
Якщо

>

для рівня значимості 


і числа ступенів свободи
𝑣 1=𝑚 − 1 і 𝑣 2= 𝑛− 𝑚 ,
то рівняння вважається значимим
2
𝑅 ( 𝑛 − 𝑚) 0,98842 ( 12 −3 )
𝐹 роз . = = =384,1781
( 1 − 𝑅 ) (𝑚 − 1 ) 1 − 0,98842 3 − 1
2
( ) ( )

F2 , 9 , 0.05   4,26

Оскільки
384,1781  4,26 ,
то рівняння вважається значимим
• Стандартизовані коефіцієнти регресії
(β-коефіцієнти), коефіцієнти частинної
детермінації
Означення

•  - коефіцієнти показують вплив


незалежних змінних на залежну у відносних
одиницях вимірювання
Означення
• Стандартизовані частинні коефіцієнти регресії - β-
коефіцієнти показують, на яку частину свого
середньоквадратичного відхилення зміниться ознака-
результат зі зміною відповідного фактора на величину
свого середньоквадратичного відхилення при незмінному
впливі інших факторів (що входять у рівняння).
• За максимальним значенням можна судити, який фактор
сильніше впливає на результат .
 x
 j  aj j

y

Стандартизоване рівняння регресії


y  1 x1   2 x2     m xm
0,39797
1  4,74295  0,89399
2,1114

2,00903
 2  0,17449  0,1665
2,1114

Стандартизоване рівняння множинної


регресії


y  0,89399x1  0,1665x2
Означення

• Коефіцієнт частинної детермінації R 2


j

показує граничний внесок j-го регресора (незалежної


2
змінної) у (загальну варіацію) R
або

• на яку величину зменшиться коефіцієнт


множинної детермінації, якщо j-у змінну
виключити з моделі
R  ry
2
j xj j

R  R  R
2
1
2 2
2
R  0,984 0,894  0,87996
1
2

R  0,651 0,1665  0,1084


2
2

R  R  R  0,87996 0,1084  0,9884


2
1
2 2
2
Інтерпретація:

88% відсотків загальної варіації змінної y


пояснюється варіацією показника торгової
площі x1  і майже 11% варіацією
середньоденного потоку покупців x2  .
• Перевірка значущості параметрів
   
моделі a 0 , a1 , a 2 , , a m
і розрахунок довірчих інтервалів

a0
ta  
0
a0

a1
t a  
1
a 1

a2
ta  
2
a 2

 
am
t a m  
 am

^ 0 ± 𝑡 ( 𝑛 −𝑚 , 𝛼 ) ∙ 𝜎
𝑎 0 =𝑎 ^ 𝑎^ 0
Довірчі
інтервали


^ 1 ± 𝑡 ( 𝑛 − 𝑚 ,𝛼 ) ∙ ^
𝑎 1 =𝑎 𝜎 𝑎^ 1


^ 2 ± 𝑡 (𝑛 − 𝑚 , 𝛼) ∙ 𝜎
𝑎 =𝑎
2
^ 𝑎^ 2



^ 𝑚 ± 𝑡 ( 𝑛 − 𝑚 ,𝛼 ) ∙ 𝜎
𝑎 =𝑎 𝑚
^ ^𝑎 𝑚
Оцінка значимості

a0  0,831946
t a     2,016
0
a 0
0,412663


a1 4,742948
t a     20,94
1
 a 0,226498
1


a2 0,174988
t a     3,9
2
 a 0,044868
2
  0,05

𝑛 −𝑚=12 −3=9

𝑡 ( 9 ; 0 ,05 ) =2,262

  0,1 𝑡 ( 9 ; 0 ,1 )=1,833
Довірчі інтервали

=-0,8319 2,262 0,413=

=-0,8319

 1,765  a  0,101
*
0
=

=4,7429 2,262 0,2265=

4,7439 0,512

4,23  a  5,255
*
1
=

=0,175 2,262 0,045=

=0,175

0,0735  a  0,2765
*
2
• Прогноз значень залежної змінної y
і побудова довірчих інтервалів
прогнозу
Точковий прогноз:

в рівняння регресії
 
Y  XA
підставляються прогнозні значення
незалежних змінних
Інтервальний прогноз (для довільного
значення залежної змінної)
Оцінка середньоквадратичного відхилення похибки прогнозу

 
 n1i    u  1  X /
n 1
X X 
/ 1
X n1

Довірчі інтервали прогнозу

^
𝑌 ^
𝜎 𝑌
∗ ^ ^
𝑛 +1 −𝑡 ( 𝑛 − 𝑚 ,∝ ) 𝑛 +1( 𝑖) ≤ 𝑛+ 1 ≤ 𝑌 𝑛+1 +𝑡 ( 𝑛 −𝑚 ,∝ ) 𝜎 𝑛 +1(𝑖)
Інтервальний прогноз (для математичного
сподівання)
Оцінка дисперсії похибки прогнозу

2 2
 n1   u  X /
n 1
X X 
/ 1
X n1
Оцінка середньоквадратичного (стандартного) відхилення
похибки прогнозу

 
 n1   u  X /
n 1
X X 
/ 1
X n1
Довірчі інтервали прогнозу (для
математичного сподівання)

^ ( ^
𝑛+1 ) ≤ 𝑌 𝑛 +1 +𝑡 ( 𝑛 −𝑚 , ∝ ) 𝜎 𝑛 +1

𝑌 𝑛 +1 − 𝑡 ( 𝑛 − 𝑚 ,∝ )
^
𝜎 𝑛 +1 ≤ 𝑀 𝑌 ^
Нехай
1
 
X n 1  X 13  1,2 
9
 
Тоді


y13  0,832  4,743  1,2  0,175  9  6,434

 2
 u   u  0,0688  0,262
 2,4745 0,1898  0,24   1 
    
 13  0,262  1 1,2 9    0,1898 0,7455  0,08   1,2  
  0,24  0,08 0,029   9 
   

 0,262  0,317  0,262  0,563  0,148.


6,434  2,262  0,148  M y13*   6,434  2,262  0,148

6,1  M y *
13
  6,769
 2,475 0,1898  0,24   1 
    
 13i   0,262  1  1 1,2 9    0,1898 0,7455  0,08   1,2  
  0,24  0,08 0,029   9 
   

 0,262  1  0,3169  0,262  1,1476  0,301


6,434  2,262  0,301  y  6,434  2,262  0,301
*
13

5,754  y  7,115
*
13
• Процедура багатокрокового регресійного
аналізу
Напрямки

1. в міру додавання у модель незалежних змінних;

2. в міру виключення з моделі багатофакторної регресії


незалежних змінних, які несуттєво впливають.
Кроки (перший напрямок)

• Розрахунок коефіцієнтів парної кореляції ry x j


• Вибір серед розрахованих коефіцієнтів
найбільшого (за абсолютною величиною).
Включення до моделі відповідного показника
• Побудова моделі парної регресії, оцінка
значущості її параметрів
• Послідовне доповнення моделі незалежними
змінними в міру зменшення значень ry x j
• Побудова моделей, оцінка їх значущості
Кроки (другий напрямок)

• Побудова моделі множинної регресії з включенням


у неї всього набору незалежних змінних;
•Оцінка значущості параметрів моделі за критерієм
Стьюдента. Вилучення з моделі найменш значимої
змінної (серед тих, які не пройшли перевірку на
статистичну значущість);
•Перерахунок параметрів моделі для решти
незалежних змінних. Оцінка значущості параметрів і
т.д.
Основні економічні
характеристики
взаємозв’язку між
змінними
Середня ефективність впливу
чинників

y
Пj 
xj
Гранична ефективність впливу
чинників на залежну змінну


• Збігається з коефіцієнтом регресії

y 
j   aj
x j
Коефіцієнт еластичності

 jx
Ey xj  aj
y
Сумарна (загальна) еластичність

m
A   Ey xj
j 1
Норма заміщення чинників

  
y y ak
hkj   :  
x j xk aj

You might also like