You are on page 1of 81

Тема 1.

3
(Частина 2)

Перевірка достовірності
моделі парної лінійної
регресії та оцінок її
параметрів.
Прогнозування
Перевірка адекватності
моделі за F-критерієм Фішера

Гіпотеза: H 0 : a1  0
Розрахункова формула:

R m  12
R  n  m  2
Fроз .  
 
1  R n  m  1  R  m  1
2 2
 
n – кількість спостережень
m – кількість параметрів, що оцінюються

Ступінь свободи (або ступінь вільності) – число, яке показує, скільки


незалежних елементів інформації, отриманих з елементів вибірки
y1 , y2 ,  , yn ,
необхідно для розрахунку даної суми квадратів
Ступені свободи

1) Кількість ступенів свободи v1

визначається кількістю незалежних

змінних, тобто x-ів, або кількістю


параметрів, що оцінюються, мінус 1

2) Кількість ступенів свободи v2

визначається кількістю спостережень n


за мінусом кількості параметрів, що

оцінюються, тобто m
Етапи перевірки
1. Розраховуємо величину F-критерію

2. Задаємо рівень значущості 


3. Знаходимо табличне (критичне)
значення F-критерію F
1, n  2 ,   з v1  1
і v2  n  2 ступенями свободи і рівнем
значущості 
4. Якщо Fроз .  F1,n  2,  , то гіпотеза


H 0 : a1  0
відхиляється, якщо Fроз .  F1,n  2,  ,
то гіпотеза приймається
Розрахунок F-критерію

R m  1
2
R  n  m 
2
Fроз .   
1  R  n  m 1  R  m  1
2 2

0,9625  8  2
  153,996
1  0,9625 2  1
Як знайти табличне (критичне)
значення критерію Фішера?

Для v1  1, v2  n  2  8  2  6

  0,05
Ступені
Таблиця свободи: v1 1 2 3 4 5 …
F-розподілу v2
1 161.4 199.5 215.7 224.6 230.2 …
Фішера для
2 18.51 19.00 19.16 19.25 19.3 …
  0,05 3 10.13 9.55 9.28 9.12 9.01 …
4 7.71 6.94 6.59 6.39 6.26 …
5 6.61 5.79 5.41 5.19 5.05 …
6 5.99 5.14 4.76 4.53 4.39 …
7 5.59 4.74 4.35 4.12 3.97 …
8 5.32 4.46 4.07 3.84 3.69 …
9 5.12 4.26 3.86 3.63 3.48 …
10 4.96 4.1 3.71 3.48 3.33 …
11 ⋮ ⋮ ⋮ ⋮ ⋮
F1, 6,0.05  5,99

Fроз .  153,996  F1, 6, 0.05  5,99


Висновок: гіпотеза H 0 : a1  0
відхиляється і рівняння
регресії визнається
достовірним
Перевірка гіпотези про значущість
коефіцієнта кореляції

Гіпотеза H 0 : ryx  0
Скористаємося критерієм Стьюдента
Розрахункове значення t-критерію:

n2
t роз .  ryx  2
1  ryx

vn2 - число ступенів свободи


Для заданих v і  знаходимо табличне
значення t v , 
Якщо t роз .  tv ,  , то гіпотеза

H 0 : ryx  0

відхиляється, якщо t роз .  tv ,  - то


приймається
Розрахуємо t-статистику Стьюдента

n2 82
t роз .  ryx  2
 0,981   12 ,41
1  ryx 1  0,9625
При  = 0,05
і
v=n–2=8–2=6
U1/Pr 0.25 0.10 0.05 0.025 0.01 …
Таблиця 0.50 0.20 0.1 0.05 0.02
t-розподілу 1 1 3.078 6.314 12.706 31.821 …
Стьюдента 2 0.861 1.886 2.920 4.303 6.965 …
3 0.765 1.638 2.353 3.182 4.541 …
4 0.741 1.533 2.132 2.776 3.747 …
5 0.727 1.476 2.015 2.571 3.365 …
6 0.718 1.440 1.943 2.447 3.143 …
7 0.711 1.415 1.895 2.365 2.998 …
8 0.706 1.397 1.860 2.306 2.896 …
9 0.703 1.383 1.833 2.262 2.821 …
10 0.700 1.372 1.812 2.228 2.764 …
11 ⋮ ⋮ ⋮ ⋮ ⋮
t табл.  t 6 , 0.05   2,447

Оскільки t роз .  12,41  t6, 0.05  2,447 ,


то коефіцієнт кореляції визнається
значимим
Критерії оцінки якості лінійної моделі
(оцінювання прогнозних можливостей моделі)

Абсолютні похибки прогнозу


1. Середня помилка прогнозу (абсолютний
показник зміщення прогнозу)

1 n 1 n 
ME  u   ui    yi  yi 
n i 1 n i 1
При n ME  0
2. Середня абсолютна похибка
прогнозу

1 1
n
 n
MAE   ui   yi  yi
n i 1 n i 1
3. Середньоквадратична похибка
прогнозу

0,5
1 n
 2
MSE     yi  yi  
 n i 1 
Відносні показники
1. Середня процентна помилка
апроксимації (відносний показник
зміщення прогнозу)

1 n
ui 1 n
yi  yi
MPE   100%   100%
n i 1 yi n i 1 yi
2. Середня абсолютна процентна
помилка


1 n
ui 1 n
yi  yi
MAPE   100%   100%
n i 1 yi n i 1 yi
3. Коефіцієнт невідповідності Тейла

 2
n
 yi  yi 

i 1 n
KT 
n 2 n 2
yi yi

i 1 n
 
i 1 n
Як оцінювати?
• Для MPE та KT важливим є наближення їх
до 0
• Тлумачення показника MAPE
Рівень якості
№ Рівень MAPE
прогнозу
1 < 10 % Високий
2 10 – 20 % Досить добрий
3 21 – 50 % Задовільний
4 > 50 % Незадовільний
Додаткові показники
1. Дисперсія і стандартне відхилення
залишків

1 n
varu    ui  u    u
2 2

n i 1

1 n
  varu    ui  u 2

n i 1
2. Середнє абсолютне відхилення

1 n
MADu    u i  u
n i 1
Незміщена оцінка істинного значення

2
 u

а) для парної залежності


n

2 u i
2

u  i 1

n2
б) для багатофакторної моделі
n

2
u 2
i
u  i 1
nm

n2 і nm - числа ступенів свободи


Перевірка значущості
параметрів a0 і a1 за t-критерієм
Стьюдента і побудова довірчих
інтервалів

Оцінка параметра a1


Висувається гіпотеза H 0 : a1  0
Розраховується статистика Стьюдента

a1
t a1  
 a1

- стандартна похибка (відхилення) оцінки


параметра
Знаходимо табличне значення
tn  m , 
Якщо t a  t n  m ,  , то гіпотеза
1


H 0 : a1  0
відхиляється,

якщо – то приймається
t 
a1  tn  m , 

Оцінка значущості параметра a0
здійснюється аналогічно


a0
t a0  
 a0
 2  2 1
 a1   u n

 x  x 
2
i
i 1

 2 1
 a1  u n
- стандартна похибка
параметра a1
 x  x 
2
i
i 1

n
n

2 u i
2

2
u 2
i
u  i 1
u  i 1

n2 nm
n

 2 2
 i
x 2

 a0   u n
i 1

n xi  x 
2

i 1

 2
x 2
i
 a0   u n
i 1
- стандартна похибка
параметра a0
n xi  x 
2

i 1
Розрахуємо оцінку дисперсії
2
залишків  u

2  i
u 2
10,71
u  
i 1
 1,78
n2 82
Знайдемо оцінки дисперсії і стандартного
відхилення a1

 2  2 1 1
 a1   u  n
 1,78   0,002155
828
 x  x 
2
i
i 1

  2
 a1   a1  0,046
Розрахуємо статистику Стьюдента

a1 0,576
t a1     12,41
 a1 0,046

Для   0,05 і v  n  2  8  2  6

t 6 , 0.05   2,447
Оскільки

t a  12,4  t 6 , 0.05   2,447 ,


1

то коефіцієнт регресії є значимим


Знайдемо оцінки дисперсії і стандартного
відхилення a0
n

 
 i
x 2
6030
 a20   u2  n
i 1
 1,78   1,62
8  828
n xi  x 
2

i 1

  2
 a0   a0  1,27
Розрахуємо статистику Стьюдента


a0  1,44
t a0     1,13
 a0 1,27
Порівняємо розраховане значення t
статистики за модулем з табличним

t a   1,13  t 6 , 0.05   2,447


0

Висновок: для обраного рівня довіри


значення коефіцієнта не є значимим
Розрахунок оцінок дисперсій і
стандартних відхилень параметрів
регресійного рівняння за допомогою
дисперсійно-коваріаційної матриці
Дисперсійно-коваріаційна матриця
• Для характеристики випадкових змінних поряд із
математичним сподіванням застосовуються також
дисперсія і коваріація.
• Істинні (справжні) значення цих параметрів класичної
економетричної моделі утворюють дисперсійно-
коваріаційну матрицю

( )
^ 2𝑎^
𝜎 0
^0,𝑎
𝑐𝑜𝑣 ( 𝑎 ^1) ⋯ ^0,𝑎
𝑐𝑜𝑣 ( 𝑎 ^ 𝑚)
^ 1, 𝑎
𝑐𝑜𝑣 ( 𝑎 ^ 0) ^ 2𝑎^
𝜎 ⋯ ^ 1 ,𝑎
𝑐𝑜𝑣 ( 𝑎 ^ 𝑚)
𝐶𝑜𝑣 ( ^
𝐴) = 𝜎
2 ¿ −1
𝑢
^ (𝑋 𝑋) = 1

⋮ ⋮ ⋮ ⋮
^𝑚 , 𝑎
𝑐𝑜𝑣 ( 𝑎 ^ 0) ^ 𝑚 ,𝑎
𝑐𝑜𝑣 ( 𝑎 ^1) ⋯ ^ 2𝑎^
𝜎 𝑚
Дисперсійно-коваріаційна матриця
• Оцінки коваріаційної матриці використовуються
для знаходження стандартних похибок та
обчислення довірчих інтервалів оцінок параметрів.
Вони використовуються й під час перевірки їхньої
статистичної значущості.

• На головній діагоналі матриці містяться оцінки


диспер­сій j-ї оцінки параметрів, що ж до елементів,
які розміщені поза головною діагоналлю, то вони є
оцінками коваріації між і
Знаходимо систему нормальних рівнянь

 na  a x  yn n

1 i 
 0
i 1 i 1
i

 n  n n
a0  xi  a1  xi   xi yi .
2

 i 1 i 1 i 1
Виділяємо матрицю

 n

 n  xi 
X X    n
' i 1 
2
n

 
 i 1
xi 
i 1
xi 

Знаходимо матрицю , зворотну по
відношенню до матриці
• Загальне правило:
11 T
A   A*
A
де |А| - визначник матриці А
A*T - транспонована матриця алгебраїчних
доповнень відповідних елементів матриці А
1
A A  E
Етапи розрахунків зворотної матриці

1) Знаходимо визначник матриці А


(визначник не може дорівнювати нулю)
1 2
Приклад для матриці 2×2 A   3 4  :
 
1 2
A  1  4  3  2  4  6  2  0
3 4
2) Знаходимо матрицю мінорів
 * *
M   
 * *
Етапи розрахунків зворотної матриці

• Діагональні елементи вихідної матриці


міняємо місцями
 4 3
M   
 2 1
• Для отримання алгебраїчних доповнень A*
знаки елементів розташовуємо в такому
порядку
 
 
 
Етапи розрахунків зворотної матриці

3. Отримуємо матрицю алгебраїчних


доповнень
 4  3
A*   
 2 1 
4. Знаходимо транспоновану матрицю
алгебраїчних доповнень

T  4  2
A  
* 
3 1 
Етапи розрахунків зворотної матриці

5. Підставляємо отримані складові у формулу


для зворотної матриці

11 T 1  4  2
A   A*     
A 2 3 1 
 2 1 
  
 1,5  0,5 
Дисперсійно-коваріаційна матриця

 2  
  2 ' 1   a0  a0 a1 
 
cov A   u X X   
  a a  2 
 a1 
 10
n

2 u i
2

u  i 1

n2
Діагональні елементи матриці
використовуються для знаходження
стандартних похибок параметрів моделі

 2  
  2 ' 1   a0  a0 a1 
 
cov A   u X X   
  a a  2 
 a1 
 10
 
 a0  a1
Стандартні похибки параметрів моделі можуть
також позначатися як

S a0 S a1
 
Оцінимо значущість параметрів моделі a1 і a0
Для цього будуємо коваріаційну матрицю
Виконуємо наступні дії:
1) Додаємо стовпець одиниць до вектору
спостережень незалежної змінної, отримуємо
матрицю:
2) Транспонуємо матрицю:

Отримаємо:
3) Перемножуємо матриці і :

Отримаємо:
4) Знаходимо обернену матрицю :

5) Знаходимо незміщену оцінку дисперсії похибок:

2  i
u 2
10,71
u  
i 1
 1,78
n2 82
6) Знаходимо коваріаційну матрицю
=
=
7) Знаходимо стандартні відхилення оцінок параметрів
моделі:
Статистика Стьюдента

a1 0,576
t a1     12,41
 a1 0,046

Для   0,05 і v  n  2  8  2  6

t 6 , 0.05   2,447
Оскільки

t a  12,4  t 6 , 0.05   2,447 ,


1

то коефіцієнт регресії є значимим


Статистика Стьюдента


a0  1,44
t a0     1,13
 a0 1,27
Порівняємо розраховане значення t
статистики за модулем з табличним

t a   1,13  t 6 , 0.05   2,447


0

Висновок: для обраного рівня довіри


значення коефіцієнта не є значимим
Оцінка зміщеності оцінок параметрів
моделі
• Здійснюється за допомогою розрахунків
співвідношень:

 ai S ai
 або 
ai ai

• Якщо співвідношення у відсотковому вимірі


перевищують 10%, то говорять про зміщеність
оцінок, що може свідчити про невірну
специфікацію моделі
Розрахунок довірчих інтервалів
для параметрів моделі
Етапи розрахунків

1. Знаходимо табличне значення


статистики Стьюдента для n – m ступенів
свободи (для парної залежності m = 2) і
рівня значимості α

tn  m; 
2. Розраховуємо стандартні похибки
параметрів моделі


 ai , i  0,1
 
3. Для параметрів a0 і a1 отримуємо
довірчі інтервали

*  
a  a0  tn  m;    a0
0


* 
a  a1  tn  m;    a1
1
Розрахунок довірчих інтервалів
для параметрів a1 і a0.

Нехай   0,05

Для n  2  8  2  6 ступенів свободи


знаходимо табличне значення
t6;0, 05  2 ,447
З урахуванням цього

*  
a  a1  t6;0,05   a1  0 ,576  2 ,447  0 ,0464 
1

 0 ,576  0 ,1136


0,4625 a1  0,6897

Для a0
*  
a  a0  t6;0, 05   a0 
0

 1,44  2 ,447 1,2745  1,44  3,119


 4,559  a0  1,679
Прогнозування за моделлю
простої лінійної регресії

Види прогнозів:

• точковий
• інтервальний
Прогнозне значення залежної змінної
(точковий прогноз)
  
y n 1  a 0  a1 x n 1

Залишок прогнозу un 1

un 1  yn 1  yn 1
Оцінка дисперсії залишків прогнозу

 
2 2  1 xn 1  x 
2 
 un1   u 1   n 
 n  xi  x 
2
 i 1


Статистика Стьюдента для n – m
ступенів свободи і рівня значимості α

tn  m; 
Довірчий інтервал для прогнозного

значення змінної yn 1

*  
y n 1  yn 1  tn  m;    un1
Оцінка дисперсії залишків прогнозу для
математичного сподівання y

 
2 
 2 1 xn 1  x 
2 
 un1  u   n 
n  xi  x 
2
 i 1


Вираз для розрахунку довірчого
інтервалу для математичного
сподівання прогнозу

 
M y *
n 1  yn 1  tn  m;    un1

Розрахуємо прогноз величини yn 1
і довірчі інтервали прогнозу для

n 1  8 1  9

Визначимо значення x9  20
Знайдемо


y 9  1,44  0,576  x9  1,44  0,576  20  10,082
Довірчі інтервали для рівня значимості

  0,05
*  
y  y9  t8 2;0, 05   u9 
9

1 20  25,5
2
 10,082  2,447 1,336  1   
8 828
 10,082  3,523

6 ,559  yn 1  13,6
Довірчі інтервали для математичного
сподівання

M  yn 1 

для   0,05
 
 
*
M y  y9  t8 2;0,05   u9 
9

1 20  25,5
2
 10,082  2,447 1,336   
8 828

 10,082  1,314


8,768  M  y9   11,395

You might also like