Professional Documents
Culture Documents
6-8 Lekcii Ikonometriq
6-8 Lekcii Ikonometriq
6-8 Lekcii Ikonometriq
Лекции 6-8
Временни редове
2014 г.
Съдържание
Увод ........................................................................................................................................ 3
§1. Класически модели на временни редове ..................................................................... 4
1.1. Въведение ................................................................................................................... 4
1.2. Компоненти на временните редове .......................................................................... 5
1.3. Класически модели на временни редове ................................................................. 5
1.3.1. Адитивен модел ................................................................................................. 6
1.3.2. Мултипликативен модел ................................................................................... 6
1.3.3. Смесен модел ..................................................................................................... 7
1.4. Анализ на компонентите на временните редове..................................................... 7
1.4.1. Тренд анализ........................................................................................................ 7
1.4.2. Определяне на циклични ефекти....................................................................... 9
1.4.3. Определяне на сезонни ефекти........................................................................ 10
1.4.4. Отстраняване на случайни изменения ............................................................ 12
1.5. Други видове модели ............................................................................................... 12
1.5.1. Модел на авторегресия .................................................................................... 12
1.5.2. Модел на пълзящо средно ............................................................................... 13
1.5.3. Модел на авторегресия – пълзящо средно .................................................... 13
1.6. Пример 1 ................................................................................................................... 14
§ 2. Приложение на класическите методи с SPSS ........................................................... 19
2.1. Описание на използваните данни........................................................................... 19
2.2. Линейна регресия за моделиране на брутното производство на електроенергия
..................................................................................................................................... 20
2.2.1. Процедури за линейна регресия в SPSS ......................................................... 20
2.2.2. Резултати от линейна регресия........................................................................ 22
2.2.3. Линейна регресия за квадратичен модел ........................................................ 25
2.2.4. Линейна регресия за логаритмичната трансформация и диагностика на
модела .......................................................................................................................... 26
2.3. Приложение на SPSS за търсене на регресионен модел за нетното
производство на електроенергия ............................................................................. 29
2.3.1. Линейна регресия .............................................................................................. 29
§3. Временен анализ с ARIMA методи ............................................................................. 31
3.1. Основни стъпки в моделирането с ARIMA ........................................................... 31
3.2. Идентификация на ARIMA (p, d, q) модели .......................................................... 33
3.2.1. Компоненти на тренда и преобразуване на процеса към стационарен ....... 33
3.3. Авторегресионни компоненти ................................................................................ 37
3.4. Компоненти с пълзящо средно ............................................................................... 37
3.5. Автокорелационни и частични автокорелационни функции .............................. 38
3.6. ARIMA модели за пример 2 .................................................................................... 40
§4. Приложение на SPSS за ARIMA модели за електропроизводството ...................... 45
4.1. Данни и процедури в SPSS за временен анализ на данни ................................... 45
4.2. ARIMA модели за брутното производство ........................................................... 47
Заключение .......................................................................................................................... 50
Литература ........................................................................................................................... 51
ПРИЛОЖЕНИE................................................................................................................... 52
2
Увод
В тези лекции ще разгледаме:
3
§1. Класически модели на временни редове
1.1. Въведение
4
1.2. Компоненти на временните редове
5
поведението в промяната реда. Те се използват да се предсказват стойностите на реда
в известен или неизвестен период от време, като се изчислява стойността с помощта
на моделната формула.
Класическите модели са параметрични. При тях временният ред се описва с
една приближаваща функция, зависеща от времето, в която се определят известен
брой коефициенти (параметри) на модела.
Различават се следните основни видове класически модели: адитивен,
мултипликативен и смесен.
(1) Yˆ T C S I
(2) Yˆ T . C. S . I
6
Yˆ1 T1 C1 S1 I1.
(4) Yˆ T * C * S I
7
1.4.1.2. Метод на пълзящото средно
Един сравнително прост, но ефективен метод за оценяване на гладките
изменения и приблизително определяне на вида на функцията, описваща тренда и
цикличните ефекти на един временен ред, е т.нар. метод на пълзящото осредняване.
Той се получава чрез последователно осредняване на определен брой последователни
стойности на временния ред. Първоначално се избира едно цяло положително число
k, което показва колко стойности от временния ред се използват на всяка стъпка на
осредняването. То се дели на 2, като се взима само цялото число от делението –
k
l in t . Препоръчва се стойността на k да не бъде по-голяма от 3 или 5.
2
Методът на пълзящото осредняване се реализира със следната формула:
jl
1
Yj
k
u jl
Y u ; j l 1, l 2 , ...., n l
(5)
8
Таблица 1. Видове уравнения на тренд.
Тип на тренда Математичски модел
1) Линеен Yˆ b 0 b 1 . t
2) Квадратичен
Yˆ b 0 b 1 .t b 2 .t 2
3) Кубичен Yˆ b 0 b1 .t b 2 .t 2 b 3 .t 3
4) Експоненциален Yˆ b0 .e b1 .t
5) Логаритмичен lo g Yˆ b 0 b1 . lo g t
6) Дробно-рационален 1
Yˆ
b 0 b 1 .t b 2 .t 2
(6) Yˆ T C I
Yˆci (T C I ) T Yˆ T C I
(7)
9
може да бъде отстранена от Yˆci по същия начин, като тренда (T):
Yˆ
Pi .100 %
(9) T
Yˆ T
Ct
(10) T
10
активност, най-често се анализират временни редове, в които периодичността е
тримесечна или годишна.
Анализът на сезонните изменения се извършва винаги след отстраняване на
гладките изменения – трендовете и цикличните изменения. Както беше посочено
вече това може да се изпълни с използване на метода на пълзящото осредняване. В
случаите, когато един времеви ред няма циклична компонента, това може да се
извърши с построяване на модел на тренда и последващото му остраняване от реда.
Тогава последващият анализ разглежда само сезонните и случайните изменения.
Предполагаемият модел на изследвания ред може да бъде в адитивен (1) или
мултипликативен (.2) вариант. След направеното предположение за отсъствие на
циклична компонента мултипликативният модел може да се запише така:
(11) Yˆ T * S * I
Yˆ T * S * I
Yˆsi S *I
(12) T T
11
За определяне на стойностите на временния ред след отстраняване на
сезонните изменения, стойностите на изчислените сезонни индекси за съответните
дискретни моменти от периода на повторение (за всяко тримесечеие) се записва
отделно в колона.
Предсказване на сезонните стойности се изчислява по формулата:
Yˆ
Yp .100
(13) Ts
T .I s
Yp
(14) 100
12
(15) y i a (1). y i 1 a (2). y i 2 ....... a ( n ). y i n
13
1.6. Пример 1
14
Ще търсим линеен тренд от Таблица 1, вид 1):
Yˆ b 0 b 1 t
Системата за метода на най-малките квадрати с полином от първа степен е:
n n
b0 n b1 ti yi
i 1 i 1 24b0 300b1 10871
n n n или
b0 ti b1 ti2 ti yi 300b0 4900b1 141714
i 1 i 1 i 1
b0 12.5b1 452.9583
b0 16.33333b1 478.38
Yˆ 389.6268 5.066522 t
15
Продажби на автомобили
y, брой продадени 600
автомобили 500
400 y = 5,0665t + 389,63
R2 = 0,6105
300
200
100
0
0 5 10 15 20 25 30
t, тримесечия
16
Фиг. 3. Изглаждане на Y-Тренд с пълзящо средно.
17
Заключение за Пример 1. Получава се по-добро приближение на реалните
данни с адитивния модел, отколкото само с тренд. Грешката е в рамките на 30 броя
автомобили, което е около 6-7%. Тъй като задачата е с малко данни (n=24
тримесечия), то тази точност е удовлетворителна.
Линейната регресия с метода на най-малките квадрати може да се направи с
SPSS. Получават се същите резултати. Там автоматично се дава и значимостта на
модела, която е по-малка от стандартното ниво α = 0.05.
18
§2. Приложение на класическите методи с SPSS
19
2.2. Линейна регресия за моделиране на брутното производство
на електроенергия
20
Фиг. 8. Избиране на променливите за линейна регресия в SPSS.
21
2.2.2. Резултати от линейна регресия
Първата стъпка от анализа е да построим графика на данните. По оста Ox е
времето t, в месеци, а по вертикалната ос – брутното производство на
електроенергия. Не може визуално да се установи дали има някакъв линеен или дриг
тренд. Затова ще проведем няколко опита за намиране на линеен или квадратичен
тренд, а също и с тренд след трансформация на данните.
22
Линейната регресия провеждаме, за да определим дали има линеен тренд. Тя
се извършва по метода на най-малките квадрати автоматично с SPSS. След
стартиране на процедурата получаваме следните резултати:
(Y i Yˆi ) 2
(19) s i 1
, при нас n=96.
n2
23
В) Коефициенти на модела - Табл. 5.
Отново най-важна е последната колона, която показва дали коефициентите са
статистически значими. Самите коефициенти са в колона B, а стнадартизираните им
стойности - в колона Beta. В нашия случай и константата B0=3473.693, B1=5.175.
Таблица 5. Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 3473.693 100.708 34.493 .000
t 5.175 1.803 .284 2.870 .005
a. Dependent Variable: B_proizvodstvo
Точната стойност е 4787 МВт (мегаватт) или (MW). Виждаме, че това е доста
над предсказаното от получения модел (20). Затова ще построим нататък по-точни
модели.
Ако заместим t=97, т.е. в следващия месец (извън таблицата данни), моделът
предсказва стойност: Bˆ _ proizv (97) 5.175 * 97 3473.693 3976 (МВт).
24
Фиг. 11. Реалните данни (по Ox) срещу предсказаните по модела (20) с ±5%
доверителен интервал.
Yˆ b 0 b 1 .t b 2 .t 2
.
25
Таблица 7. ANOVAb
Таблица 8. Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 3673.812 151.394 24.267 .000
t -7.077 7.204 -.388 -.982 .328
tt .126 .072 .694 1.755 .082
a. Dependent Variable: B_proizvodstvo
LogB=Ln(B_proizvodstvo).
26
Таблица 9. Model Summaryb
Adjusted R Std. Error of
Model R R Square Square the Estimate
1 .294a .086 .076 .13035
a. Predictors: (Constant), t
b. Dependent Variable: LogB
Bˆ ( t ) e 0.001t 8.144 .
27
На Фиг. 12 са показани логаритмуваните данни и пресказаните по модела (21).
Не се наблюдава съществена разлика спрямо Фиг. 11. Правим заключение, че
първоначалният линеен тренд (20) е със същата приложимост, както и (21).
28
След отстраняване на тренда (20) получаваме графиката от Фиг. 13. Не се
наблюдават никакви шаблони, за да предполагаме циклични или сезонни влияния.
По тази причини заключаваме, че класическите методи не са подходящи за нашите
данни.
29
Model Summaryb
a. Predictors: (Constant), t
b. Dependent Variable: N_proizvodstvo
ANOVAb
Total 17869996.906 95
a. Predictors: (Constant), t
b. Dependent Variable: N_proizvodstvo
30
§3. Временен анализ с ARIMA методи
Идентифициране
Диагностика на модела
32
3.2. Идентификация на ARIMA (p, d, q) модели
Y1 Y2 ... Yn 1 n
(22) Y
n
const , s2
n 1 i 1
(Yi Y ) 2
33
редове стойностите d= 1 или d =2 обикновено са достатъчни да направят модела
стационарен.
По-нататък ще разглеждаме следния Пример 2 с данните от Фиг. 15. [4]
34
За да се отстрани трендът се изчисляват разликите. Разликата означава
изваждане на стойността на по-ранно наблюдение от стойността на по-късно
наблюдение. Първата стойност на Y на Фиг.15, например, е 19, на втората стойност е
21. Оттук получаваме разлика 2. Аналогично изчисляваме до края на стълба и
получаваме dY. По подобен начин изчисляваме вторите разлики d2Y като
извършваме изважданията в получените първи разлики dY и т.н. (виж Фиг. 15).
35
Може да се направи логаритмична трансформация на първата разлика dY, като
предварително се увеличи с 12, за да няма отрицателни числа. Така се пресмята
колоната Log10_dY_12, съответно графиката е на Фиг. 18.
Yt at
(23)
Считаме, че тези случайни отклонения са независими, с постоянна средна и
дисперсия, и такива са и наблюденията. Ако обаче има тренд в данните, резултатът
също отразява тази тенденция, представляваща наклон на процеса. В такъв малко по-
сложен модел, наблюдението в текущото време t, Yt, зависи от стойността на
предходното наблюдение, Yt-1.
(24) Yt 0 (Yt 1 ) at
36
За данните от пример 2 (Фиг. 15). наклонът на линейния тренд е средната
стойност 0.79 или 0 0.79 . Т.е. моделът е:
(25)
Yt 0.79(Yt 1 ) at
(26)
Yt 1Yt 1 2Yt 2 at
37
няма такива компоненти. Когато q е 1, има зависимост между текущата стойност и
отклонението при лаг 1 (т.е. стъпка назад в реда), като коефициентът на корелация 1
представлява величината на тази връзка. Когато q=2, има връзка между текущата
стойност и случайното отклонение при лаг 2 и корелационен коефициент е 2 , и т.н.
Или ARIMA (0, 0, 2) модел има вида
(27) Yt at 1at 1 2 at 2
1 nk
(Yt Y )(Yt k Y )
n k t 1
(29)
rk
1 n
n 1 t 1
(Yt Y ) 2
38
средната стойност на цялата временна серия и знаменателят е дисперсията на целия
временен ред.
Стандартната грешка на автокорелация се основава на квадрата на
авторкорелация от всички предишни автокорелации. За лаг 1, няма предишни
автокорелации, така че r02 0 . Формулата за стандартната грешка е
k 1
1 2 rl 2
(30) SErk l 0
1
(31) SE pr
n
1
[(11 0.79)(8 0.79)(2 0.79) ... ( 4 0.79)(2 0.79)
r1 19 0.61
1
[[(11 0.79) (8 0.79) (2 0.79) ]
2 2 2
19
1 2(0) 1
SEr1 0.22 SE pr 0.22
20 , 20
39
формулите [4]:
PACF (2)
1 ACF (1)
2
40
Фиг. 20. Графика на PACF за данните от пример 2 – Фиг. 15.
Model Description
Model Type
41
Фиг. 21. Стартиране на анализ на временни редове с SPSS.
Model Statistics
Number of Stationary R-
Model Predictors squared R-squared Statistics DF Sig.
Estimate SE t Sig.
42
Вижда се, че моделът и оценките (Estimates) на коефициентите му са незначими
(Sig.>0.05), но това е поради малкия брой данни n=20. Параметрите на модела за dY
след диференциране на изходния временен ред са съгласно формула (28):
43
Фиг. 23. Изследване на остатъците (грешките) на модела с доверителните
интервали по лагове.
44
§4. Приложение на SPSS за ARIMA модели за
електропроизводството
45
За нашите данни видът е от Фиг. 25.
46
Фиг. 25. Прозорец с за провеждане на временния анализ.
47
Фиг. 27. PACF за брутно производство.
Model Description
Model Type
Model Statistics
48
Параметрите са в колоната Estimate.
ARIMA Model Parameters
Estimate SE t Sig.
Difference 1
49
Фиг. 28. Приближение на данните за брутно производство на електроенергия с
ARIMA (11,1,4).
Заключение
Разучени са основите на класическите методи и ARIMA методи.
Те бяха приложени са анализ на реални данни за електропроизводството в
България по известните данни от националния статистически институт за 2004-2011
г. Установи се, че регресионните модели дават по-слаби резултати като адекватност
към данните спрямо ARIMA методите.
Няма данни за други фактори, които влияят върху величината на
електропроизводството, поради което може да се заключи, че моделите дават само
основните компоненти – тренд, авторегресия и плаващо средно.
50
Литература
51
ПРИЛОЖЕНИE
1) Използвани данни : от Националния статистически институт, за
регистрираните стойности на производство и доставки за електропотребление (МВт)
в България в периода 2004 - 2011 година, по месеци.
52