Professional Documents
Culture Documents
Streszczenie
Celem pracy była analiza dokładności wybranych metod prognozowania zmiennych opisujących
polski rynek pracy w latach 1998−2013. Badaniu poddano następujące zmienne: liczbę pracujących
w gospodarce narodowej według GUS, liczbę pracujących według BAEL oraz średnie miesięczne
wynagrodzenie w gospodarce narodowej. W porównaniach uwzględniono: modele wektorowej
autoregresji VAR, bayesowskie modele VAR, dynamiczne modele czynnikowe, modele wskaźników
wyprzedzających oraz metody łączenia prognoz. Uzyskane wyniki wskazały, że w zdecydowanej
większości przypadków największą dokładnością, mierzoną błędem średniokwadratowym prognoz
wygasłych, cechowały się prognozy łączone, uwzględniające modele czynnikowe oraz modele
wskaźników wyprzedzających. Te dwie klasy modeli dawały lepsze prognozy niż tradycyjne modele
wektorowej autoregresji. Pokazano również, że napływ kolejnych danych miesięcznych nie prowadził
do poprawy jakości prognoz na dany kwartał.
1. Wstęp
Rynek pracy odgrywa niezwykle ważną rolę w gospodarce. Takie zmienne, jak poziom zatrudnienia
czy stopa bezrobocia, są w wielu przypadkach punktem odniesienia do oceny skuteczności działań
prowadzonych w ramach określonej polityki gospodarczej. Stąd też często pojawia się konieczność
prognozowania sytuacji na rynku pracy, którego sposób funkcjonowania zależy miedzy innymi od
decyzji o poziomie wydatków publicznych, siły działania systemu podatkowego, skuteczności polityki
społecznej, atrakcyjności pracy i czasu wolnego, poziomu i struktury konsumpcji czy skłonności do
inwestowania.
W ostatnich latach w literaturze obserwuje się wzrost zainteresowania metodami krótkookresowe-
go prognozowania szeregów czasowych. Można do nich zaliczyć między innymi modele wektorowej
autoregresji, dynamiczne modele czynnikowe oraz modele wskaźników wyprzedzających. Przy dużej
liczbie możliwych podejść istotny jest wybór najlepszych metod prognozowania. Ponieważ dla danej
zmiennej prognozowanej bardzo trudno ex ante wskazać najwłaściwsze podejście, konieczna jest zwy-
kle analiza dokładności prognoz ex post uzyskanych różnymi metodami.
Celem pracy była analiza dokładności prognoz wybranych zmiennych opisujących polski rynek
pracy, uzyskanych różnymi metodami. Wśród badanych zmiennych rozważano: liczbę pracujących
w gospodarce narodowej według GUS, liczbę pracujących według BAEL oraz średnie miesięczne wyna-
grodzenie w gospodarce narodowej. Analizowano dokładność takich metod, jak: modele wektorowej
autoregresji VAR, bayesowskie modele VAR, dynamiczne modele czynnikowe (ang. dynamic factor mo-
dels – DFM), modele wskaźników wyprzedzających (ang. leading indicators – LI) oraz metody łączenia
prognoz.
W pracy rozważano dwie podstawowe hipotezy: (1) największą dokładnością, mierzoną błędem
średniokwadratowym prognoz wygasłych, cechują się prognozy łączone oraz (2) prognozy uzyskane za
pomocą modeli czynnikowych oraz modeli wskaźników wyprzedzających są dokładniejsze niż progno-
zy generowane przez tradycyjne modele wektorowej autoregresji.
Od strony metodologicznej największą trudnością jest to, że zmienne prognozowane i zmienne ob-
jaśniające mają różną częstotliwość obserwacji. Dane dotyczące zmiennych prognozowanych publiko-
wane są co kwartał, natomiast wiele potencjalnych zmiennych objaśniających występujących w mode-
lach DFM oraz LI mierzonych jest z częstotliwością miesięczną. W przypadku wspomnianych modeli
pozwala to na formułowanie prognoz co miesiąc. Wykorzystanie bardziej aktualnych danych miesięcz-
nych jest też źródłem potencjalnej przewagi modeli DFM oraz LI nad modelami autoregresyjnymi.
W związku z tym w niniejszej pracy weryfikowano dodatkową, trzecią hipotezę, że wraz z napływem
kolejnych danych miesięcznych wzrasta dokładność prognoz na dany kwartał, uzyskiwanych za pomo-
cą modeli LI oraz DFM. Kwartalny charakter zmiennych prognozowanych sprawia, że pod względem
metodologicznym prognozowanie zmiennych rynku pracy bardziej przypomina prognozowanie dyna-
miki PKB i wyraźnie różni się od metodologii badań nad inflacją.
Istotnym problemem w prognozowaniu jest wybór właściwego schematu prognostycznego oraz
długości próby. W związku z tym próbowano również ocenić, jak przyjęty schemat prognostyczny oraz
różna długość prób wpływają na dokładność prognoz.
W literaturze dotyczącej prognozowania makroekonomicznego przedmiotem zainteresowania ba-
daczy najczęściej jest dynamika PKB oraz inflacja (zob. Stock, Watson 1999; Banerjee, Marcellino, Ma-
sten 2005; Eickmeier, Ziegler 2008; Barhoumi i in. 2008; Giannone, Reichlin, Small 2008; Baranowski,
Dokładność wybranych metod prognozowania... 165
Leszczyńska, Szafrański 2010; Angelini i in. 2011; Koop, Korobilis 2011). Zmienne te odgrywają decydu-
jącą rolę w opisie gospodarki danego kraju, a także przy podejmowaniu decyzji w zakresie polityki pie-
niężnej i gospodarczej. Badania nad prognozowaniem zmiennych opisujących sytuację na rynku pracy
prowadzone są dużo rzadziej. Tymczasem potrzeby w tym zakresie są duże. W wielu krajach przyjęto
na przykład, że o pozytywnej ocenie polityki gospodarczej nie decyduje wysokie tempo wzrostu gospo-
darczego, ale pełne zatrudnienie. Z kolei dynamika wynagrodzeń odgrywa główną rolę w ocenie presji
płacowej, wpływającej na poziom inflacji w gospodarce.
Prognozowaniem zmiennych opisujących rynek pracy zajmowali się między innymi Rapach
i Strauss (2008; 2012). Rozważali metody łączenia prognoz w odniesieniu do zatrudnienia w Stanach
Zjednoczonych i stwierdzili, że często dawały one dokładniejsze wyniki niż modele autoregresyjne. Prze-
waga ta była szczególnie widoczna w okresach recesji. Gupta i in. (2012) zauważyli, że modele czynniko-
we, uwzględniające długookresowe zależności opisane za pomocą mechanizmu korekty błędem, pozwa-
lały na dokładniejsze prognozowanie dynamiki zatrudnienia sektorowego w Stanach Zjednoczonych
w porównaniu z modelami VAR oraz BVAR. Siliverstovs (2013) rozważał natomiast znaczenie ankieto-
wych badań koniunktury dla poprawnego prognozowania zatrudnienia w Szwajcarii. Marcellino, Stock
i Watson (2003) badali dokładność prognoz stopy bezrobocia, a także inflacji oraz PKB w strefie euro
i jej krajach członkowskich. W odniesieniu do stopy bezrobocia najlepsze prognozy w rozważanych
przez nich warunkach generowane były przez modele czynnikowe oraz modele VAR. Z kolei Christof-
fel, Warne i Coenen (2010) oceniali zdolności prognostyczne dużego modelu DSGE dla strefy euro,
biorąc pod uwagę także zmienne opisujące rynek pracy. W odniesieniu do kwartalnej dynamiki za-
trudnienia rozważany przez nich model cechował się bardzo dobrymi zdolnościami prognostycznymi
w porównaniu z różnymi wersjami modeli VAR oraz BVAR. Jednak w przypadku płac nominalnych spi-
sywał się wyraźnie gorzej od innych podejść.
Praca składa się z sześciu części. W części drugiej omówiono zmienne prognozowane i obja-
śniające. Następnie przedstawiono zastosowane w pracy metody prognozowania. W części czwartej
zaprezentowano metodologiczne aspekty porównywania dokładności prognoz. Część piąta zawiera
wyniki badań.
2. Zmienne
rodowej oraz liczba pracujących według BAEL uzupełniają się, i oddzielnie analizować ich kształtowa-
nie się (por. Cichocki i in. 2013). Z tego powodu w niniejszej pracy rozpatrywano obie te zmienne. Ich
dynamikę w okresie objętym badaniem ilustrują wykresy 1 i 2.
Zbiór potencjalnych zmiennych objaśniających liczył pierwotnie 135 szeregów, w tym 106 szeregów
o częstotliwości miesięcznej oraz 29 szeregów o częstotliwości kwartalnej. Z pierwotnego zbioru usu-
nięto zmienne, dla których współczynnik korelacji liniowej Pearsona z innymi zmiennymi przekraczał
0,9, a także te, w których występowały wyraźne obserwacje odstające. Jak pokazały badania Boivina
i Ng (2006), rozszerzanie zbioru zmiennych objaśniających w modelach czynnikowych nie musi prowa-
dzić do poprawy jakości predykcji. Co więcej, obecność zmiennych wnoszących bardzo niewiele nowych
informacji może nawet zmniejszać zdolności prognostyczne tych modeli. Po wstępnej selekcji pozostało
67 zmiennych, w tym 61 o częstotliwości miesięcznej i 6 o częstotliwości kwartalnej. Ostateczny zbiór
zmiennych objaśniających zawierał zmienne dotyczące rynku pracy, sytuacji makroekonomicznej, ko-
niunktury, handlu zagranicznego, a także zmienne opisujące sferę monetarną i zmienne mające cha-
rakter syntetycznych wskaźników wyprzedzających. Ich szczegółową listę zawiera tabela 5.
Dane kwartalne obejmowały okres od II kwartału 1998 r. do II kwartału 2013 r. (61 obserwacji),
natomiast miesięczne – od maja 1998 r. do sierpnia 2013 r. (184 obserwacje). W przypadku niektórych
zmiennych objaśniających brakowało danych, szczególnie z początkowych okresów. Brakowało też da-
nych na końcu próby, co wiązało się z różnym czasem publikacji danych. Datą końcową, do której gro-
madzono dane (ang. cut-off d ate), był 10 września 2013 r. W przypadku modeli DFM brakujące dane
uzupełniano za pomocą algorytmu maksymalizacji oczekiwań (ang. expectations maximization – EM;
zob. Stock, Watson 1998). W modelach wskaźników wyprzedzających duże braki danych na początku
szeregu czasowego wykluczały daną zmienną jako potencjalny wskaźnik wyprzedzający ze względu na
zbyt małą liczbę obserwacji do testowania modelu.
Wszystkie zmienne zostały odsezonowane za pomocą procedury TRAMO/SEATS z automatyczną
identyfikacją modelu. W ustawieniach programu przyjęto wartość parametru RSA = 4 (zob. Gomez,
Maravall 1998). Dodatkowo wiele zmiennych poddano przekształceniom, mającym na celu sprowadze-
nie ich do postaci stacjonarnej. Wyrażone zostały więc jako stopy wzrostu bądź przyrosty. Bez zmian
pozostały tylko wskaźniki koniunktury. Obserwacje kwartalne przekształcono do postaci miesięcznej,
przyjmując takie samo tempo wzrostu badanej zmiennej w każdym miesiącu. Na koniec wszystkie
szeregi poddano standaryzacji.
3. Modele
ΣG y
m
Σ Gi y t(3)3i + εt( y )
m
y t( 3) = G 0 + y t( 3) = G 0 + i
( 3)
t 3i + εt( y ) (1)
i =1 i =1
( 3)
gdzie y t oznacza wektor zmiennych yprognozowanych,
( 3)
t a Gi są macierzami parametrów.
Ponieważ dwie_ φ zmienne σˆuj opisujące zatrudnienie σˆujdostarczały informacji o podobnym zakresie,
σ ijk = θwij k φ
_
σ = θ w
uwzględnianie ich obu k
σˆ uiw modelu (1) przy krótkich próbach σˆ ui stosowanych do estymacji parametrów mo-
ijk ij
σˆ ui y t = G 0 + Σ G y + εt W = [ w ]
(1)
a f W i==1[yw(1ij)i ]at 3fi ij
y
gdzie: i jest numerem równania, t W =t [ wij ] k reprezentuje rząd opóźnienia, θ, φ oraz ma-
t t W = [ wij ] j – numerem zmiennej,
cierz W = [ wij ] są hiperparametrami, σˆuj ((11natomiast σˆuj oznacza oszacowanie odchylenia standardowego
y t( 3v)1 v1
Σ
)) σ
t 1uj Σ
ε ˆ (1)
A ε (1)
σ y a a y i f t i + j. t
(1) (1)
składnika
y t =losowego a 0 + a1 yw ˆ jednowymiarowym
+ A f
i t i + tt = modelu
uj 0 + AR
1 t 1 +
dla zmiennej
σˆuj i= 0
θ > 0 σˆ θ > 0 i= 0
θ > 0
Hiperparametr
εt(1) θ >σ ijk0 =określa θwij k ogólnie
_φ
εt(1)
uj
wielkość odchylenia standardowego w całym rozkła-
θ > 0
dzie a p riori. Hiperparametr 0 ≤ φ ≤ 1 determinuje σˆ 0 ≤ φ ≤tempo 1 zmniejszania się niepewności w roz- 0,5
≤ φ≤1 0,51 0,5
ui
0 ≤zeφwzrostem ≤v1 1
0 1 0,5
kładzie a p riori wraz opóźnienia określonego v1 przez m w modelu 1 (1).0 , 5
Wskazuje 0 ,5
0,5 1 zatem, 0,5
Σ
1B Z0,_5 + ε (3) 0,5
że zmienne objaśniające Σ
0y≤t(3)φ=≤b10 + b1 y t(_33) W + = B
[ w Z ] _ i +yε
( 3()3)
= b + b θ y ( 3)
_3 +
0 ,1 φ 10, 5 1 W 0 ,5
w danym i
θ = 0,równaniu
t
1 t 1 φ0będą
t 0
,5 = miały
1 t
0,5niewielki
i
W = wpływ
t i t 0,na
5 zmienną
=1 objaśnia-
0,5
,1 = 1W niepewność
ij
φi =0=0,51 1 =co do W0wartości
,=5
φ = 1θ na = 0większą
i= 0
ną. Elementy macierzy θ = 0wag ,1 W wskazują 0,5 1 = 0,5 parametrów stoją-
θ
cych Z = 0,1
przy= opóźnionych φ =σˆ1uj W = 0 ,5 0 ,5w sto- 1
f t + f t 1 + f t 2zmiennych
, b0 = 3a 0 (1objaśnianych Z+t a=1 f+t a+1f)t ,1 b(elementy +1 f=t 2a,13 b, 0B=na 3agłównej ,+0,a5 przekątnej
+0a,5 ) ,,5b macierzy)
1
2 3
0 (1 0=,05a, 1 , B 0 =1 A 0 , B1 = A1 + a1 A 0 ,
2
0 = A 0 B11 = A110+ a11 A
t
sunku do parametrów stojącychXprzy = FL X = FL 0
zmiennych objaśniających (elementy poza główną przekątną)., 5 0 ,5 1
θ >2 0 B X0,=5 FL 0,5 parametrów.+ a 22A1 , B +ma112,A m 2 , B m 1 = a1 A m + a12 A m 1 ,
B 2 przyjęto
W pracy X FL
1 A 1 + a1 A 0 ,wartości
= A 2 + astandardowe = B m 2 =2 omawianych =A mA +2 +a1aA1 A m 11 + a11 A0m 2 , mB2m 1 = a
= A m 1+Aam1 A +a 2
m 11A
X = FL y t(1) = ln(Yt / Yt 1 )
2 0 ≤ φ ≤ 1 y t(1) B = ln (
= Y (a1)/2Y A )
,
B m = a1 A m , m y t 1 = ln t t m (Yt / Yt 1 ) 1
1
0,5 0,5
y t(1) = ln(Yt / Yt 1 )
εt+((1Y1)0at+,12/5)(1
Yt (+13)1)a + a 2 )ε0,(51) + (1 + (a1) + a 2 )2ε (1(1)) + … + a (1 + a ) ε (1)
( 3)
y = ln(Y / Y )a ) ε (1) + (1
(1)
y t(+3) aε=1tφ +=(= ayY112(t3ε))/tεY=t(1t +)2ln)(yY(1t+ a= )ln εt 3 +1 … +1 a1 t(12 + a1 ) ε t m1 +1 + 1a1 εt t 3m(3)
ε t(t 3) = εt(1) +t (1t +1 (θ
( 3) (1)
t ,1
ln (1
3+ + 1a1=
3)1 = 0 1
y t = ln(Yt / Yt 3 ) t t /WY t 3 ) 1 1 t m +1
(1)
yt(1) ayt _f1t (1) a f yt a f t
( )
yytt _1 = ln(Yt / Yt 3 )
((31)) 1
ΣG y
m
y t( 3) = G 0 + i
( 3)
t 3i + εt( y )
i =1
Zarówno w podejściu klasycznym, jak i bayesowskim liczbę opóźnień m w modelu (1) dobierano ze
względu na zdolności prognostyczne modelu. y ( 3) t
σˆuj
3.2. Dynamiczne modele czynnikowe σ ijk = θwij k
_φ
σˆ ui
Istotą dynamicznych modeli czynnikowych jest wykorzystanie w prognozowaniu zmiennych syntetycz-
[ wij ] danych (zob. Stock, Watson 1998). Proce-
W =zbiorach
nych, reprezentujących informacje zawarte w dużych
durę prognozowania na podstawie modeli DFM można podzielić na trzy etapy:
σˆuj
− wyodrębnienie niezależnych zmiennych syntetycznych – czynników,
− ustalenie zależności pomiędzy czynnikami a zmienną prognozowaną,
θ>0
− wykorzystanie oszacowanej zależności do budowy prognoz.
W niniejszej pracy na pierwszym z wymienionych
0 ≤ φ ≤ 1etapów wykorzystano statyczną metodę głów-
1 0,5 to ma-0,5
nych składowych. Jeżeli K jest liczbą zmiennych objaśniających, a T oznacza liczbę obserwacji,
cierz obserwacji zmiennych objaśniających X ma wymiar T × K. Poszukuje się macierzy 0,5 czynników
1 F0,5
θ = 0,1 φ =1 W=
o wymiarze T × K oraz K-wymiarowej kwadratowej macierzy ładunków czynnikowych L − takich, aby
spełniona była zależność: 0,5 0,5 1
X = FL (4)
Poszukiwane macierze dobierane są w taki sposób, aby czynniki reprezentowane przez kolum-
y (1) = ln(Y / Yt 1 )
ny macierzy F były od siebie niezależne liniowo.t Ponadtot ustawiono je w takiej kolejności, że dany
czynnik wyjaśnia mniejszy lub taki sam odsetek zmienności zmiennych objaśniających w porównaniu
y t(3) = ln(Yt / Yt 3 )
z poprzedzającym go czynnikiem.
Gdyby w macierzy X nie występowały brakiydanych, (1)
a f t rozwiązanie powyższego problemu sprowa-
t
dzałoby się do stosunkowo prostych obliczeń z zakresu algebry. Ponieważ jednak brakuje niektórych
v
Σ
obserwacji, konieczne jest ich uzupełnienie. W tym celu zastosowano1 procedurę maksymalizacji ocze-
y t(1) = a 0 + a1 y t(11) + A i f t i + εt(1)
kiwań (zob. Stock, Watson 1998), która połączona jest z procesem estymacji i= 0 macierzy F oraz L i ma
charakter rekurencyjny. Początkowo przyjęto pewne startowe wartości macierzy F(0) oraz L(0) i na pod-
stawie równania (1) oszacowano brakujące elementy ε (1)
t macierzy X. Korzystając z kompletnej macierzy X,
0 ≤ φ≤1 W = [ w ]
W = [w ] σˆuj ij 1 0,5 0,5
W = [ wij ] ij 0 ≤ φ≤1 0,5 1 0,5 0,15
θ = 0,1 θ = 0φ ,1 = 1 φ = 1 W = W W 0
= , 5 = [ w 1 ] 1 0 0,5,05,5 0,5
σˆuj Dokładność wybranych
θ = 0,1 metod
=σˆ1uj
φ prognozowania...
ij
θ = 169 0,1 φ 1
σˆuj θ > 0 W= 0,5 1 0,5 =
θ = 0,1 φ =01,5 0,σˆ5 0,W 5 =01,5 1
θ>0 0 ≤Xφ=≤FL 1 θ > 0 0
uj
, 5 0,5 1
θ>0 X = FL 1 0,5 0,5 0,5 X 0=,5FL
mierzy się jako logarytmy kwartalnych stóp X wzrostu.= FL Możliwa jest zatem specyfikacja θ > 0 liniowego rów-
1
0 ≤ φ ≤ 1 zależność pomiędzy 0
X = FL stopy 0wzrostu ≤ φ ≤ 1 ,5 1 zmiennej 0,5prognozowa-
0nania ≤ φ ≤opisującego
1 θ y=t(10) ,11=logarytmem ln(0Y(11,t)5y/t(Y 1φ ) 0= ,51miesięcznej
Y,5t / Y0t ,15) W =
1 0,5 0,5
t= 1 )ln0 ( 0 ≤ φ ≤ 1
nej a czynnikami, a następnie agregacja tych równań
y0t ,5= ln1(Yt / Yt 1 )0,5 i przejście do zależności pomiędzy logarytmem y (1)
t 0,5 = ln ( Y / Y
1t t 1 0,5 1 0 )
kwartalnej θ = 0,stopy 1 wzrostuφ = 1a czynnikami. ( 3W)0,5= Przyjęto, 1 (3) że 0y,t(51) =θln=(Y0t ,1/ Yt 1 0) ,5oznacza φ0,=51 logarytm 1 W=
miesięcznej
θ = 0,1 φ =1 W y=t = ln(Y y/ Y = )ln(Yt / Yt 3 ) 0,5
stopy wzrostu zmiennej prognozowanej, ( 3t) t t 3
X = FL y t = ln(Yt / (Y3)t 3 ) mierzy zmiany kwartalne, θ = 0,1 ft to φ y t=(3)1 = ln
wektor k (Yt / YtW 3 )=
0,5 0,5 1
czynników, a równanie zależności pomiędzy yt(1)0a,5 f t 00(1,,5)5yt(1) 0a,5 f ty1ma t
1ln(Yt / Yt 3 )
=postać: (1)
X = FL yt a f t X = FL y t a f t 0,5 0
X = FL y t(1) = ln(Yt / Yt 1 ) yv1t(1) a f t v1
y t = a 0 (+1)yat1 y t=1 a+0 Σ
(1) (1) (1)
+ aA (1) i t t 1(i1) Σ
yf +1+ εt A i f t i +(1)εt
(1) v (1) (1X ) = FL (5) v
= a 0 + a1 y t 1 + Σ A i f t
y t = ln(Yt t / Yt 30 ) 1(1) t 1 iΣ
1
(1) (1)
y (1)
= ln ( Y / Y ) ( 3) y = a + a i y
0 + y A
= lnf ( Y + / Yε v ) y t
y t = a 0 =+0 a1 y t(11) + Σ A i f t(1)i + εt(1)
= t i = 0i t i t t
t 1
y t(1) = lnt (Yt / Yt 1t) t 1
1
i= 0
ε (1)
ε (1)
y t = ln(Y
y = ln (Y / Y )
t / Yt 3 )
( 3 ) t t t 1
natomiast εt(1) jest
i= 0
Σ BiZ
(1)
yt a f t
Σ i = 0i t przyjmuje
( 3) ( 3)
y = b + b i =y 0 + B
t
t i t i (3) t
Z + ε (1)
yvt 1wówczasa f t następującą y t = b 0 + b 1 y t _3 +
Zagregowane równanie v1 prognostyczne tkwartalnych 0 i = 01 tstóp _
wzrostu _ v1 t
y t 0 = a1 0 t+3 a1 yΣ
3 i
t 1 +i Σ
(1)i =+0 b y (_3) + (1) B Z _ + ε (3)
A i fiΣ
( 3) i= 0
y = b i i f t t i + εt
(1)
(1)
y (wyprowadzenie (
= a (+1) a yvt1 1 +wzoru
1 )
f (1i) (1+) εt się w Aneksie 2):
A iznajduje (1 ) t A
ypostać = at 0 + a1 0y t 1 +1 Σ
t
+ εtt εZ
(1) i =20 3
t t = f t + fZ + f f , fb = 3 f a (1
, b + a +
3 a a (1 ) , b ai = 0=+ a a112,) ,Bb01 ==(1A )a01 ,, B
3 v1
B10 == A A 0 +, B a(1)A=0 ,A1 + a
Z t = f t + f t 1 + f t 2 , (1b) 0 = 3a 0 (1 + a1y+t a=12 )a, 0 b+1 a=1 ay1t3Z,1 t+B=0Σf=t AA
= + + = +
+ fε=t 12A
t =t 0 i ( 1 )
i= 0
t 1t tt2 t0 1 t 02 0 1 01 1
+i f t, 1i1B , b+0 =a 3Aa
0 1 1 1
ε (1)
B 2 = A 2 +Ba21 A=1 A Z
+ 2av1+ 2
tA =
a f
A, εB+ f
t + ta1 =
2+f
A A , B ,+ b a =
A= 3A a +(1+ a + a
2
a
AA + a, +
2
B ) a, 2b
i= 0
A == a a ,
3
A ,
B B + a =
=
2
A
a A , 1B , 1 =
εt m +
Σ
(1) t t m t 2 0 0 1 1 1 1 0 20
y t(3) = b0 B+2b1=yA
1
A
0
1 1 2 1 (3) 0
A
2
ε , B
m m 2 1
A
m 1 m
A
1 1 m 2
m 1 2 1
B A
m
=A 1 m 2
, B +1
a m
A
m 1
+ 1
A a 1 m
A , 2B
a a a a a a 1A
( 3)
_
t 32 + + B
1 1i t i1 Z+ _ + 0t m 2 =
εm (1+ ) 1 m 1 + 1 2 m 2(6) m 12 1 = 1 1 1m + 0
2 2
=0 = A + a A + a A , B
m 2 = A m +(3a) 1 A m 1 2+ a1 A m 2 , B m 1 =
2 2iB t
B m = (a3)1 AB m ,m =2 a1 A2m ,
v1
= b0 + b1 y t _ 3 + Σ B i Z t _ i + εtB
v1
Σ
2( 3) 1 1 1 ( 3) 0
ε B A y m = a1 A m ,
( 3) v(13)
y = b + b y + B Z + = a ,
y t(3) = bt 0 + b1 y0 t(_33) +1 Σ
t
ε
_ _
gdzie: t 3
BiZ +i t(3i) t m 1 m v1
2Σ
Zεtt t = f=t +εt f t +ε1 t+(1f+=t 2aε,1tB bε0m+ a)1ε+t) ,a2 1b+y1+(1 ε 3))ε
2
_
i = 0t i ( 3 ) (1 ) ( 3 ) (
)
1 ) (1
=1=(1
)
+3a+ a(110a A+1 )ma+ε,1t a+11 +a+1(1
(1 (1 ) 2 2 ( 1 ) i
(=
= 02 3 (1)
3a) + a ) ε
a ,1t B + +a =(1)yA
2
+( 3)a, +
( 1 )
B+ …1a= +(1))A
2
1B εat1(11t(1
)
+ +a1aA
3_ i ++… εa1t(+ , t(1(11)m)(1
0 a 1 ++ a
t = 1 b + 0 b 1 t ε3
0 ( 3 +)
ε (1)i Z (1 ) εt +1 ++ a1(1
1 t 3
ε t = εt + (1 + a1 ) εt 1 + (1 + a1 + a1 )ε t 2 + (1 + a1 +t a1i =)02εtt 3 + … +3a11 (1
i= 0 1 2 1
( 3) (1) (1) 2t (1) 0 _
= + + )
(1) + a ) , b = a 2 2 , (B 1) = A
Z t = f t + f t 1 + f t 2 , b0 = 3Ba2y0 t(1
(1)
=_1 +Aa2 1++(1a)ay11A
2(1)
) , +b a ε
=2 ( 3) 3 Z (1)= f + f
A a = ,, B Bε t =+ =A(1
t A+ , aB
t +
1 ) +εa
=
(f1) , b = 23a (1
AA
t +
2 (1
+ +a
0+ a a
A A ,
+ 0a 2 + a
)
, ε B 1 + =(11 a+ a
A 1 + + a a 1 ) Aε 0 + , … +
, 1 110 m 12 tym2t(1_1)1
_ t 01 tm0 2 0 m 11 t1 1 m 1 1m 1 1 t m3 1
Z t = f t + f t 1 + f t 2 , b0 = 3a 0 (1 + a1 + a1 )y,t _b11 t =11 a131, 1B 0 = A 0 B1 = A1 + a1 A 0
, 1 1
2
+Zat 2=Af2t, +Bf t 1 +=fA , b0a=A3a 0 (1 + 2a1 + a1 ) ,
B 2 = ,AB2 + a=1 Aa1 A m 1 + a1 A m 2 , B
(1)
B 2 = A 2 + a1 A21 + a12 A 0 , Bamm1 =2 =ba112A =Am0m a +, 1 a=1 A b1m=21y0+t _1a12 A 1 2m 1+ a01 A mm1 ,2
t 2 +
m 1
B 2 = A 2 + a1 A 1 + a1 A 0 , B m 2 = A m + aa11A=mb11 += a01 A m 2 , B m 1 = a1 A m + a1 A m 1 , m 2 m 1
a1 = b1 = 0
a (1)= b B= 0= a 2 A2 , (1) B 2 = A 2 + 2a1 A(11) + a12 A 0 , B m 2 = A(1)m + a1 A
ε tyt = aεtf t +( 3)y(1t + aa1f)tεt1 1 + (1 + a1 +1 a1 m) ε t 2 + (1 + a1 + a1 ) εt 3 (+3)… + a1 (1 + a1 ) ε t m +1 + a
2 ( 3)( 3 )
B =a A , (1) ( 3)
1 m
B m = a1m2 A m , 1 m yt a f t 2
yt a f t
ε ( 32) 1)(1) + (1 + aB)m
(ε ε (1=) a1 A
(1 ma , + a2 2 ()1ε) (1) + (1 + a + a 2 ) ε (1)
ε = ε + (1 + a ) ε + (1t+_1 a +(1a) 1 )ε t 2 +2( (1 + a + ta ) ε t + … + a (1 1 ) ε t m +21 1+ a ε1 t 2
(1) ( 3)
( 3) (1) (1)
y v 2 (1) v
y a f = 1 +t a + (1)+
ε t(3) = εt t(1) + (1t + a1 ) εt(11) 1+ (1t 1+ a1 f+t a=121)Σ i =2+ Σ
2 1 1 t 3
ε tC2 i f+ftt (1 v +εa fC + a ) εtε3 + … + a1 (1 + a1 1 )(ε3)t(1)m1+1 +
) t 21 (1t)(1f ) t 3
a ε (1) 1 t vm2(1)
a1 = b1i =1=f0t = Σ Ci =1i f t i + εvt2 yt _1
t 1 i f t1 i +
ε t = εt + (1 f+t a=1 )Σ (1) 1 t m
εt C + aε1t + a1 ) ε t 2
(f) 2 (1)
i f(1
( f ) (t1)
y (1_) 1 + t i+
yt(1_1) t 1 f t = Σ C i f t i + ε t( f )
i =1 i =1
(1)
Możliwa jest również analiza
a1 = b1 = 0 k =modelu {1, 2, 3,kbez 4=, 5{1}czynnika
yt( 3) a f t k = {1, 2, 3, 14, 5}, av1 ==v1{
}1}, , vb2=1 =={{001,,12}, 3v}2 =y{t 1_1, .2,Wtedy
, 2v, 3=, 4{,0i =5,1autoregresyjnego 3} oczywiście
a1 = b1 = 0 . Pod względem własności formalnych specyfikacja 0(3), 1}niewiele
, v 2 = {1,się 2, 3różni } k = {1, 2, 3, 4, 5}, v1 = {0, 1}
1 od podejścia,
(k3) = {1, 2,( 33) ,( 34 ) , 5}, v = {0a , } = , b = 0 , , 3}(3)
w( 3którym yt( 3) amodeluje ft się bezpośrednią
( 3)
y t + 3hv2zależność
= d 0 h y+t +d ( 3)
1h=y td 0 h++dd
3hpomiędzy 2 h1y xy + d+ dx2 h2tx11+t +εt +d33hh1 x 2tto1+2 także
(h3t )1t t a fft.t3 hPotwierdzają
1 v = { 1 2
εt + 3h symulacyj-
y t + 3h = d 0 h + d1h y t(3) + d 2 h x
Σobui trodzajów ε
( 3)
y )
a f f = C yf + = ε d
( f ) + d y + d x + d x +
net badania t własności prognostycznych t + 3 h 0 h
ymodeli.
1 h t
Wydaje 2 h 1
się
t
( 3) jednak,
+ d 2yht x1że
3 h 2 t
a fopisane
t + 3 h
podejście
t 3 h x 2 t + εt + 3 h
t i t ( 3) ( 3)
εt +3hi =1 ε t + 3h = d 0 h v+ 2 d 1h y t t + d
= Σ C ipomiędzy
v2
f t = Σ C i f t( fi ) + ε t( f ) f t i + ε t miesięcznymiεstopami
jest poprawniejsze
v2 pod względem logicznym, εt +3h gdyż zakładaf tzwiązek
t + 3 h ( f )
Σ
t +3h
fwzrostu C f
zmiennej ε prognozowanej k =a { czynnikami
1 , 2 , 3 , 4 , 5 } obserwowanymi
, v ε { 0 , 1 } , v 1także
{ 1 , 2 ,z3częstotliwością
} v2
miesięczną.
f t = Σczynników
= i 1 + = i ==
C i f t i + ε (t(3k.f)) Licz-
t i t i= t 1 t 3 h 2
(3) +
Ze specyfikacją równania (6)Ywiąże
(3)
się( 3Y
i =1
zagadnienie wyboru optymalnej liczby
k = {1, 2, 3, 4, 5}, v1 = {0, 1}, v 2 =Ytp{1, 2, 3}
tp ) tp
, 1y},(3)v == d{Y10tp,h K
i 1
2 h x1t + d 3 h x 2 t + εt +przez
k = {1,być 2, 3, 4, 5}, v1 = {0mniejsza 2+, 3d}1h y t(3) +(3)d identyfikowanych
=
x 2t + εΣ
t3+h1+ d 3 h x 2tt =Y ( )
t ( 3)
( 3) + 3h t 2 h 1t 3 h 2Y
y t + 3hkryterium
jak = d 0 h + d 1osypiska h yt + d (Onatsky
2 h x1t + d 3 h2009),
t1R
kryteria R 1 informacyjne ((Bai,
3) 2 Ng 2002)( 3oraz ich modyfikacje t
Σ
+ t
+ tp
(Jacobs,
t + 3h
t = R +1 (
( 3)
Yt – Ytp
εt +3h pracy zdecydowano
) → MIN y t + 3h = d 0 h + d1h y t + d 2 h x1t + d 3h x 2t + εt +
) t =
Lτt4, t = R +1 t =Σ
t = R +1
R+P
Yt (3) – wY1Y(3tp)(31–) –Y w( ( 3) Y2
)
( 3) tp
2 –MIN w3Ytp(33) – w4t =YRtp+(314) → MIN ,
Yt (=Σ
t = R +1
R+P
( ( 3)
3) Yt ( 3) –2Ytp
( 3) 2
)
→ MIN (3) 2 tp→
Σ ( ) Δ L,τti = 1, 2,Δ3, t tp
–Y → MIN Ytpi R+P
Σ Yt (3) – Ytp(3) Δ→
R +1
Δ Lτt ( ) Lτt MIN
R +1 tp 2
t = R +1
konieczna
(1)
y t jest (Yt / Yt 1 ) przyszłych
= lnznajomość wartości wektorów czynników w okresie prognozy. Do prognozo-
y t(3) = ln(Yt / Yyt (33)) a f a12 A m ,
B m =autoregresji:
wania tych wartości użyto standardowego modelu
t t wektorowej
y t = ln(Yt / Yt 3 )
( 3)
yt(1) a f t v2
ε (3) = εt(1) + (1 + a1 ) εt(11) + (1 + a1 + a12 )ε t(1)2 + (1 + a1 + a12 ) ε
(1) f t = Σ C i f t i + ε t( f t) (7)
yt a f t i =1v1
y t = a 0 + a1 y t 1 + Σ A i f t i + εyt t _1
(1)
(1) (1) ( 1 )
0 + b1 y t _ 3 + Σ B i Z t _ i + εt ( 3 )
binacjay tych= bparametrów
( 3 ) ( 3 ) była wybierana łącznie, przez wskazanie
(3) i= 0 t
i =1
i modelu z najmniejszym błędem
t i t
t
średniokwadratowym wygasłych i= 0 prognoz Ytp na jeden kwartał poza 2próbę. Wyboru 3
dokonywano dla
Z = f t + f t 1 + f t 2 , b0 = 3a 0 (1k +=a{11,+2a, 13,) ,4,b51 }=, va1 =, B {0, 1}A= , v0 2, =B{11=, 2A, 31}+. a1 A 0 ,
następującego zbioru możliwych wartości t
R+P
parametrów: 1
0
+ a1Σ
2 3
BiorącZpod t = fuwagę
t + ft 1 + f t 2 , binarny
także b = 3a (1 + a1 +Ya(dotyczący (3) ) , b ( 3=
) , BMIN
) 2a części A 0 , B1 = A1 2+ modelu
0 =autoregresyjnej a1 A 0 , (6), łącznie 2
B02 = A 02 parametr A 1 +t a1 12 –AY0 1tp, B m 1→ 2 y= ( 3)A m + a1 A m 1 +( 3a) 1 A m 2 , B m 1 = a1 A m + a1 A m 1 ,
analizowano 60 modeli. 2 t = R + 1 t + 3 h = d 0 h + d 1 h y t + d 2 h x1t + d 3 h x 2 t + εt + 3 h
B 2 = A 2 + a1 A 1 + a1 A 0 B2m 2 = A m + a1 A m 1 + a1 A m 2 B m 1 = a1 A m + a12 A m 1 ,
, 2
,
B m = a1 A m , (3)
Ytpi , i = 1, 2, 3, 4,εt +3h
2
B m = a1 A m ,
3.3. Modele wskaźników = εt(1) + R(1
ε t(3) wyprzedzających +P
+ a1 ) εt(11) + (1 + a1 + a12 ) ε t(1)2 + (1 + a1 + a12 ) εt(1)3 + … + a1 (1 + a1 ) ε t(1)m +1 + a12 ε
ε t(3) = εt(1) + (1 + a1 ) εyt(1(1)1_)+ (1 + a1 Σ ( )
2 ( 3) (1– ) w Y ( 3) –Yw( 3 )Y2( 3) (– ( 3) ( 3) 2 (1)
+ aY 1 t) ε t 2 +1(1tp+ 1 a1 + tp 2a1tp)2 εt 3w+3Y
1)
… tp 3+ –a1w (14Y+tp 4a1 ) ε→ MIN ,2 (1)
t m + 1 + a1 ε t m
t 1 t = R +1
Wskaźniki wyprzedzające to zmienne, których zmiany w okresie R+P t pozwalają prognozować kształtowa-
yt(1_1)
Σ( )
2
a =
nie się badanych zmiennych.1W literaturze b 1 = 0 Δ Lmożna Y
wyróżnić dwat zasadnicze
( 3)
– Ytp( 3) → MINbadań w tym zakre-
nurty
τt
t = R +1
sie. W pierwszym
a1 = b1 = 0 wskaźnikami ( 3)
wyprzedzającymi są najczęściej pojedyncze zmienne ekonomiczne (zob.
y af
Estrella, Mishkin 1998; McGuckin, tOzyildirim,
t Zarnowitz
ˆ 1 Z Y2000).
(3)
, i =W1,drugim
2, 3, 4, podejściu jako wskaźniki
( 3) χ2 = PZ Ω tpi
yt a f t stosowane są zmienne
wyprzedzające v2 syntetyczne, będące kombinacjami wielu innych zmiennych (zob.
Bai, Ng 2008). Ponieważ tof tdrugie
= CpodejścieΣ
i f t i + ε t w istocie
(f)
nieR +różni
P
się od metod czynnikowych, w niniej- 2
Σ( )
R+P
1 Yt (3) – w1Ytp(31) – w2Ytp(32) – w3Ytp(33) – w4Ytp(34) → MIN ,
Σ
v2
Σ Δ
i =1
ft = Cift i + ε t
szej pracy wybrano podejście
( f ) tradycyjne. Z = L H
τt t =t R +1
P t = R +1
Do prognozowania
i =1 wykorzystywano
k = {1, 2, 3, 4, modele5}, v =o{0postaci:
, 1}, v = {1, 2, 3}
1 2
Δ Lτt
k = {1, 2, 3, 4, 5}, v1 = ({30) , 1}, v 2 =Δ{L1τ,t H 2, t3}
y t + 3h = d 0 h + d1h y t(3) + d 2 h x1t + d 3h x 2t + εt + 3h (8)
y t + 3h = d 0 h + d1h y t + d 2 h x1t + d 3h x 2t +∞εt + 3h
( 3) ( 3)
( P → ) χ = PZ Ω Z
2 ˆ 1
gdzie x1 oraz x2 oznaczają główne εt +3h zmienne, opisane w tabeli 1, d są szacowanymi parametrami, nato-
ih
miast εt +3h jest składnikiem losowym. H t = 1 1
R+P
Ytp(3) Lit
Z= Σ Δ Lτt H t
P t = R +1
Powyższe
Ytp ( 3 ) modele szacowano R+P
oddzielnie dla każdego rozpatrywanego horyzontu prognoz, stosując
Σ ( ) → MIN (l ) –Δmin
) 2 Lτt H t (l )
standardową metodę najmniejszych Yt – kwadratów.
( 3)
Ytp(3m X it , l = 1, 2, …, Lit
R+P 1it = max X it
Σ
Procedura ( 3) selekcji
( 3) 2 głównych zmiennych przebiegała dwuetapowo. Najpierw ze zbioru wszystkich
(Y t
– Ytp ) →
t = R +1
MIN
l
( P
l
→ ∞ )
potencjalnych zmiennych objaśniających
t = R +1
Ytpi(3) , i = 1, 2, 3,wybrano 4, te, co do których podejrzewano, że mogą mieć cha-
1wskazanoLit
1 L1it (kolumna
Σ Σ
rakter wskaźników wyprzedzających. Zmienne
m = te ( X ( l ) w tabeli
– )X
2 5 z Aneksu
, X X it(l ) LI). Były
Y (3)
, i = 1, 2, 3, 4, R + P 2 it Hit t = 1 it it =
to przede wszystkim syntetyczne
tpi wskaźniki L
wyprzedzające, miesięczne L
zmienne it l opisujące dynamikę
Σ
l =1 1
Σ ( )
( 3) ( 3) t = R +1( 3) ( 3) ( 3) 2
nie analizowanoY – w Ywłasności
– w Y w
prognostyczne
– Y – w Y
możliwych → MIN ,
dwuelementowych 1 T kombinacji tych zmiennych.
TX itΣ
t 1 tp 1 2 tp 2 3 tp 3 4 tp 4
m = max m m = ( l ) m 2 it
Ostatecznie do opracowania Δ Lprognoz wybierano i te, które dawały
2najmniejsze błędy X it(średniokwadratowe
t = R +1 l)
τt
1i 1it m1it = max i
t =1
– min , l = 1, 2, …, Lit
l l
Δ Lτt
ˆ 1Z
χ2 = PZ Ω 1 Lit
1 Lit
Σ (X ) ΣX
(l ) 2 (l )
m2it = – X it , X it =
ˆ 1Z
χ2 = PZ Ω Lit l =1
it
Lit l 1
it
R+P
1
R+P
Z= Σ Δ Lτt H t
i= 0
εt(1)
y t(3) = ln(Yt / Yt 3 ) yt(1) a f t
εt(1)
yt(1) a f t v1
y t(1) = a 0 + a1 y t(11) + Σ A i f t i + εt(1)
v1
y t = b0 + b1 y t(_33)(3+) Σ B i Z t _ i (+3) εt(3) v1
( 3)
i= 0 ε (1)
Z t = f t + f t 1 + f t 2 , b0 = 3a 0 (1 + a1 + a12 ) , b1 t= a13 , B 02 = A 0 , B31 = A1 + a1 A 0 ,
εt(1) Z t = f t + f t 1 + f t 2 , b0 = 3a 0 (1 + a1 + a1 ) , b1 = a1 , B 0 = A 0 , B1 = A1 + a1 A 0
na jeden kwartał poza próbę.
B 2 =Dodatkowe
A 2 + a1 A 1 badania + a12 A 0 ,symulacyjne
B m 2 = A2 m wskazały, + a1 A m (13)że + arozszerzanie równania
v1 (8)a 2 (A
Σ
2
y = 1 A+mb2 ,y (B
b 3)
_ 3 m+1
= a1 A m +
2B i Z t _ i + ε 1 3) m 1 ,
o opóźnione realizacje głównych zmiennych B 2 = nie A 2 prowadziło
+a v1 1 A 1 + a 1
do
A 0
istotnego
, B m 2
t = zwiększenia
A m
0 + a 1
1 A t
m 1
zdolności
+ a 1 A m
pro-
2 , B m
t = a A + a2A
1 1 m 1
i= 0
Σ B i Z t _ i + εt
2( 3)
gnostycznych modeli. B m = ay1t A=m ,b0 + b1 y t _ 3 + ( 3 ) (3 )
Σ Ccząstkowych,
t
i =1 t _1
f = ift i + ε t
(f) a1 = b1 = 0
równe wagi. Biorąc pod uwagę jakość prognoz t
i =1
badano także jakość prognoz łączonych,
w których nie uwzględniano
k = {1modeli, a21, =3,b41VAR
,=5}0, oraz
v1 = {BVAR.
0, 1}, vUzyskane
2 = {1, 2, 3}
wyniki yt( 3porównywano
)
a ft z prognozami
otrzymanymi przy zastosowaniu optymalnych k = {1, 2wag , 3, 4ex, 5post.
}, v1Dzięki
= {0, 1temu
}, v 2 można = {1, 2,było 3} ocenić, na ile wy-
( 3)
a f t ywag
y t(+33) h =ytdrównych 2 t + εt + 3 h
( 3)
0h + d d 2 h x1t + dod
+odbiegają 3( 3h)xnajlepszego
v2
niki uzyskane przy zastosowaniu wyniku, który( fmożna byłoby
Σ ε )
1h ( 3)t
y t + 3h = dwagi.
0 h + d 1h y t + d 2 h x1t f+t =d 3h x 2C i f tεit ++
t +
osiągnąć w danej próbie, optymalniev2 dobierając i =1
3h t
Σ ( ) 2
χ = PZ Ω Z 2
2 ˆ 1
Yt (3) – w1Ytp(31) – w2Ytp(32) – w3Ytp(33) – w4Ytp(34) → MI
R+P χ = PZ Ω Z ˆ 1
t = R +1
Σ ( )
2
Y (3) – w1Ytp(31) – w2Ytp(32) – w3Ytp(33) – w4Ytp(34) → MIN ,
R+Pt (10)
1t = R +1
Z= Σ τt Z t= 1 Δ L H
Δ L H R+P Δ L τt
P t = R +1
Δ Lτt Σ
P t = R +1
τt t
Δ Lτt H t
gdzie wi reprezentują wagi. χ2 = PZ Ω ˆ 1Z
Δ Lτ1t H t
χ2 = PZ Ω ˆ Z
Rozwiązanie problemu
( P →(10) ∞ )jest tożsame ze znalezieniem ocen parametrów liniowego modelu eko-
R+P
1
nometrycznego bez wyrazu wolnego,Rw (+P
P →
którym ∞ ) jako wartości zmiennej
Z = Σ
objaśnianej
Δ Lτt H t
P t = R +1 występują rzeczy-
1
H = 1
wiste realizacje zmiennejt prognozowanej,
Z= Σ Δ L=aτt1H
P t = RH+1t były
jakot
zmienne objaśniające – prognozy uzyskane różnymi
metodami. Innymi słowyL wagi dobierane w taki sposób, by przyΔdanych Lτt H t prognozach cząstkowych
it
błąd średniokwadratowy prognoz Δ Lτt H wygasłych Lit był jak najmniejszy.
t
(P →∞)
m1it = max X it(l ) – min X it(l ) , l(l=) 1, 2, …,(l L it
( P l→ ∞ )m1it =l max X it – min l
X it ) , l H = 1,=2, 1 …, Lit
l t
y t(3) = ln(Yt / Yt 3 )
4. Metodologiayt(1badania
)
a ft
v1
4.1. Schemat prognostyczny
y t(1) = a 0 + a1 y t(11) + ΣA f + εt
(1)
i t i
i= 0
Podstawą oceny zdolności prognostycznych rozważanych modeli był błąd średniokwadratowy pro-
εt(1)
gnoz wygasłych dla horyzontu τ = 1, 2, 3, 4 kwartały. Kryterium to jest bardzo popularne i stosowane
w wielu opracowaniach. Wyniki prezentowane v1 w niniejszej pracy dotyczą rolowanego schematu pro-
Σ t i + ε
( 3) ( 3) (3)
y
gnozowania (ang. rolling
t = b0 + b
scheme), y
1 tw _ + B
3 którymi liczbaZ _ obserwacji
t wykorzystywanych do szacowania para-
i= 0
metrów modeli jest stała i oznaczana przez R. Wydaje się, że takie podejście jest bardziej uzasadnione
od schematu rekursywnego (ang. recursive scheme) ze zwiększającą się liczebnością próby estymacyjnej
Z = f t + f t 1 + f t 2 , b0 = 3a 0 (1 + a1 + a12 ) , b1 = a13 , B 0 = A 0 , B1 = A1 + a1 A 0 ,
ze względu na ciągłet zmiany strukturalne zachodzące w polskiej gospodarce. Badania, których wyniki
przedstawiono w podrozdziale
B 2 = A 2 + a5.4, wskazały,2 że stosowanie schematu rekursywnego2 w większości2 przy-
1 A 1 + a1 A 0 , B m 2 = A m + a1 A m 1 + a1 A m 2 , B m 1 = a1 A m + a1 A m 1 ,
padków nie prowadziło do istotnego zmniejszania się błędów prognoz.
B m = a12liczby
Z powodu niewielkiej A m , obserwacji prognozowanych zmiennych rozważano próby estymacyj-
ne liczące 20 oraz 30(3)obserwacji kwartalnych, czyli liczba obserwacji miesięcznych wynosiła R = 60 oraz
ε t = εt(1) + (1 + a1 ) εt(11) + (1 + a1 + a12 )ε t(1)2 + (1 + a1 + a12 ) εt(1)3 + … + a1 (1 + a1 ) ε t(1)m +1 + a12 ε t(1)m
R = 90. W pierwszym przypadku ocena prognoz obejmowała okres od II kwartału 2004 do II kwartału
2013 r., w drugim natomiast
yt(1_1) okres od IV kwartału 2006 do II kwartału 2013 r. W przypadku krótszych
prób estymacyjnych liczba postawionych prognoz była równa P = 102, a dla prób dłuższych P = 72. Po-
a1 = b1 = 0zawsze z zachowaniem struktury dostępnych informacji na końcu próby
szczególne próby tworzono
w danym momencie, za każdym razem cofając się o jeden miesiąc. Uwzględniano też relację pomię-
yt( 3) a f t
dzy dostępnością danych miesięcznych oraz kwartalnych. W zależności od miesiąca dostępne były dane
z jednego, dwóch lub trzech v miesięcy z kwartału następującego po ostatnim kwartale, z którego po-
Σ
2
ift i + ε t
(f)
chodziły dostępnef t dane
= oCzmiennych prognozowanych. Można więc powiedzieć, że dane miesięczne
i =1
wyprzedzały dane kwartalne o jeden, dwa lub trzy miesiące. Takie podejście miało na celu odwzorowa-
nie rzeczywistej sytuacji,
k = {1, 2z, 3którą , 4, 5ma }, vdo czynienia, badacz opracowujący prognozy w każdym miesiącu.
1 = {0, 1} v 2 = {1, 2, 3}
Należy jeszcze zaznaczyć, że najlepsze modele z każdej grupy były wybierane ze względu na błąd
średniokwadratowy y t(+3prognoz
)
3h = d 0 h na + djeden ( 3)
1h y t kwartał
+ d 2 h x1do d 3 h x 2 t + εt + 3 h
t + przodu.
εt +3h
4.2. Testy zdolności prognostycznych
Ytp(3)
Do badania istotnościR + P zaobserwowanych różnic między zdolnościami prognostycznymi stosowano test
Σ( )3) 2
Diebolda i Mariano (Diebold,Yt (3) – Ytp(Mariano
→ MIN
1995) oraz test warunkowej zdolności prognostycznej CPA (ang.
conditional predictive ability) opracowany przez Giacominiego i White’a (2006). Poniżej krótko omówio-
t = R +1
Σ( )
2
Yt (3) – w1Ytp(31) – w2Ytp(32) – w3Ytp(33) – w4Ytp(34) → MIN ,
odpowiedzieć na pytanie, czy po wprowadzeniu określonej informacji dodatkowej jeden z modeli
t = R +1
rzeczywiście będzie generował lepsze prognozy.
Jeżeli przez Δ Lτt oznaczyć różnicę między kwadratami błędów prognoz wygasłych o horyzoncie τ,
uzyskanych za pomocą dwóch różnych modeli w okresie t, natomiast przez Ht – h-elementowy wektor
informacji dodatkowej
χ2 = Pdostępnej
ZΩ ˆ 1 Z w momencie formułowania prognoz, to statystyka testowa testu CPA
przyjmuje postać:
R+P
1
Z= Σ Δ Lτt H t
P t = R +1
Δ Lτt H t
Ytpi(3) , i = 1, 2, 3, 4, B 2 = A 2 + a1 A 1 + a1 A 0 , B m 2 = A m + 2a1 A m 1 + a3 1 A m 2R,+ PB m 1 = a1 A m + a1 A m 1 ,
3, +4,a1R++ Pa1 ) , b1 = a1 , B 0 = A 0Y, (B
Σ
Z t = f t + f t 1 + fYt tpi(23,) ,bi0==1,3a2,0 (1 3) = A ( 3+ ) a A , ( 3)
R+P ( 1– w Y1 –1w20Ytp2 2 – w3Ytp 3
(3
t = R +1
Σ
t = R +1
(t 1 tp1 2 tp( 32) 3(1) tp 3
( )
a(312) A2 0→
ε t = ε2t + (1 +Σa1 ) tεt 1 + (11 +tp1a1 + a21 )tpε2t 2 + (1
4 tp 4( 3(1) )
Y –
, BMIN
w Y
m 2
( 3)
– w
m 1 a1 A m 1 + a1 A m 2 , B
R ++
2Y ( 3)(1)– w Y ( 3) – w Y
3 tp +3 a1 + a ) 2 m 1
2 ( 3) (1) → MIN ,
4 1 tp
= a1 A m + a1 A m 1 ,
)4εΔt L3 τ+t … + a1 (1 + a1 ) ε t(1)m +1 + a12 ε t(
Δ Lτt B m
Dokładność
= a 1 A m , wybranych
t = R +1 metod prognozowania...
Δ Lτt 173
Δ Lτt
(1)
y _
t 1
ε t(3) = εt(1) + (1 +ΔaL1 )τtεt(11) + (1 + a1 + a12 2)ε t(1)2 + (1 +1a1 + a12 ) εχt(21)3=+P… Z+Ω ˆa 1(1
1 Z + a1 ) ε t m + 1 + a1 ε t
(1) 2 (
χ = PZ Ω Z
2 ˆ 1
a1 = b1 = 0 χ = PZ Ω Z ˆ
χ2 = PZ Ω ˆ 1Z yt(1_1)
χ = PZ Ω ˆ Z 1
R+P
Σ Δ(11)Lτt H t
2 1
R+P y ( 3)
a f 1
R+P Z =
Σ
1
Σ1 Δ
t t
Z= Δ L R +H P a = b = 0 Z = L H P t = R +1
gdzie PZt ==R +1 Σ Δ Lτt H t , natomiast
τ t t 1 1 τ t t
v2 Ω̂ oznacza oszacowanie 1
R+P
macierzy kowariancji P t = R +1 wektorów o postaci
P t = R +1 f yt t= Σ
( 3 ) C
a ft i t i f + ε Z ( f= )
Σ
P t = R +1
Δ L τ t H t
Δ Lτt H t
Δ Lτt H t
Δ Lτt H t , uzyskane metodą Neweya
t
i =1 i Westa.
Δ Lτt H t (P →∞)
4, 5}Δ, (Lvf τ)t H
v2
fkt =={liczbie1Σ , 2C , 3i f,porównywanych
t i + εt 1
= t{0, 1}prognoz
, v 2 = {1(,P2,→ 3}∞ ) , statystyka testowa ma roz-
(P → ∞)
Asymptotycznie, przy dużej
kład χ(2 P ∞)
z h→stopniami swobody.(3W
i =1
) przypadku braku ( 3) warunkowej informacji dodatkowej H t = 1 . Wtedy
H = 1 y t + 3h = d 0 h + d 1h y t
(P → +∞d)2 h x1t + d 3h xH 2 t + =εt1+ 3 h
teżt test CPA jest tożsamy z testem k = {1, 2Diebolda , 3, 4, 5},i vMariano. = {0, 1}Test , v 2 =Giacominiego
{1, 2t, 3} i White’a może być stoso-
Ht = 1 1 Lit
wany
Lit w przypadku rolowanego εt +(33schematu prognozowania.
H t ( 3)= 1 Dla schematuL it
rekursywnego asymptotyczny
3 h x 2 t + εt + 3 h wartości krytycznych testu( l )
)h
rozkładLstatystyki testowej niey tjest = d 0 h +W
+ 3 h znany.
d1takiej
h yt d 2 h x1t +dodwyznaczenia
+sytuacji
it
Lit m (l=) max X it – min X it(l ) , l = 1,
można wykorzystać (l )
m1it = max X it min X it Y – metody ( l ) bootstrapowe.
, l = 1, 2, …, Lit
( 3 ) Test bezwarunkowy wskazuje,
m = max któreX ( l )podejście1itgenerowało
– min X it , l =l 1, 2, …, Ll it
dokładniejsze prognozy. εtp l ) uznać, że powinno także wskazywać, 1it it
m1itl = max X it(l ) – Można
min tX+3it(hwięc , l = 1, 2, …, Lit (l )
l
które podejściel
będzie lep-
l l m = max X – min X it(l ) , l = 1, 2, …, Lit
sze w pewnym, bliżej nieokreślonym momencie w przyszłości. Test
l względny odpowiada natomiast 1 na Lit
Σ
R P 1 it it
( )
+
Σ
2
) ( )
1 ( 3 )Y ( 3) – Y ( 3)Lit → MIN
1
2 l
1 Lit m =2
( l ) prognoz wyga- 1 it
X (lL)it – X(lit) , X it
Σ Lit Σ
Lit
Lit Σ Lit Σ
( )
it it 2
it R P it it it
+
X it(l ) – X it , X it = X it(l )
Σ
( 3)3,2L 1=
l =1
(
Ytpi(3) Y , it (3=) –1,Y2, ) 4, →l MIN 1 T
T Σ
tp l =1 l 1
t = R +1 T
1 m = max1 1it m
T m =
m 2i R=+ P(3) Σ m 2i = i Σ m 2it
1i 2i
m max m1it sekwencyjnego
1i = Wpływ m12itT (3) m1i =(3max m1it
4.3. ( 3) odsezonowania zmiennych
Σ
t =1
m1ii = max m1it Ytpi (
mTY2i,tt =i=1=–1,wΣ Ym
12, tp3,
( 3)
– w2Ytp 2 – w3Ytp 3 – w4Ytp 4 1→TMIN ,
12 it4,
( 3)
) ) 2i
T t =1
i t = R +1 T t =1 m1i = max m1it m 2i = Σ m 2it
i T 1
Należy zaznaczyć, że w pracy R + P każdorazowo nie dokonywano odsezonowaniat =szeregów czasowych, lecz
Σ ( ) ( 3) 2
Δ L Y ( 3)
– w Y ( 3)
badano szereg już wcześniej pozbawiony sezonowości. Pod tym względem badanie różniło się od rze-
τt t 1 tp 1 – w 2 Y ( 3)
tp 2 – w 3 Y ( 3)
tp 3 – w 4 Y tp 4 → MIN ,
t = R +1
czywistych sytuacji. Sekwencyjne dodawanie kolejnych obserwacji zmienia nieco wartości odsezonowa-
χΔ2 L=τt PZnaΩ
nych obserwacji, co może wpływać ˆ zdolności
1
Z prognostyczne omawianych metod.
Aby ocenić skalę wahań wartości obserwacji w wyniku sekwencyjnego odsezonowania szeregów,
R+P
1
Σ
przeprowadzono następującą2 analizę. ˆΔDla
1 każdej zmiennej dokonywano sekwencyjnego odsezonowa-
χ == PZ Ω
Z LZτt H t
nia, za każdym razem dodając naPkońcu t = R +1 próby jedną obserwację. Stosowano procedurę TRAMO/SEATS
z automatyczną identyfikacją modeli R + P(RSA = 4; zob. Gomez, Maravall 1998). Następnie każdy odsezo-
1
nowany szereg sprowadzono Δ
ZLdo=τt Hpostaci
t
P t = R +1
Δ Lstacjonarnej
τt H t Σ
oraz zestandaryzowano. W rezultacie dla każdej
zmiennej i oraz obserwacji t uzyskano Lit wartości z usuniętą sezonowością. Liczba ta zależy od tego,
(P →∞)
jaką długość ma cały szeregΔiLjaką
τt H t
pozycję zajmuje w nim dana obserwacja. W zasadzie im późniejsza
obserwacja, tym mniej obliczano
H t = 1dla niej wartości odsezonowanych. W dalszej kolejności dla każdej ob-
( P → ∞ różnicę:
serwacji wyznaczano maksymalną )
Lit
Ht = 1
mL1it = max X it(l ) – min X it(l ) , l = 1, 2, …, Lit (12)
it l l
1 Lit
1 Lit
Σ ( ) ΣX (13)
2
m2it = X it(l ) – X it , XTit = (l )
1 it
m1i = maxLmit l =1
1it m 2i = Σ m 2itLit l 1
i T t =1
1 T
m1i = max m1it
i
m 2i =
T Σm
t =1
2 it
Lit
1 Lit
1 Lit (l )
Σ (X Lit Σ
)
(l ) 2
m2it = it X it
– X it , X it =
l =1Lit l 1
Na koniec dla każdej zmiennej wyznaczono maksymalną wartość m1it oraz średnią wartość m2it :
1 T
m1i = max m1it
i
m 2i =
T Σm
t =1
2 it (14)
Miary te wskazują więc maksymalną różnicę oraz średnie odchylenie standardowe poszczególnych
obserwacji spowodowane sekwencyjnym odsezonowaniem, mierzone w stosunku do odchylenia stan-
dardowego szeregu odsezonowanego, pozbawionego trendu oraz zestandaryzowanego.
5. Wyniki
Aby ocenić, czy napływ nowych danych miesięcznych poprawia zdolności prognostyczne modeli, ana-
lizowano przeciętną dokładność prognoz osobno dla trzech możliwych wartości wyprzedzeń danych
miesięcznych względem danych kwartalnych. Wyniki badań znajdują się w tabelach 7−9. Widać, że
różnice pomiędzy modelami przy różnej liczbie wyprzedzeń są bardzo niewielkie. Świadczy to, że na-
pływ nowych danych miesięcznych nie prowadził do poprawy zdolności prognostycznych analizowa-
nych modeli.
176 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis
Należy zaznaczyć, że przedstawione wyniki dotyczą modeli najlepszych z punktu widzenia zdol-
ności prognostycznych dla wszystkich wyprzedzeń łącznie, a więc tych samych modeli, co w tabeli 2.
Powyższy wniosek nie zmieniłby się jednak, gdyby do porównań wzięto modele dające najlepsze pro-
gnozy dla danego wyprzedzenia.
W tabeli 3 zestawiono średnie błędy prognoz uzyskane przy zastosowaniu rekursywnego schematu
prognozowania. Porównując je z wynikami zawartymi w tabeli 2, trudno sformułować jednoznacz-
ną odpowiedź na pytanie postawione w tytule podrozdziału. Widać jedynie, że schemat rekursywny
wyraźnie poprawiał zdolności prognostyczne modeli VAR. Poprawa ta nastąpiła prawie we wszystkich
analizowanych przypadkach. Można także zauważyć również, że gdy prognozowano dynamikę wy-
nagrodzeń za pomocą schematu rolowanego z próbą R = 60 obserwacji, wszystkie metody generowały
mniej dokładne prognozy, niż gdy stosowano schemat rekursywny. Z drugiej jednak strony, jeśliby brać
pod uwagę prognozy na jeden kwartał do przodu uzyskane za pomocą najlepszych modeli łączonych
(DF + LI), to poza wspomnianym powyżej przypadkiem schemat rolowany dawał lepsze wyniki bądź
takie same.
Gdy ocenia się, jak długość próby estymacyjnej w schemacie rolowanym wpływa na jakość prognoz, nie
można bezpośrednio porównywać rezultatów zestawionych w tabeli 2. Odmienne były bowiem okresy
weryfikacji prognoz dla prób liczących 60 oraz 90 obserwacji miesięcznych. W celu zapewnienia porów-
nywalności prognozy wyznaczane na podstawie krótszych prób poddano ocenie w tym samym okresie,
jaki stosowano przy próbach dłuższych. Wyniki takich analiz przedstawiono w tabeli 4.
Wyraźną różnicę w dokładności prognoz widać jedynie w przypadku dynamiki wynagrodzeń.
Wszystkie modele generowały tu dokładniejsze prognozy, jeżeli do oszacowania ich parametrów wyko-
rzystano dłuższe próby. W przypadku dwóch pozostałych zmiennych zróżnicowanie dokładności pro-
gnoz nie jest już tak wyraźne. Warto jednak odnotować, że prognozy otrzymywane za pomocą modeli
łączonych DF + LI prawie zawsze były dokładniejsze, gdy stosowano dłuższe próby.
W tabeli 6 dla każdej zmiennej zestawiono wartości statystyk m1 oraz m2, oceniających poziom wahań
poszczególnych obserwacji występujących w wyniku sekwencyjnego odsezonowania zmiennych. Moż-
na zauważyć, że zastosowana procedura eliminacji wahań sezonowych przy dodawaniu kolejnych ob-
serwacji na końcach szeregów w niektórych przypadkach powodowała dość duże wahania wartości po-
szczególnych obserwacji. Maksymalne różnice między wartościami większości zmiennych przekraczały
odchylenie standardowe szeregu, czasami nawet kilkakrotnie. Jednocześnie wahania średnie stanowiły
zwykle około kilkunastu procent wahań badanej zmiennej, co należy uznać za wynik umiarkowany.
Dokładność wybranych metod prognozowania... 177
Wahania zmiennych prognozowanych były nieco wyższe niż większości omawianych zmiennych. Mak-
symalne różnice przekraczały trzykrotność standardowych odchyleń szeregów, a uśrednione stanowiły
około 20% zmienności.
Powyższe rezultaty wskazują, że przyjęta metoda oraz sekwencyjność odsezonowania szeregów
wywołują ich wahania, których nie można ignorować. Na podstawie przeprowadzonych analiz trud-
no jednak ocenić, jaki jest wpływ tych czynników na zdolności prognostyczne rozpatrywanych modeli.
W tym zakresie potrzebne są dalsze badania.
6. Podsumowanie
Bibliografia
Alessi L., Barigozzi M., Capasso M. (2010), Improved penalization for determining the number of
factors in approximate factor models, Statistics and Probability Letters, 80(23−24), 1806−1813.
Angelini E., Camba-Mendez G., Giannone D., Runstler G., Reichlin L. (2011), Short-term forecasts of
euro area GDP growth, Econometrics Journal, 41(1), C25−C44.
Bai J., Ng S. (2002), Determining the number of factors in approximate factor models, Econometrica,
70(1), 191−221.
178 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis
Bai J., Ng S. (2008), Forecasting economic time series using targeted predictors, Journal of Econometrics,
146, 304−317.
Banerjee A., Marcellino M., Masten I. (2005), Leading indicators for euro-area inflation and GDP
growth, Oxford Bulletin of Economics and Statistics, 67, Supplement, 785−813.
Bańbura M., Giannone D., Reichlin L. (2010), Large Bayesian vector auto regressions, Journal of Applied
Econometrics, 25(1), 71−92.
Baranowski P., Leszczyńska A., Szafrański G. (2010), Krótkookresowe prognozowanie inflacji z użyciem
modeli czynnikowych, Bank i Kredyt, nr 41(4), 28−44.
Barhoumi K., Benk S., Cristadoro R., Den Reijer A., Jakaitiene A., Jelonek P., Rua A., Ruth K.,
Van Nieuwenhuyze C., Runstler G. (2008), Short-term forecasting of GDP using large monthly datasets:
a p seudo r eal-time f orecast e valuation e xercise, Working Paper Research, 133, National Bank
of Belgium.
Boivin J., Ng S. (2005) Understanding and comparing factor-based forecasts, International J ournal o f
Central Banking, 1(3), 117−151.
Boivin J., Ng S. (2006), Are more data always better for factor analysis? Journal of Econometrics, 132(1),
169−194.
Christoffel K., Warne A., Coenen G. (2010), Forecasting with DSGE models, ECB Working Paper Series,
1185.
Cichocki S., Saczuk K., Strzelecki P., Tyrowicz J., Wyszyński R. (2013), Kwartalny raport o r ynku pracy –
I kwartał 2013 r., Narodowy Bank Polski, Warszawa.
Diebold F.X., Mariano R.S. (1995), Comparing predictive accuracy, Journal o f B usiness & E conomic
Statistics, 13(3), 253−263.
Doan T., Litterman R., Sims C. (1984), Forecasting and conditional projections using a realistic prior
distribution, Econometric Reviews, 3, 1−100.
Eickmeier S., Ziegler C. (2008), How successful are dynamic factor models at forecasting output and
inflation? A meta-analytic approach, Journal of Forecasting, 27(3), 237−265.
Estrella A., Mishkin F.S. (1998), Predicting U.S. recessions: financial variables as leading indicators,
The Review of Economics and Statistics, 80(1), 45−61.
Giacomini R., White H. (2006), Tests of conditional predictive ability, Econometrica, 74(6), 1545−1578.
Giannone D., Reichlin L., Small D. (2008), Nowcasting: the real-time informational content of
macroeconomic data, Journal of Monetary Economics, 55(4), 665−676.
Gomez V., Maravall A. (1998), Programs TRAMO and SEATS. Instructions for the u ser, http://www.bde.
es/f/webbde/SES/servicio/software/tramo/manualdos.pdf.
Gupta R., Kabundi A., Miller S., Uwilingiye J. (2011), Using large data sets to forecast sectoral employment,
Working Papers, 2011-02, University of Connecticut, Department of Economics.
GUS (2008), Zasady m etodyczne s tatystyki r ynku p racy i w ynagrodzeń, Główny Urząd Statystyczny,
Warszawa.
GUS (2010), Zatrudnienie i w ynagrodzenia w g ospodarce n arodowej w I k wartale 2 010, I nformacje
i opracowania statystyczne GUS, Warszawa.
GUS (2013), Aktywność e konomiczna l udności P olski. I k wartał 2 013, Główny Urząd Statystyczny,
Warszawa.
Jacobs J., Otter P. (2008), Determining the number of factors and lag order in dynamic factor models:
a minimum entropy approach, Econometric Reviews, 26(4−6), 385−397.
Dokładność wybranych metod prognozowania... 179
Koop G., Korobilis D. (2011), UK macroeconomic forecasting with many predictors: Which models
forecast best and when do they do so?, Economic Modelling, 28(5), 2307−2318.
Marcellino M., Stock J.H., Watson M.W. (2003), Macroeconomic forecasting in the euro area: country
specific versus area-wide information, European Economic Review, 47(S1), 755−783.
McGuckin R.H., Ozyildirim A., Zarnowitz V. (2000), The composite index of leading economic indicators:
How t o m ake i t m ore t imely, Economics Program Working Paper Series, #08-01, The Conference
Board, http://www.conference-board.org/economics.
Onatsky A. (2009), Testing hypothesis about the number of factors in large factor models, Econometrica,
77(5), 1447−1479.
Rapach D.E., Strauss J.K. (2008), Forecasting US employment growth using forecast combining methods,
Journal of Forecasting, 27(1), 75−93.
Rapach D.E., Strauss J.K. (2012), Forecasting US state-level employment growth: an amalgamation
approach, International Journal of Forecasting, 28(2), 315−327.
Siliverstovs B. (2013), Do business tendency surveys help in forecasting employment?: A real-time
evidence for Switzerland, OECD J ournal: J ournal o f B usiness C ycle M easurement a nd A nalysis,
DOI 10.1787/jbcma-2013-5k4bxlxjkd32.
Stock J.H., Watson M.W. (1998), Diffusion indexes, NBER Working Papers, 6702.
Stock J.H., Watson M.W. (1999), Forecasting inflation, Journal of Monetary Economics, 44(2), 293−335.
Podziękowania
Summary
The aim of the paper is to analyse accuracy of selected methods used for forecasting variables
describing labour market in Poland in years 1998−2013. We focus on quarterly data on employment
in national economy published by National Statistical Office, employment according to the Labour
Force Survey and average monthly wages and salaries in national economy. We compare classical and
Bayesian VAR models, dynamic factor models, leading indicators as well as combined methods. The
results show that for the most cases the best forecasts in terms of mean square errors were generated by
averaging forecasts from factor models and leading indicator models. The individual models from these
two classes outperform autoregression models. Moreover we find no evidence that availability of more
recent monthly data in a given quarter improves forecasting abilities of the methods for that quarter.
Keywords: forecasting, job market, dynamic factor models, leading economic indices, pooled forecasts
Dokładność wybranych metod prognozowania... 181
Aneks 1
Wykres 1
Kwartalna dynamika wynagrodzeń w gospodarce narodowej według GUS
pkt proc.
4
3
Dynamika
2011
1998
1999
2000
2001
2002
2003
2005
2006
2007
2008
2009
2010
2012
2004
Wykres 2
Kwartalna dynamika pracujących wg BAEL i pracujących w gospodarce narodowej według GUS
pkt proc.
2
1
Dynamika
-1
-2
-3
-4
2011
1998
1999
2000
2001
2002
2003
2005
2006
2007
2008
2009
2010
2012
2004
Rysunek 3
Wygładzone absolutne błędy prognoz na jeden kwartał do przodu dla wynagrodzeń w gospodarce narodowej
(dane miesięczne)
pkt proc.
2,0
1,5
Błąd
1,0
0,5
0
2004
2005
2006
2007
2008
2009
2010
2011
2012
DF VAR BVAR LI DF+LI
Wykres 4
Wygładzone absolutne błędy prognoz na jeden kwartał do przodu dla pracujących w gospodarce narodowej
według GUS (dane miesięczne)
pkt proc.
1,00
0,75
Błąd
0,50
0,25
0
2004
2005
2006
2007
2008
2009
2010
2011
2012
Wykres 5
Wygładzone absolutne błędy prognoz na jeden kwartał do przodu dla pracujących według BAEL (dane
miesięczne)
pkt proc.
1,00
0,75
Błąd
0,50
0,25
2011
2004
2005
2006
2007
2008
2009
2010
2012
DF VAR BVAR LI DF+LI
Tabela 1
Zmienne tworzące wskaźniki wyprzedzające
Zmienna
Wariant X1 X2
prognozowana
R = 60 Przeciętne zatrudnienie
Pracujący IFO Climate – Germany
P = 102 w sektorze przedsiębiorstw
w gospodarce
narodowej R = 90 Przeciętne zatrudnienie
Wskaźnik koniunktury PMI
P = 72 w sektorze przedsiębiorstw
Tabela 2
Błędy średniokwadratowe prognoz wygasłych dla wszystkich wyprzedzeń łącznie (w pkt bazowych)
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0031 51** 55** 55** 62** DF 0051 47* 47** 46** 54**
VAR 1 65 72 73 76 VAR 3 58 53* 53** 59
BVAR 6 60* 68* 68* 70* BVAR 6 57 65 64 67
LI 52** 57** 61* 68* LI 53 57 68 75
DF + LI 46**** 49**** 52*** 57**** DF + LI 40**** 41**** 48** 53**
JO OPT 46 53 54 60 JO OPT 39 41 42 50
Uwagi:
R – długość próby służącej do estymacji parametrów,
P – liczba prognoz wygasłych,
τ – horyzont prognozy w kwartałach.
Cyfry w modelu DF oznaczają: liczbę opóźnień v1, występowanie części autoregresyjnej w modelu (3), liczbę dodatkowych
opóźnień v2 oraz liczbę czynników k.
JO OPT – prognozy łączone z wagami optymalnymi ex post.
Liczba gwiazdek wskazuje liczbę przypadków w porównaniach parami, w których dany model generował lepsze prognozy
według testu Diebolda-Mariano na poziomie istotności 0,1 (z testów wyłączony był model JO OPT).
Dokładność wybranych metod prognozowania... 185
Tabela 3
Błędy średniokwadratowe prognoz wygasłych dla rekursywnego schematu prognozowania (w pkt bazowych)
Uwagi:
P – liczba prognoz wygasłych,
τ – horyzont prognozy w kwartałach.
Cyfry w modelu DF oznaczają: liczbę opóźnień v1, występowanie części autoregresyjnej w modelu (3), liczbę dodatkowych
opóźnień v2 oraz liczbę czynników k.
JO OPT – prognozy łączone z wagami optymalnymi ex post.
186 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis
Tabela 4
Błędy średniokwadratowe prognoz wygasłych dla schematu rolowanego w takim samym okresie weryfikacji
(w pkt bazowych)
R = 60, P = 72 R = 90, P = 72
Wynagrodzenia w gospodarce narodowej
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0022 56 63 75 87 DF 0021 46 44 50 57
VAR 2 59 63 82 98 VAR 2 50 57 70 75
BVAR 6 60 69 76 81 BVAR 1 59 66 69 69
LI 53 52 60 72 LI 47 52 60 67
DF + LI 51 51 60 70 DF + LI 44 45 53 61
JO OPT 50 50 61 71 JO OPT 44 45 54 62
Zatrudnienie w gospodarce narodowej wg GUS
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0022 31 34 45 58 DF 1022 31 36 46 56
VAR 1 41 46 58 65 VAR 2 40 44 55 61
BVAR 6 43 46 53 57 BVAR 6 43 49 59 65
LI 29 48 52 65 LI 28 43 49 57
DF + LI 29 39 44 56 DF + LI 26 38 48 56
JO OPT 29 41 45 57 JO OPT 26 36 47 55
Pracujący wg BAEL
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0021 47 46 48 59 DF 0051 47 47 46 54
VAR 1 56 58 59 63 VAR 3 58 53 53 59
BVAR 4 55 60 61 62 BVAR 6 57 65 64 67
LI 53 47 56 59 LI 53 57 68 75
DF + LI 46 43 50 55 DF + LI 40 41 48 53
JO OPT 45 44 49 55 JO OPT 39 41 42 50
Uwagi:
R – długość próby służącej do estymacji parametrów,
P – liczba prognoz wygasłych,
τ – horyzont prognozy w kwartałach.
Cyfry w modelu DF oznaczają: liczbę opóźnień v1, występowanie części autoregresyjnej w modelu (3), liczbę dodatkowych
opóźnień v2 oraz liczbę czynników k.
JO OPT – prognozy łączone z wagami optymalnymi ex post.
Dokładność wybranych metod prognozowania... 187
Tabela 5
Lista zmiennych objaśniających wykorzystanych w pracy
Przekształ-
Obszar Nazwa zmiennej Źródło Częstotli- cenie LI m1 m2
wość zmiennej
Przewidywane zatrudnienie
w przedsiębiorstwie w ciągu GUS m − − 1,93 0,15
Koniunktura w budownictwie
trzech miesięcy
Opóźnienie płatności GUS m − − 1,88 0,17
Przewidywane zatrudnienie
w przedsiębiorstwie w ciągu GUS m − − 2,02 0,19
trzech miesięcy
Przewidywane zatrudnienie
w przedsiębiorstwie w ciągu GUS m − − 1,47 0,14
trzech miesięcy
Prognoza ogólnej sytuacji
Koniunktura w przemyśle
Przeciętne miesięczne
wynagrodzenie w sektorze GUS m ind. T 4,38 0,22
przedsiębiorstw − ubruttowione
Przeciętne zatrudnienie w sektorze GUS m ind. T 3,62 0,10
przedsiębiorstw
Pracujący w gospodarce
narodowej (stan na koniec GUS q ind. − 1,98 0,25
kwartału)
Wydajność pracy (na podstawie
PKB oraz pracujących według GUS q przyr. − 1,92 0,32
BAEL) (PKB, BAEL)
Wydajność pracy (na podstawie
wartości dodanej brutto oraz GUS q przyr. − 2,07 0,32
zatrudnienia wg GUS)
Uwagi:
Częstoliwość m – miesieczna, q – kwartalna.
Przekształcenie zmiennej: ind. – indeksy łańcuchowe, przyr. – przyrosty łańcuchowe.
W kolumnie LI T oznacza, że dana zmienna była zakwalifikowana jako potencjalna zmienna objaśniająca w modelach
wskaźników wyprzedzających.
m1 – maksymalna różnica spowodowana sekwencyjnym odsezonowaniem w stosunku do odchylenia standardowego
szeregu odsezonowanego (dla Rmin = 21 obserwacji kwartalnych lub Rmin = 60 obserwacji miesięcznych),
m2 – średnie odchylenie standardowe poszczególnych obserwacji będące skutkiem sekwencyjnego odsezonowania
w stosunku do odchylenia standardowego szeregu odsezonowanego.
Dokładność wybranych metod prognozowania... 191
Tabela 6
Istotne wyniki testów warunkowej zdolności prognostycznej Giacominiego i White’a
R2
Zmienna Model 1 Model 2 T h
(w %)
LI VAR 90 1 2,8
VAR DF 60 2 5,5
VAR BVAR 60 2 4,3
Wynagrodzenia
VAR DF + LI 60 2 2,1
w gospodarce narodowej
BVAR DF 60 2 1,7
LI DF + LI 60 2 8,7
LI DF 60 4 3,5
DF VAR 90 4 8,0
DF BVAR 90 4 3,9
DF LI 90 4 11,1
Pracujący DF DF + LI 90 4 10,0
w gospodarce narodowej
według GUS DF + LI BVAR 90 4 10,3
DF LI 60 1 5,6
DF DF + LI 60 1 10,4
DF LI 60 2 4,9
DF DF + LI 90 3 4,7
DF DF + LI 90 4 8,8
Pracujący według BAEL VAR BVAR 90 4 0,7
VAR LI 90 4 2,1
DF DF + LI 60 3 2,9
Uwagi:
Model 1 – model, który daje lepsze prognozy dla niskich wartości zmiennej prognozowanej,
Model 2 – model, który daje lepsze prognozy dla wysokich wartości zmiennej prognozowanej,
R2 – współczynnik determinacji, opisujący siłę zależności pomiędzy zmienną prognozowaną a kwadratami błędów prognoz.
192 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis
Tabela 7
Błędy średniokwadratowe prognoz wygasłych dla zmiennej wynagrodzenia w gospodarce narodowej
(w pkt bazowych)
Uwagi:
R – długość próby służącej do estymacji parametrów,
P – liczba prognoz wygasłych,
τ – horyzont prognozy w kwartałach.
Cyfry w modelu DF oznaczają: liczbę opóźnień v1, występowanie części autoregresyjnej w modelu (3), liczbę dodatkowych
opóźnień v2 oraz liczbę czynników k.
JO OPT – prognozy łączone z wagami optymalnymi ex post.
Liczba gwiazdek wskazuje liczbę przypadków w porównaniach parami, gdy dany model generował lepsze prognozy według
testu Diebolda i Mariano na poziomie istotności 0,1 (z testów wyłączono model JO OPT).
Dokładność wybranych metod prognozowania... 193
Tabela 8
Błędy średniokwadratowe prognoz wygasłych dla zmiennej pracujący w gospodarce narodowej według GUS
(w pkt bazowych)
Uwagi:
R – długość próby służącej do estymacji parametrów,
P – liczba prognoz wygasłych,
τ – horyzont prognozy w kwartałach.
Cyfry w modelu DF oznaczają: liczbę opóźnień v1, występowanie części autoregresyjnej w modelu (3), liczbę dodatkowych
opóźnień v2 oraz liczbę czynników k.
JO OPT – prognozy łączone z wagami optymalnymi ex post.
Liczba gwiazdek wskazuje liczbę przypadków w porównaniach parami, gdy dany model generował lepsze prognozy według
testu Diebolda i Mariano na poziomie istotności 0,1 (z testów wyłączono model JO OPT).
194 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis
Tabela 9
Błędy średniokwadratowe prognoz wygasłych dla zmiennej pracujący według BAEL
(w pkt bazowych)
Uwagi:
R – długość próby służącej do estymacji parametrów,
P – liczba prognoz wygasłych,
τ – horyzont prognozy w kwartałach.
Cyfry w modelu DF oznaczają: liczbę opóźnień v1, występowanie części autoregresyjnej w modelu (3), liczbę
dodatkowych opóźnień v2 oraz liczbę czynników k.
JO OPT – prognozy łączone z wagami optymalnymi ex post.
Liczba gwiazdek wskazuje liczbę przypadków w porównaniach parami, gdy dany model generował lepsze prognozy według
testu Diebolda-Mariano na poziomie istotności 0,1 (z testów wyłączono model JO OPT).
Dokładność wybranych metod prognozowania... 195
Wyprowadzenie
Aneks 2 wzoru (6)
v1
ΣA f + εt
(1) ( 3)
Niech : y t = ln (Yt / Yt 1 ), yt = ln (Yt / Yt 3 ) oraz y t = a 0 + a1 y t 1 +
(1) (1) (1)
i t i
i= 0
wtedy:
Σ A (f )+ ε +ε +ε
(1) (1) (1) (1) (1) (1)
= 3a 0 + a1 ( y t 1 +y t 2 +y t 3 )+ i t i + ft 1 i + ft 2 i t t 1 t 2 =
i= 0
v1 \2
= 3a 0 + a1 y t( 31) + ΣA Z Σε
(1)
i t i + t j
i= 0 j =0
v1
ΣA Z
\2
Wstawiając y t(31) = 3a 0 + a1 y t(32) + Σε
(1)
i t 1 i + t 1 j , uzyskujemy:
i= 0 j =0
( )
v1 v1
Σ Ai Zt i +
\2
Σ Ai Zt
\2
y t(3) = 3a 0 + a1 3a 0 + a1 y t(32) + Σ εt 1 Σε
(1) (1)
1 i + j + t j =
i= 0 j =0 i= 0 j =0
v1 v1 \2
Σε
\2
Σ A i Z t i + a1 Σ A i Z t Σ εt
2 ( 3) (1) (1)
= 3a 0 (1 + a1 ) + a1 y t 2 + 1 i + j + a1 t 1 j
i= 0 i= 0 j =0 j =0
( )
v1 \2 v1 v1
y t(3) = 3a0 (1 + a1 ) + a12 3a 0 + a1 y t(33) + Σ Ai Zt
i= 0
2 i + Σ εt(1)2
j =0
j + Σ A i Z t i + a1 Σ A i Z t
i= 0 =0
1 i
\2 \2
Σε Σε
(1) (1)
+ t j + a1 t 1 j =
j =0 j =0
v1 v1 v1
= 3a 0 (1 + a1 + a12 ) + a13 y t( 33) + Σ A i Z t i + a1 Σ A i Z t
i= 0 i= 0
1 i + a12 ΣA Z
i= 0
i t 2 i +
\2 \2
Σ εt j + a1 Σ ε t 1 j + a1 Σε
\2
(1) (1) 2 (1)
+ t 2 j
j =0 j =0 j =0
Stąd: v1
gdzie :
b 0 = 3 a 0 (1 + a 1 + a 1 ) , b1 = a 13 , B 0 = A 0 , B 1 = A 1 + a 1 A 0 , B 2 = A 2 + a 1 A 1 + a 1 A 0 ,
2 2
Bm 2 = A m + a1 A m 1 + a 12 A m 2 , B m 1 = a 1 A m + a 12 A m 1 , B m = a 12 A m ,
ε t(3) = ε t(1) + (1 + a 1 ) ε t(11) + (1 + a 1 + a 12 )ε t(1)2 + (1 + a 1 + a 12 ) ε t(1)3 + … + a 1 (1 + a 1 ) ε t(1)m +1 + a 12 ε t(1)m