You are on page 1of 34

B ank i Kredy t 45(2), 2014, 163–196

Dokładność wybranych metod prognozowania


wynagrodzeń i liczby pracujących w Polsce

Jan Acedański*, Jolanta Bernais#, Adrianna Mastalerz-Kodzis‡

Nadesłany: 16 kwietnia 2013 r. Zaakceptowany: 16 października 2013 r.

Streszczenie
Celem pracy była analiza dokładności wybranych metod prognozowania zmiennych opisujących
polski rynek pracy w latach 1998−2013. Badaniu poddano następujące zmienne: liczbę pracujących
w gospodarce narodowej według GUS, liczbę pracujących według BAEL oraz średnie miesięczne
wynagrodzenie w gospodarce narodowej. W porównaniach uwzględniono: modele wektorowej
autoregresji VAR, bayesowskie modele VAR, dynamiczne modele czynnikowe, modele wskaźników
wyprzedzających oraz metody łączenia prognoz. Uzyskane wyniki wskazały, że w zdecydowanej
większości przypadków największą dokładnością, mierzoną błędem średniokwadratowym prognoz
wygasłych, cechowały się prognozy łączone, uwzględniające modele czynnikowe oraz modele
wskaźników wyprzedzających. Te dwie klasy modeli dawały lepsze prognozy niż tradycyjne modele
wektorowej autoregresji. Pokazano również, że napływ kolejnych danych miesięcznych nie prowadził
do poprawy jakości prognoz na dany kwartał.

Słowa kluczowe: prognozowanie, rynek pracy, dynamiczne modele czynnikowe, modele


wskaźników wyprzedzających, prognozy łączone

JEL: C53, E24, E27

* Uniwersytet Ekonomiczny w Katowicach, Wydział Ekonomii; e-mail: jan.acedanski@ue.katowice.pl.


# Uniwersytet Ekonomiczny w Katowicach, Wydział Zarządzania.
‡ Uniwersytet Ekonomiczny w Katowicach, Wydział Zarządzania.
164 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

1. Wstęp

Rynek pracy odgrywa niezwykle ważną rolę w gospodarce. Takie zmienne, jak poziom zatrudnienia
czy stopa bezrobocia, są w wielu przypadkach punktem odniesienia do oceny skuteczności działań
prowadzonych w ramach określonej polityki gospodarczej. Stąd też często pojawia się konieczność
prognozowania sytuacji na rynku pracy, którego sposób funkcjonowania zależy miedzy innymi od
decyzji o poziomie wydatków publicznych, siły działania systemu podatkowego, skuteczności polityki
społecznej, atrakcyjności pracy i czasu wolnego, poziomu i struktury konsumpcji czy skłonności do
inwestowania.
W ostatnich latach w literaturze obserwuje się wzrost zainteresowania metodami krótkookresowe-
go prognozowania szeregów czasowych. Można do nich zaliczyć między innymi modele wektorowej
autoregresji, dynamiczne modele czynnikowe oraz modele wskaźników wyprzedzających. Przy dużej
liczbie możliwych podejść istotny jest wybór najlepszych metod prognozowania. Ponieważ dla danej
zmiennej prognozowanej bardzo trudno ex ante wskazać najwłaściwsze podejście, konieczna jest zwy-
kle analiza dokładności prognoz ex post uzyskanych różnymi metodami.
Celem pracy była analiza dokładności prognoz wybranych zmiennych opisujących polski rynek
pracy, uzyskanych różnymi metodami. Wśród badanych zmiennych rozważano: liczbę pracujących
w gospodarce narodowej według GUS, liczbę pracujących według BAEL oraz średnie miesięczne wyna-
grodzenie w gospodarce narodowej. Analizowano dokładność takich metod, jak: modele wektorowej
autoregresji VAR, bayesowskie modele VAR, dynamiczne modele czynnikowe (ang. dynamic factor mo-
dels – DFM), modele wskaźników wyprzedzających (ang. leading indicators – LI) oraz metody łączenia
prognoz.
W pracy rozważano dwie podstawowe hipotezy: (1) największą dokładnością, mierzoną błędem
średniokwadratowym prognoz wygasłych, cechują się prognozy łączone oraz (2) prognozy uzyskane za
pomocą modeli czynnikowych oraz modeli wskaźników wyprzedzających są dokładniejsze niż progno-
zy generowane przez tradycyjne modele wektorowej autoregresji.
Od strony metodologicznej największą trudnością jest to, że zmienne prognozowane i zmienne ob-
jaśniające mają różną częstotliwość obserwacji. Dane dotyczące zmiennych prognozowanych publiko-
wane są co kwartał, natomiast wiele potencjalnych zmiennych objaśniających występujących w mode-
lach DFM oraz LI mierzonych jest z częstotliwością miesięczną. W przypadku wspomnianych modeli
pozwala to na formułowanie prognoz co miesiąc. Wykorzystanie bardziej aktualnych danych miesięcz-
nych jest też źródłem potencjalnej przewagi modeli DFM oraz LI nad modelami autoregresyjnymi.
W związku z tym w niniejszej pracy weryfikowano dodatkową, trzecią hipotezę, że wraz z napływem
kolejnych danych miesięcznych wzrasta dokładność prognoz na dany kwartał, uzyskiwanych za pomo-
cą modeli LI oraz DFM. Kwartalny charakter zmiennych prognozowanych sprawia, że pod względem
metodologicznym prognozowanie zmiennych rynku pracy bardziej przypomina prognozowanie dyna-
miki PKB i wyraźnie różni się od metodologii badań nad inflacją.
Istotnym problemem w prognozowaniu jest wybór właściwego schematu prognostycznego oraz
długości próby. W związku z tym próbowano również ocenić, jak przyjęty schemat prognostyczny oraz
różna długość prób wpływają na dokładność prognoz.
W literaturze dotyczącej prognozowania makroekonomicznego przedmiotem zainteresowania ba-
daczy najczęściej jest dynamika PKB oraz inflacja (zob. Stock, Watson 1999; Banerjee, Marcellino, Ma-
sten 2005; Eickmeier, Ziegler 2008; Barhoumi i in. 2008; Giannone, Reichlin, Small 2008; Baranowski,
Dokładność wybranych metod prognozowania... 165

Leszczyńska, Szafrański 2010; Angelini i in. 2011; Koop, Korobilis 2011). Zmienne te odgrywają decydu-
jącą rolę w opisie gospodarki danego kraju, a także przy podejmowaniu decyzji w zakresie polityki pie-
niężnej i gospodarczej. Badania nad prognozowaniem zmiennych opisujących sytuację na rynku pracy
prowadzone są dużo rzadziej. Tymczasem potrzeby w tym zakresie są duże. W wielu krajach przyjęto
na przykład, że o pozytywnej ocenie polityki gospodarczej nie decyduje wysokie tempo wzrostu gospo-
darczego, ale pełne zatrudnienie. Z kolei dynamika wynagrodzeń odgrywa główną rolę w ocenie presji
płacowej, wpływającej na poziom inflacji w gospodarce.
Prognozowaniem zmiennych opisujących rynek pracy zajmowali się między innymi Rapach
i Strauss (2008; 2012). Rozważali metody łączenia prognoz w odniesieniu do zatrudnienia w Stanach
Zjednoczonych i stwierdzili, że często dawały one dokładniejsze wyniki niż modele autoregresyjne. Prze-
waga ta była szczególnie widoczna w okresach recesji. Gupta i in. (2012) zauważyli, że modele czynniko-
we, uwzględniające długookresowe zależności opisane za pomocą mechanizmu korekty błędem, pozwa-
lały na dokładniejsze prognozowanie dynamiki zatrudnienia sektorowego w Stanach Zjednoczonych
w porównaniu z modelami VAR oraz BVAR. Siliverstovs (2013) rozważał natomiast znaczenie ankieto-
wych badań koniunktury dla poprawnego prognozowania zatrudnienia w Szwajcarii. Marcellino, Stock
i Watson (2003) badali dokładność prognoz stopy bezrobocia, a także inflacji oraz PKB w strefie euro
i jej krajach członkowskich. W odniesieniu do stopy bezrobocia najlepsze prognozy w rozważanych
przez nich warunkach generowane były przez modele czynnikowe oraz modele VAR. Z kolei Christof-
fel, Warne i Coenen (2010) oceniali zdolności prognostyczne dużego modelu DSGE dla strefy euro,
biorąc pod uwagę także zmienne opisujące rynek pracy. W odniesieniu do kwartalnej dynamiki za-
trudnienia rozważany przez nich model cechował się bardzo dobrymi zdolnościami prognostycznymi
w porównaniu z różnymi wersjami modeli VAR oraz BVAR. Jednak w przypadku płac nominalnych spi-
sywał się wyraźnie gorzej od innych podejść.
Praca składa się z sześciu części. W części drugiej omówiono zmienne prognozowane i obja-
śniające. Następnie przedstawiono zastosowane w pracy metody prognozowania. W części czwartej
zaprezentowano metodologiczne aspekty porównywania dokładności prognoz. Część piąta zawiera
wyniki badań.

2. Zmienne

Do prognozowania wybrano trzy zmienne charakteryzujące sytuację na rynku pracy: wynagrodzenia


w gospodarce narodowej, liczbę pracujących w gospodarce narodowej oraz liczbę pracujących według
Badania Aktywności Ekonomicznej Ludności (BAEL). Dokładne definicje poszczególnych zmiennych
oraz sposób ich pomiaru można znaleźć w opracowaniach GUS (2008; 2010; 2013).
Zgodnie z definicją przyjętą w badaniach BAEL pracującym jest osoba wykonująca jakąkolwiek
pracę, także w szarej strefie i dorywczą. Obejmuje ona zatem znacznie szerszą grupę osób niż oficjalna
sprawozdawczość. Należy jednak pamiętać, że liczba pracujących według BAEL nie zawiera niektórych
kategorii osób zaliczanych do pracujących w badaniach prowadzonych przez GUS. Są to na przykład
pracujący, którzy mieszkają w hotelach robotniczych czy pracują za granicą na rzecz polskich pracodaw-
ców. Dodatkowo zmienne te istotnie różnią się metodą gromadzenia danych. W przypadku pracujących
w gospodarce narodowej dane pochodzą z oficjalnej sprawozdawczości przedsiębiorstw, a w BAEL −
z badań ankietowych poszczególnych osób. Można więc uznać, że liczba pracujących w gospodarce na-
166 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

rodowej oraz liczba pracujących według BAEL uzupełniają się, i oddzielnie analizować ich kształtowa-
nie się (por. Cichocki i in. 2013). Z tego powodu w niniejszej pracy rozpatrywano obie te zmienne. Ich
dynamikę w okresie objętym badaniem ilustrują wykresy 1 i 2.
Zbiór potencjalnych zmiennych objaśniających liczył pierwotnie 135 szeregów, w tym 106 szeregów
o częstotliwości miesięcznej oraz 29 szeregów o częstotliwości kwartalnej. Z pierwotnego zbioru usu-
nięto zmienne, dla których współczynnik korelacji liniowej Pearsona z innymi zmiennymi przekraczał
0,9, a także te, w których występowały wyraźne obserwacje odstające. Jak pokazały badania Boivina
i Ng (2006), rozszerzanie zbioru zmiennych objaśniających w modelach czynnikowych nie musi prowa-
dzić do poprawy jakości predykcji. Co więcej, obecność zmiennych wnoszących bardzo niewiele nowych
informacji może nawet zmniejszać zdolności prognostyczne tych modeli. Po wstępnej selekcji pozostało
67 zmiennych, w tym 61 o częstotliwości miesięcznej i 6 o częstotliwości kwartalnej. Ostateczny zbiór
zmiennych objaśniających zawierał zmienne dotyczące rynku pracy, sytuacji makroekonomicznej, ko-
niunktury, handlu zagranicznego, a także zmienne opisujące sferę monetarną i zmienne mające cha-
rakter syntetycznych wskaźników wyprzedzających. Ich szczegółową listę zawiera tabela 5.
Dane kwartalne obejmowały okres od II kwartału 1998 r. do II kwartału 2013 r. (61 obserwacji),
natomiast miesięczne – od maja 1998 r. do sierpnia 2013 r. (184 obserwacje). W przypadku niektórych
zmiennych objaśniających brakowało danych, szczególnie z początkowych okresów. Brakowało też da-
nych na końcu próby, co wiązało się z różnym czasem publikacji danych. Datą końcową, do której gro-
madzono dane (ang. cut-off d ate), był 10 września 2013 r. W przypadku modeli DFM brakujące dane
uzupełniano za pomocą algorytmu maksymalizacji oczekiwań (ang. expectations maximization – EM;
zob. Stock, Watson 1998). W modelach wskaźników wyprzedzających duże braki danych na początku
szeregu czasowego wykluczały daną zmienną jako potencjalny wskaźnik wyprzedzający ze względu na
zbyt małą liczbę obserwacji do testowania modelu.
Wszystkie zmienne zostały odsezonowane za pomocą procedury TRAMO/SEATS z automatyczną
identyfikacją modelu. W ustawieniach programu przyjęto wartość parametru RSA = 4 (zob. Gomez,
Maravall 1998). Dodatkowo wiele zmiennych poddano przekształceniom, mającym na celu sprowadze-
nie ich do postaci stacjonarnej. Wyrażone zostały więc jako stopy wzrostu bądź przyrosty. Bez zmian
pozostały tylko wskaźniki koniunktury. Obserwacje kwartalne przekształcono do postaci miesięcznej,
przyjmując takie samo tempo wzrostu badanej zmiennej w każdym miesiącu. Na koniec wszystkie
szeregi poddano standaryzacji.

3. Modele

Wybrane metody są dość powszechnie stosowane do prognozowania i w miarę szeroko opisywane


w literaturze. Dlatego w niniejszej pracy omówiono tylko ich najważniejsze cechy, koncentrując się na
wskazaniu konkretnych wariantów metod zastosowanych w przeprowadzonym badaniu.

3.1. Modele wektorowej autoregresji

Tradycyjnym punktem odniesienia w badaniu zdolności prognostycznych różnych metod są modele


wektorowej autoregresji o postaci:
Dokładność wybranych metod prognozowania... 167

ΣG y
m

Σ Gi y t(3)3i + εt( y )
m
y t( 3) = G 0 + y t( 3) = G 0 + i
( 3)
t 3i + εt( y ) (1)
i =1 i =1

( 3)
gdzie y t oznacza wektor zmiennych yprognozowanych,
( 3)
t a Gi są macierzami parametrów.

Ponieważ dwie_ φ zmienne σˆuj opisujące zatrudnienie σˆujdostarczały informacji o podobnym zakresie,
σ ijk = θwij k φ
_
σ = θ w
uwzględnianie ich obu k
σˆ uiw modelu (1) przy krótkich próbach σˆ ui stosowanych do estymacji parametrów mo-
ijk ij

gło prowadzić do zwiększenia błędów oszacowań parametrów i w konsekwencji zmniejszyć dokładność


prognoz.
WW = [związku
wij ] z tym jedną z nich W wyłączano
= [ wij ] z modelu. Do prognozowania dynamiki wynagro-
dzeń i liczby pracujących w gospodarce narodowej zastosowano zatem jeden model, a do prognozowa-
nia dynamiki
σˆuj liczby pracujących według σˆuj BAEL drugi model, w którym jako drugiej zmiennej użyto dy-
namiki wynagrodzeń.
Wθpracy> 0 wykorzystano dwie metody θ > szacowania
0 parametrów modeli autoregresyjnych: klasyczną
metodę najmniejszych kwadratów oraz podejście bayesowskie. Wobec modelu w wersji bayesowskiej
0 ≤ φ ≤ 1zmodyfikowane podejście
zastosowano φ≤1
0 ≤zaproponowane przez Doana, Littermanna
1 0,5 0,5 1 0,5 i Simsa0,(1984).
5 Za-
łożyli oni, że rozkład a priori estymowanych parametrów jest rozkładem normalnym z wartością ocze-
0,5m 1 ( 3) 0,5 m 0,(5y ) 1 0,5
kiwanąθ =równą φ =1
0,1 1 dla parametrów θ = 0,1przy
stojących
W φ = 1 (0y )+ wartościach
opóźnionych
Σ
ymt( 3) = G=0 +( 3) Gi yyt(t3)3im=+ G Σ
εt ( 3)i =1 G(i yy )t 3i + εt
W( 3)= zmiennej objaśnianej w da-
nym równaniu oraz 0ydla ( 3) wszystkich pozostałych
= G0 + Σ
y = G + Gi y t 3i Ponieważ
Gi y t( 3)3i t +i =ε1t( y ) 0parametrów. Σ + εt prognozowane zmienne nie
Σ
m
cechująy t się=wysoką
( 3)
t
Gi y t 3i + εt i w
G 0 + autokorelacją, ( 3) ( y) 0 ,5 0 ,5 i =1
1
= 1 niniejszej pracy przyjęto, że wartość oczekiwana parametrów sto-
0,5 0,5 1
( 3)
jących Xprzy = FL opóźnionych wartościach
i = 1
yt ( 3 ) X = FL
zmiennej y
objaśnianej
t wynosi 0,25 (por. Bańbura, Giannone,
y ( 3) y t( 3)
Reichlin( 32010).
)
Z kolei odchylenie
t standardowe rozkładu a priori przyjmuje postać:
y t(1)
y t = ln(Yt / Yt ) y t(1) = ln_ φ(Yσtˆuj/ σ Yt 1 )= θw k _ φ σˆuj
1
σ_ ijk σˆ=uj θwij k θ ijk _ φ σˆuj ij σˆ ui (2)
σ ijk = σˆ wij k
_φ σ
σˆujijk = θwij k φ ui σ
ˆ
σyijkt == θlnw(ijYkt / Yt 3 ) ( 3)
( 3)
y ( 3)
σˆmuit ( 3) t ( y ) t 3
= ln ( Y / Y ) ui

σˆ ui y t = G 0 + Σ G y + εt W = [ w ]
(1)
a f W i==1[yw(1ij)i ]at 3fi ij
y
gdzie: i jest numerem równania, t W =t [ wij ] k reprezentuje rząd opóźnienia, θ, φ oraz ma-
t t W = [ wij ] j – numerem zmiennej,
cierz W = [ wij ] są hiperparametrami, σˆuj ((11natomiast σˆuj oznacza oszacowanie odchylenia standardowego
y t( 3v)1 v1

Σ
)) σ
t 1uj Σ
ε ˆ (1)
A ε (1)
σ y a a y i f t i + j. t
(1) (1)
składnika
y t =losowego a 0 + a1 yw ˆ jednowymiarowym
+ A f
i t i + tt = modelu
uj 0 + AR
1 t 1 +
dla zmiennej
σˆuj i= 0
θ > 0 σˆ θ > 0 i= 0
θ > 0
Hiperparametr
εt(1) θ >σ ijk0 =określa θwij k ogólnie

εt(1)
uj
wielkość odchylenia standardowego w całym rozkła-
θ > 0
dzie a p riori. Hiperparametr 0 ≤ φ ≤ 1 determinuje σˆ 0 ≤ φ ≤tempo 1 zmniejszania się niepewności w roz- 0,5
≤ φ≤1 0,51 0,5
ui
0 ≤zeφwzrostem ≤v1 1
0 1 0,5
kładzie a p riori wraz opóźnienia określonego v1 przez m w modelu 1 (1).0 , 5
Wskazuje 0 ,5
0,5 1 zatem, 0,5
Σ
1B Z0,_5 + ε (3) 0,5
że zmienne objaśniające Σ
0y≤t(3)φ=≤b10 + b1 y t(_33) W + = B
[ w Z ] _ i +yε
( 3()3)
= b + b θ y ( 3)
_3 +
0 ,1 φ 10, 5 1 W 0 ,5
w danym i
θ = 0,równaniu
t
1 t 1 φ0będą
t 0
,5 = miały
1 t
0,5niewielki
i
W = wpływ
t i t 0,na
5 zmienną
=1 objaśnia-
0,5
,1 = 1W niepewność
ij
φi =0=0,51 1 =co do W0wartości
,=5
φ = 1θ na = 0większą
i= 0
ną. Elementy macierzy θ = 0wag ,1 W wskazują 0,5 1 = 0,5 parametrów stoją-
θ
cych Z = 0,1
przy= opóźnionych φ =σˆ1uj W = 0 ,5 0 ,5w sto- 1
f t + f t 1 + f t 2zmiennych
, b0 = 3a 0 (1objaśnianych Z+t a=1 f+t a+1f)t ,1 b(elementy +1 f=t 2a,13 b, 0B=na 3agłównej ,+0,a5 przekątnej
+0a,5 ) ,,5b macierzy)
1
2 3
0 (1 0=,05a, 1 , B 0 =1 A 0 , B1 = A1 + a1 A 0 ,
2
0 = A 0 B11 = A110+ a11 A
t
sunku do parametrów stojącychXprzy = FL X = FL 0
zmiennych objaśniających (elementy poza główną przekątną)., 5 0 ,5 1
θ >2 0 B X0,=5 FL 0,5 parametrów.+ a 22A1 , B +ma112,A m 2 , B m 1 = a1 A m + a12 A m 1 ,
B 2 przyjęto
W pracy X FL
1 A 1 + a1 A 0 ,wartości
= A 2 + astandardowe = B m 2 =2 omawianych =A mA +2 +a1aA1 A m 11 + a11 A0m 2 , mB2m 1 = a
= A m 1+Aam1 A +a 2
m 11A
X = FL y t(1) = ln(Yt / Yt 1 )
2 0 ≤ φ ≤ 1 y t(1) B = ln (
= Y (a1)/2Y A )
,
B m = a1 A m , m y t 1 = ln t t m (Yt / Yt 1 ) 1
1
0,5 0,5
y t(1) = ln(Yt / Yt 1 )
εt+((1Y1)0at+,12/5)(1
Yt (+13)1)a + a 2 )ε0,(51) + (1 + (a1) + a 2 )2ε (1(1)) + … + a (1 + a ) ε (1)
( 3)
y = ln(Y / Y )a ) ε (1) + (1
(1)
y t(+3) aε=1tφ +=(= ayY112(t3ε))/tεY=t(1t +)2ln)(yY(1t+ a= )ln εt 3 +1 … +1 a1 t(12 + a1 ) ε t m1 +1 + 1a1 εt t 3m(3)
ε t(t 3) = εt(1) +t (1t +1 (θ
( 3) (1)
t ,1
ln (1
3+ + 1a1=
3)1 = 0 1
y t = ln(Yt / Yt 3 ) t t /WY t 3 ) 1 1 t m +1
(1)
yt(1) ayt _f1t (1) a f yt a f t
( )
yytt _1 = ln(Yt / Yt 3 )
((31)) 1

(1) yt 0,5 0,5 1


yt a f t t
v1

y t = a 0 v+1 (1a) 1 y t 1 +t Σ A(1i)0f t i +11 εtt 1 Σ ε (1i) t i


(1)
ay1t = ab1 f=t 0 X = FL (1) a1 = b1 = 0(1) y (1)v1 = a + av y ((11)) + A f + ε (1)
y t = a 0 + εia=(101)y t 1 + Σ A i f t i i =+0 t
t

(Y 1/) Yεyt(1t1) )iΣ


(1) (1)
y = v a + a y + ( 3 ) A
a fti t i f +
y ( 3) a f
y t(1t) = a 0t + a1 y t(11) +y t(Σ
t 1) 0
1 1 t 1 t i= 0
=Alni f t i t(+
=0
ε (1)
εt t
i= 0
εv2t(1)
εt((1f) )(3)
v2
f = C f + ε( f )
168 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

ΣG y
m
y t( 3) = G 0 + i
( 3)
t 3i + εt( y )
i =1
Zarówno w podejściu klasycznym, jak i bayesowskim liczbę opóźnień m w modelu (1) dobierano ze
względu na zdolności prognostyczne modelu. y ( 3) t

σˆuj
3.2. Dynamiczne modele czynnikowe σ ijk = θwij k

σˆ ui
Istotą dynamicznych modeli czynnikowych jest wykorzystanie w prognozowaniu zmiennych syntetycz-
[ wij ] danych (zob. Stock, Watson 1998). Proce-
W =zbiorach
nych, reprezentujących informacje zawarte w dużych
durę prognozowania na podstawie modeli DFM można podzielić na trzy etapy:
σˆuj
− wyodrębnienie niezależnych zmiennych syntetycznych – czynników,
− ustalenie zależności pomiędzy czynnikami a zmienną prognozowaną,
θ>0
− wykorzystanie oszacowanej zależności do budowy prognoz.
W niniejszej pracy na pierwszym z wymienionych
0 ≤ φ ≤ 1etapów wykorzystano statyczną metodę głów-
1 0,5 to ma-0,5
nych składowych. Jeżeli K jest liczbą zmiennych objaśniających, a T oznacza liczbę obserwacji,
cierz obserwacji zmiennych objaśniających X ma wymiar T × K. Poszukuje się macierzy 0,5 czynników
1 F0,5
θ = 0,1 φ =1 W=
o wymiarze T × K oraz K-wymiarowej kwadratowej macierzy ładunków czynnikowych L − takich, aby
spełniona była zależność: 0,5 0,5 1
X = FL (4)

Poszukiwane macierze dobierane są w taki sposób, aby czynniki reprezentowane przez kolum-
y (1) = ln(Y / Yt 1 )
ny macierzy F były od siebie niezależne liniowo.t Ponadtot ustawiono je w takiej kolejności, że dany
czynnik wyjaśnia mniejszy lub taki sam odsetek zmienności zmiennych objaśniających w porównaniu
y t(3) = ln(Yt / Yt 3 )
z poprzedzającym go czynnikiem.
Gdyby w macierzy X nie występowały brakiydanych, (1)
a f t rozwiązanie powyższego problemu sprowa-
t
dzałoby się do stosunkowo prostych obliczeń z zakresu algebry. Ponieważ jednak brakuje niektórych
v

Σ
obserwacji, konieczne jest ich uzupełnienie. W tym celu zastosowano1 procedurę maksymalizacji ocze-
y t(1) = a 0 + a1 y t(11) + A i f t i + εt(1)
kiwań (zob. Stock, Watson 1998), która połączona jest z procesem estymacji i= 0 macierzy F oraz L i ma
charakter rekurencyjny. Początkowo przyjęto pewne startowe wartości macierzy F(0) oraz L(0) i na pod-
stawie równania (1) oszacowano brakujące elementy ε (1)
t macierzy X. Korzystając z kompletnej macierzy X,

oszacowano macierze F oraz L przy zastosowaniu standardowej procedury


(1) (1)
v1
algebraicznej. Postępo-
wanie powtarza się do momentu, w którym różnice y t = b0 + b1 y t _ 3 + B i Z t _ i + εt(3)Σ
( 3) pomiędzy( 3kolejnymi
) oszacowaniami F(i) oraz L(i)
są mniejsze od założonej wartości granicznej. Dobre wartości początkowe i= 0 można uzyskać przez zasto-
sowanie zwykłej procedury głównych składowych do macierzy utworzonej z kompletnych2 wierszy ma-
cierzy X. Z t = f t + f t 1 + f t 2 , b0 = 3a 0 (1 + a1 + a1 ) , b1 = a13 , B 0 = A 0 , B1 =
Najpopularniejszą alternatywą wobec statycznej metody głównych
B 2 = A 2 + a1 A 1 + a12 A 0 składowych, B m 2 = A msą+metody
a1 A m 1 dyna-
+ a12 A m 2 , B m 1 = a1
miczne, w których przyjmuje się zmienną strukturę zależności pomiędzy zmiennymi objaśniającymi
a czynnikami lub rozszerza się macierz F o opóźnione
B m = aczynniki.
2
1 Am ,
Jak jednak dowodzą na przykład wy-
niki przedstawione w pracy Boivina i Ng (2005), wybór metody wyznaczania czynników nie ma więk-
εt(11) + (1 +Baranowski,
εt(1) + (1 + a1 )również
ε t(3)co= potwierdzają 2 + (1 + a1 + a1 ) εt 3 + … + a
a1 + a12 )ε t(1)Leszczyńska 2 (1)
szego wpływu na jakość generowanych prognoz,
i Szafrański (2010) w odniesieniu do polskiej gospodarki.
yt(1_1)
Podstawowy problem z ustalaniem zależności pomiędzy czynnikami a zmiennymi prognozowany-
mi w niniejszej pracy wynika z tego, że czynniki asą1 = b1 = 0
obserwowane co miesiąc, a zmienne prognozowane
raz na kwartał. Rozwiązanie tego problemu polega na wykorzystaniu faktu, że zmienne prognozowane
yt( 3) a f t
v2
ft = Σ
i 1
=
C i f t i + ε t( f )

k = {1, 2, 3, 4, 5}, v1 = {0, 1}, v 2 = {1, 2, 3}


σ ijk = θwij k σˆ ui θ>0 σˆ ui _φ σ ˆθuj> 0
σˆ ui W = [ wij ] θ 0 σ = θ w k
0 ≤ φ≤1 0 ≤ φ≤1 >
1 0,5 1 00,5,5 0σˆ ui≤ φ0≤,51
ijk ij

0 ≤ φ≤1 W = [ w ]
W = [w ] σˆuj ij 1 0,5 0,5
W = [ wij ] ij 0 ≤ φ≤1 0,5 1 0,5 0,15
θ = 0,1 θ = 0φ ,1 = 1 φ = 1 W = W W 0
= , 5 = [ w 1 ] 1 0 0,5,05,5 0,5
σˆuj Dokładność wybranych
θ = 0,1 metod
=σˆ1uj
φ prognozowania...
ij
θ = 169 0,1 φ 1
σˆuj θ > 0 W= 0,5 1 0,5 =
θ = 0,1 φ =01,5 0,σˆ5 0,W 5 =01,5 1
θ>0 0 ≤Xφ=≤FL 1 θ > 0 0
uj
, 5 0,5 1
θ>0 X = FL 1 0,5 0,5 0,5 X 0=,5FL
mierzy się jako logarytmy kwartalnych stóp X wzrostu.= FL Możliwa jest zatem specyfikacja θ > 0 liniowego rów-
1
0 ≤ φ ≤ 1 zależność pomiędzy 0
X = FL stopy 0wzrostu ≤ φ ≤ 1 ,5 1 zmiennej 0,5prognozowa-
0nania ≤ φ ≤opisującego
1 θ y=t(10) ,11=logarytmem ln(0Y(11,t)5y/t(Y 1φ ) 0= ,51miesięcznej
Y,5t / Y0t ,15) W =
1 0,5 0,5
t= 1 )ln0 ( 0 ≤ φ ≤ 1
nej a czynnikami, a następnie agregacja tych równań
y0t ,5= ln1(Yt / Yt 1 )0,5 i przejście do zależności pomiędzy logarytmem y (1)
t 0,5 = ln ( Y / Y
1t t 1 0,5 1 0 )
kwartalnej θ = 0,stopy 1 wzrostuφ = 1a czynnikami. ( 3W)0,5= Przyjęto, 1 (3) że 0y,t(51) =θln=(Y0t ,1/ Yt 1 0) ,5oznacza φ0,=51 logarytm 1 W=
miesięcznej
θ = 0,1 φ =1 W y=t = ln(Y y/ Y = )ln(Yt / Yt 3 ) 0,5
stopy wzrostu zmiennej prognozowanej, ( 3t) t t 3
X = FL y t = ln(Yt / (Y3)t 3 ) mierzy zmiany kwartalne, θ = 0,1 ft to φ y t=(3)1 = ln
wektor k (Yt / YtW 3 )=
0,5 0,5 1
czynników, a równanie zależności pomiędzy yt(1)0a,5 f t 00(1,,5)5yt(1) 0a,5 f ty1ma t
1ln(Yt / Yt 3 )
=postać: (1)
X = FL yt a f t X = FL y t a f t 0,5 0
X = FL y t(1) = ln(Yt / Yt 1 ) yv1t(1) a f t v1
y t = a 0 (+1)yat1 y t=1 a+0 Σ
(1) (1) (1)
+ aA (1) i t t 1(i1) Σ
yf +1+ εt A i f t i +(1)εt
(1) v (1) (1X ) = FL (5) v
= a 0 + a1 y t 1 + Σ A i f t
y t = ln(Yt t / Yt 30 ) 1(1) t 1 iΣ
1
(1) (1)
y (1)
= ln ( Y / Y ) ( 3) y = a + a i y
0 + y A
= lnf ( Y + / Yε v ) y t
y t = a 0 =+0 a1 y t(11) + Σ A i f t(1)i + εt(1)
= t i = 0i t i t t
t 1
y t(1) = lnt (Yt / Yt 1t) t 1
1
i= 0

ε (1)
ε (1)
y t = ln(Y
y = ln (Y / Y )
t / Yt 3 )
( 3 ) t t t 1
natomiast εt(1) jest
i= 0

(Y=t /lnYt(aY13t)są/ Ytparametrami,


yat0(3oraz 3)
)
gdzie: yt(1A t)
a f ε (1) t
i – kt-elementowymi wektorami parametrów,
y t(3) = ln t
składnikiem losowym εvt1(1) y t(3) = ln(Yt / Yt 3 )
y3)t(1) av1 f(t3)
0 Σ
yt(1) a f t
y t(y1)t = =a 0b+0 (+a3)1ybyt1 t(y11)t =_+3 b+Σ
( 3) ( 3 ) ( 3) v1
+Ab(B Z _vi1 ε+Σ
(
1i3f)yit t _i 3t++
(1)ε B Z _ + ε (3) v1

Σ BiZ
(1)
yt a f t
Σ i = 0i t przyjmuje
( 3) ( 3)
y = b + b i =y 0 + B
t
t i t i (3) t
Z + ε (1)
yvt 1wówczasa f t następującą y t = b 0 + b 1 y t _3 +
Zagregowane równanie v1 prognostyczne tkwartalnych 0 i = 01 tstóp _
wzrostu _ v1 t

y t 0 = a1 0 t+3 a1 yΣ
3 i

t 1 +i Σ
(1)i =+0 b y (_3) + (1) B Z _ + ε (3)

A i fiΣ
( 3) i= 0
y = b i i f t t i + εt
(1)
(1)
y (wyprowadzenie (
= a (+1) a yvt1 1 +wzoru
1 )
f (1i) (1+) εt się w Aneksie 2):
A iznajduje (1 ) t A
ypostać = at 0 + a1 0y t 1 +1 Σ
t
+ εtt εZ
(1) i =20 3
t t = f t + fZ + f f , fb = 3 f a (1
, b + a +
3 a a (1 ) , b ai = 0=+ a a112,) ,Bb01 ==(1A )a01 ,, B
3 v1
B10 == A A 0 +, B a(1)A=0 ,A1 + a
Z t = f t + f t 1 + f t 2 , (1b) 0 = 3a 0 (1 + a1y+t a=12 )a, 0 b+1 a=1 ay1t3Z,1 t+B=0Σf=t AA
= + + = +
+ fε=t 12A
t =t 0 i ( 1 )
i= 0
t 1t tt2 t0 1 t 02 0 1 01 1
+i f t, 1i1B , b+0 =a 3Aa
0 1 1 1
ε (1)
B 2 = A 2 +Ba21 A=1 A Z
+ 2av1+ 2
tA =
a f
A, εB+ f
t + ta1 =
2+f
A A , B ,+ b a =
A= 3A a +(1+ a + a
2
a
AA + a, +
2
B ) a, 2b
i= 0
A == a a ,
3
A ,
B B + a =
=
2
A
a A , 1B , 1 =
εt m +
Σ
(1) t t m t 2 0 0 1 1 1 1 0 20
y t(3) = b0 B+2b1=yA
1
A
0
1 1 2 1 (3) 0
A
2
ε , B
m m 2 1
A
m 1 m
A
1 1 m 2
m 1 2 1
B A
m
=A 1 m 2
, B +1
a m
A
m 1
+ 1
A a 1 m
A , 2B
a a a a a a 1A
( 3)
_
t 32 + + B
1 1i t i1 Z+ _ + 0t m 2 =
εm (1+ ) 1 m 1 + 1 2 m 2(6) m 12 1 = 1 1 1m + 0
2 2
=0 = A + a A + a A , B
m 2 = A m +(3a) 1 A m 1 2+ a1 A m 2 , B m 1 =
2 2iB t
B m = (a3)1 AB m ,m =2 a1 A2m ,
v1
= b0 + b1 y t _ 3 + Σ B i Z t _ i + εtB
v1

Σ
2( 3) 1 1 1 ( 3) 0
ε B A y m = a1 A m ,
( 3) v(13)
y = b + b y + B Z + = a ,
y t(3) = bt 0 + b1 y0 t(_33) +1 Σ
t
ε
_ _
gdzie: t 3
BiZ +i t(3i) t m 1 m v1


Zεtt t = f=t +εt f t +ε1 t+(1f+=t 2aε,1tB bε0m+ a)1ε+t) ,a2 1b+y1+(1 ε 3))ε
2
_
i = 0t i ( 3 ) (1 ) ( 3 ) (
)
1 ) (1
=1=(1
)
+3a+ a(110a A+1 )ma+ε,1t a+11 +a+1(1
(1 (1 ) 2 2 ( 1 ) i
(=
= 02 3 (1)
3a) + a ) ε
a ,1t B + +a =(1)yA
2
+( 3)a, +
( 1 )
B+ …1a= +(1))A
2
1B εat1(11t(1
)
+ +a1aA
3_ i ++… εa1t(+ , t(1(11)m)(1
0 a 1 ++ a
t = 1 b + 0 b 1 t ε3
0 ( 3 +)
ε (1)i Z (1 ) εt +1 ++ a1(1
1 t 3
ε t = εt + (1 + a1 ) εt 1 + (1 + a1 + a1 )ε t 2 + (1 + a1 +t a1i =)02εtt 3 + … +3a11 (1
i= 0 1 2 1
( 3) (1) (1) 2t (1) 0 _
= + + )
(1) + a ) , b = a 2 2 , (B 1) = A
Z t = f t + f t 1 + f t 2 , b0 = 3Ba2y0 t(1
(1)
=_1 +Aa2 1++(1a)ay11A
2(1)
) , +b a ε
=2 ( 3) 3 Z (1)= f + f
A a = ,, B Bε t =+ =A(1
t A+ , aB
t +
1 ) +εa
=
(f1) , b = 23a (1
AA
t +
2 (1
+ +a
0+ a a
A A ,
+ 0a 2 + a
)
, ε B 1 + =(11 a+ a
A 1 + + a a 1 ) Aε 0 + , … +
, 1 110 m 12 tym2t(1_1)1
_ t 01 tm0 2 0 m 11 t1 1 m 1 1m 1 1 t m3 1
Z t = f t + f t 1 + f t 2 , b0 = 3a 0 (1 + a1 + a1 )y,t _b11 t =11 a131, 1B 0 = A 0 B1 = A1 + a1 A 0
, 1 1
2
+Zat 2=Af2t, +Bf t 1 +=fA , b0a=A3a 0 (1 + 2a1 + a1 ) ,
B 2 = ,AB2 + a=1 Aa1 A m 1 + a1 A m 2 , B
(1)
B 2 = A 2 + a1 A21 + a12 A 0 , Bamm1 =2 =ba112A =Am0m a +, 1 a=1 A b1m=21y0+t _1a12 A 1 2m 1+ a01 A mm1 ,2
t 2 +
m 1
B 2 = A 2 + a1 A 1 + a1 A 0 , B m 2 = A m + aa11A=mb11 += a01 A m 2 , B m 1 = a1 A m + a1 A m 1 , m 2 m 1
a1 = b1 = 0
a (1)= b B= 0= a 2 A2 , (1) B 2 = A 2 + 2a1 A(11) + a12 A 0 , B m 2 = A(1)m + a1 A
ε tyt = aεtf t +( 3)y(1t + aa1f)tεt1 1 + (1 + a1 +1 a1 m) ε t 2 + (1 + a1 + a1 ) εt 3 (+3)… + a1 (1 + a1 ) ε t m +1 + a
2 ( 3)( 3 )
B =a A , (1) ( 3)
1 m
B m = a1m2 A m , 1 m yt a f t 2
yt a f t
ε ( 32) 1)(1) + (1 + aB)m
(ε ε (1=) a1 A
(1 ma , + a2 2 ()1ε) (1) + (1 + a + a 2 ) ε (1)
ε = ε + (1 + a ) ε + (1t+_1 a +(1a) 1 )ε t 2 +2( (1 + a + ta ) ε t + … + a (1 1 ) ε t m +21 1+ a ε1 t 2
(1) ( 3)
( 3) (1) (1)
y v 2 (1) v
y a f = 1 +t a + (1)+
ε t(3) = εt t(1) + (1t + a1 ) εt(11) 1+ (1t 1+ a1 f+t a=121)Σ i =2+ Σ
2 1 1 t 3
ε tC2 i f+ftt (1 v +εa fC + a ) εtε3 + … + a1 (1 + a1 1 )(ε3)t(1)m1+1 +
) t 21 (1t)(1f ) t 3
a ε (1) 1 t vm2(1)
a1 = b1i =1=f0t = Σ Ci =1i f t i + εvt2 yt _1
t 1 i f t1 i +
ε t = εt + (1 f+t a=1 )Σ (1) 1 t m
εt C + aε1t + a1 ) ε t 2
(f) 2 (1)
i f(1
( f ) (t1)
y (1_) 1 + t i+
yt(1_1) t 1 f t = Σ C i f t i + ε t( f )
i =1 i =1
(1)
Możliwa jest również analiza
a1 = b1 = 0 k =modelu {1, 2, 3,kbez 4=, 5{1}czynnika
yt( 3) a f t k = {1, 2, 3, 14, 5}, av1 ==v1{
}1}, , vb2=1 =={{001,,12}, 3v}2 =y{t 1_1, .2,Wtedy
, 2v, 3=, 4{,0i =5,1autoregresyjnego 3} oczywiście
a1 = b1 = 0 . Pod względem własności formalnych specyfikacja 0(3), 1}niewiele
, v 2 = {1,się 2, 3różni } k = {1, 2, 3, 4, 5}, v1 = {0, 1}
1 od podejścia,
(k3) = {1, 2,( 33) ,( 34 ) , 5}, v = {0a , } = , b = 0 , , 3}(3)
w( 3którym yt( 3) amodeluje ft się bezpośrednią
( 3)
y t + 3hv2zależność
= d 0 h y+t +d ( 3)
1h=y td 0 h++dd
3hpomiędzy 2 h1y xy + d+ dx2 h2tx11+t +εt +d33hh1 x 2tto1+2 także
(h3t )1t t a fft.t3 hPotwierdzają
1 v = { 1 2
εt + 3h symulacyj-
y t + 3h = d 0 h + d1h y t(3) + d 2 h x
Σobui trodzajów ε
( 3)
y )
a f f = C yf + = ε d
( f ) + d y + d x + d x +
net badania t własności prognostycznych t + 3 h 0 h
ymodeli.
1 h t
Wydaje 2 h 1
się
t
( 3) jednak,
+ d 2yht x1że
3 h 2 t
a fopisane
t + 3 h
podejście
t 3 h x 2 t + εt + 3 h
t i t ( 3) ( 3)
εt +3hi =1 ε t + 3h = d 0 h v+ 2 d 1h y t t + d
= Σ C ipomiędzy
v2
f t = Σ C i f t( fi ) + ε t( f ) f t i + ε t miesięcznymiεstopami
jest poprawniejsze
v2 pod względem logicznym, εt +3h gdyż zakładaf tzwiązek
t + 3 h ( f )

Σ
t +3h
fwzrostu C f
zmiennej ε prognozowanej k =a { czynnikami
1 , 2 , 3 , 4 , 5 } obserwowanymi
, v ε { 0 , 1 } , v 1także
{ 1 , 2 ,z3częstotliwością
} v2
miesięczną.
f t = Σczynników
= i 1 + = i ==
C i f t i + ε (t(3k.f)) Licz-
t i t i= t 1 t 3 h 2
(3) +
Ze specyfikacją równania (6)Ywiąże
(3)
się( 3Y
i =1
zagadnienie wyboru optymalnej liczby
k = {1, 2, 3, 4, 5}, v1 = {0, 1}, v 2 =Ytp{1, 2, 3}
tp ) tp
, 1y},(3)v == d{Y10tp,h K
i 1
2 h x1t + d 3 h x 2 t + εt +przez
k = {1,być 2, 3, 4, 5}, v1 = {0mniejsza 2+, 3d}1h y t(3) +(3)d identyfikowanych
=

kba= {ta1,musi 2, 3, 4, 5}zdecydowanie


, v1 = {0, 1}, v 2 =Rt++{P31h,2 2,niż 3} R +czynników P 2 Y
3h procedurę głównych

y t(+33) h = d 0 h +(3d) 1h y t(3) + d 2 hεtx=Σ


składowych. W literaturze proponujeYsię
( 3)
(
wiele
– YΣ ( 3)
Y →–MIN
tp (kryteriów ()
( 3) tp ( 3) 2 ( 3)
Y wyboru ) → MIN =optymalnej
d 0 h + d1h yliczby k = { 1, 2, x3, 4+, d5R}+,Pxvtakich
+ dczynników, 1 = {0, 1}(3,) v2 2 = {1, 2, 3}
t + ε–t +Y
ΣR +1(3) 3htp → MIN
R P ( 3 )
+ ε3)t +t–3hYR(+3P) tp2 →y tMIN ( )
+

x 2t + εΣ
t3+h1+ d 3 h x 2tt =Y ( )
t ( 3)
( 3) + 3h t 2 h 1t 3 h 2Y
y t + 3hkryterium
jak = d 0 h + d 1osypiska h yt + d (Onatsky
2 h x1t + d 3 h2009),
t1R
kryteria R 1 informacyjne ((Bai,
3) 2 Ng 2002)( 3oraz ich modyfikacje t

Σ
+ t
+ tp

(Jacobs,
t + 3h
t = R +1 (
( 3)
Yt – Ytp
εt +3h pracy zdecydowano
) → MIN y t + 3h = d 0 h + d1h y t + d 2 h x1t + d 3h x 2t + εt +
) t =

εt +3Otter 2008; Alessi, Barigozzi, Y(tpi3()3) , Capasso


i = 1,Y2,tpi(32010). 3,
)
, i4,=t =1,W R +2,
niniejszej
1 3, 4,
się jednak na in-
εne h
t + 3hpodejście. Wybór optymalnej Ytpliczby czynników Ytpi(3) , i = 1,połączono 2, 3, 4, z wyborem najlepszej liczby opóźnień Ytpi(3) , i =w1, 2, 3, 4,
εt +3h
modelu( 3)n1, przyjmując jako kryterium R+P wyboru R + P zdolność Ytpi(3) (,3prognostyczną
i = (1, 3 ) 2, 3, 4, modelu mierzoną błędem śred-
Σ Yt(3) –– wΣ )( 3Y
(( ( )
( 3)( 3)2
Y R+P ( 3)
1( 3Y)(tp
( 3 )( 3 )
Y –w – 2wY(13tpY) 2tp1 – –ww 3Y
( 3)( 3)
Y –w 4Y Y –→w(MIN )
( 3) 2
, →
t =Σ
) tp R+P
–w 43Y MIN(3),
( ) Σ
R P 2
tp
(3)
Yniokwadratowym tp
prognoz wygasłych. R +1 t
Y
Σ
+
Y 3)1t → MIN
YR +t 1 – wR1+YPtp1 –Rw+ P2Ytp 2 – w3Ytp 3 –Yw(43Y
t =tp
(23tp) 3tp 2 (33tp) 4tp 3
) tp 4) ) tp24
→ MIN ( Y, t – w1Ytp(31) – w2Ytp(32) – w
Σ ( ) 2

Lτt4, t = R +1 t =Σ
t = R +1
R+P
Yt (3) – wY1Y(3tp)(31–) –Y w( ( 3) Y2
)
( 3) tp
2 –MIN w3Ytp(33) – w4t =YRtp+(314) → MIN ,
Yt (=Σ
t = R +1
R+P
( ( 3)
3) Yt ( 3) –2Ytp
( 3) 2
)
→ MIN (3) 2 tp→

Σ ( ) Δ L,τti = 1, 2,Δ3, t tp
–Y → MIN Ytpi R+P

Σ Yt (3) – Ytp(3) Δ→
R +1
Δ Lτt ( ) Lτt MIN
R +1 tp 2
t = R +1

Y (3) , i = 1, 2, 3, 4, Δ Lτt Ytpi , i = 1, 2, 3, 4,t = R +1


( 3 )
χ Y=(3)P–Zw2Ω
R+P 2
ˆχ21(3Z=) PZ Ω ˆ (3)1 Z
Ytpi(3) , i =tpi 1, 2, 3, 4,
Σ ( )
( 3) ( 3) 2
Y w 2Y 1 tp 2 – w3Ytp 3 – w4 Ytp 4 → MIN , ˆ 1
Ytpi(3) , i = 1, 2, 3,χ4,= PZ Ω Z
– ˆ
χ = PZ Ω Z R + P
2
t 1 tp1
R+P t = R +1 2 1 2
0 ≤ φ≤1 B 2 = A 2 + a1 A 1 +εat(11)2 A 0 , B m 2 = A m + a1 A m 1 + a12 A m 2 , B m 1 = a1 A m +
1 0,5 0,5 0,5 1 0,5
θ = 0,1 φ =1 2 W=
B m0=,5 a1 A 1m, 0,5 v1
θ = 0,1 φ =1 W= y t(3) =0b,50 + b01,5y t(_33) + Σ1B i Z t _ i + εt(3)
170 J. Aced ań s k i , J. ε t(3B) e=rnεais, t
(1)
+A. (1 M +a ast1 ) alεt(1e1) rz-Ko
+ (1 +dzis a1 + a12i)= 0ε t(1)2 + (1 + a1 + a12 ) εt(1)3 + … + a1 (1 +
X = FL 0,5 0,5 1
(1)
X = FL y _
t 1 Z t = f t + f t 1 + f t 2 , b0 = 3a 0 (1 + a1 + a12 ) , b1 = a13 , B 0 =
y t(1) = ln(Yt / Yat 1=) b = 0
Podstawą wyznaczania prognoz było równanie1 1 (6). Aby B 2je=zastosowaćA 2 + a1 A 1do + acelów
2
prognostycznych,
1 A 0 , B m 2 = A m + a1 A m 1 + a1 A m 2 ,
2

konieczna
(1)
y t jest (Yt / Yt 1 ) przyszłych
= lnznajomość wartości wektorów czynników w okresie prognozy. Do prognozo-
y t(3) = ln(Yt / Yyt (33)) a f a12 A m ,
B m =autoregresji:
wania tych wartości użyto standardowego modelu
t t wektorowej
y t = ln(Yt / Yt 3 )
( 3)
yt(1) a f t v2
ε (3) = εt(1) + (1 + a1 ) εt(11) + (1 + a1 + a12 )ε t(1)2 + (1 + a1 + a12 ) ε
(1) f t = Σ C i f t i + ε t( f t) (7)
yt a f t i =1v1
y t = a 0 + a1 y t 1 + Σ A i f t i + εyt t _1
(1)
(1) (1) ( 1 )

Parametry C modelu (7),


v1 podobnie jak k = parametry
{1,i =20, 3, 4, 5modelu }, v1 = {(6), 0, 1szacowane
}, v = {1, były 2, 3}metodą najmniej-
y t(1) = a 0 + ia1 y t(11) + Σ A i f t i + εt(1) a = b1 = 0 2
szych kwadratów. i = 0ε (1)
1

y t(+33) h =określić 2 t + εtczynników


( 3)
Aby wybrać najlepszy model t DFM, trzeba d 0 h + dtrzy 1h y t metaparametry:
+ d x + d 3h xliczbę k, licz-
yt( 3) a f2t h 1t + 3h
ε t
(1)
bę dodatkowych opóźnień v1 oraz liczbę opóźnień v2 w modelu VAR dla czynników (7). Ponadto na-
v1
= b0 + b1 yεtt +_ 33h+części
y t(3)uwzględnienia Σ i Z t _ i + εt
( 3)
leży podjąć decyzję dotyczącą B autoregresyjnej (3) v
w równaniu (6). Optymalna kom-
Σ
2
v1 f = C f + ε (f)

0 + b1 y t _ 3 + Σ B i Z t _ i + εt ( 3 )
binacjay tych= bparametrów
( 3 ) ( 3 ) była wybierana łącznie, przez wskazanie
(3) i= 0 t
i =1
i modelu z najmniejszym błędem
t i t
t
średniokwadratowym wygasłych i= 0 prognoz Ytp na jeden kwartał poza 2próbę. Wyboru 3
dokonywano dla
Z = f t + f t 1 + f t 2 , b0 = 3a 0 (1k +=a{11,+2a, 13,) ,4,b51 }=, va1 =, B {0, 1}A= , v0 2, =B{11=, 2A, 31}+. a1 A 0 ,
następującego zbioru możliwych wartości t
R+P
parametrów: 1
0

+ a1Σ
2 3
BiorącZpod t = fuwagę
t + ft 1 + f t 2 , binarny
także b = 3a (1 + a1 +Ya(dotyczący (3) ) , b ( 3=
) , BMIN
) 2a części A 0 , B1 = A1 2+ modelu
0 =autoregresyjnej a1 A 0 , (6), łącznie 2
B02 = A 02 parametr A 1 +t a1 12 –AY0 1tp, B m 1→ 2 y= ( 3)A m + a1 A m 1 +( 3a) 1 A m 2 , B m 1 = a1 A m + a1 A m 1 ,
analizowano 60 modeli. 2 t = R + 1 t + 3 h = d 0 h + d 1 h y t + d 2 h x1t + d 3 h x 2 t + εt + 3 h
B 2 = A 2 + a1 A 1 + a1 A 0 B2m 2 = A m + a1 A m 1 + a1 A m 2 B m 1 = a1 A m + a12 A m 1 ,
, 2
,
B m = a1 A m , (3)
Ytpi , i = 1, 2, 3, 4,εt +3h
2
B m = a1 A m ,
3.3. Modele wskaźników = εt(1) + R(1
ε t(3) wyprzedzających +P
+ a1 ) εt(11) + (1 + a1 + a12 ) ε t(1)2 + (1 + a1 + a12 ) εt(1)3 + … + a1 (1 + a1 ) ε t(1)m +1 + a12 ε
ε t(3) = εt(1) + (1 + a1 ) εyt(1(1)1_)+ (1 + a1 Σ ( )
2 ( 3) (1– ) w Y ( 3) –Yw( 3 )Y2( 3) (– ( 3) ( 3) 2 (1)
+ aY 1 t) ε t 2 +1(1tp+ 1 a1 + tp 2a1tp)2 εt 3w+3Y
1)
… tp 3+ –a1w (14Y+tp 4a1 ) ε→ MIN ,2 (1)
t m + 1 + a1 ε t m
t 1 t = R +1
Wskaźniki wyprzedzające to zmienne, których zmiany w okresie R+P t pozwalają prognozować kształtowa-
yt(1_1)
Σ( )
2
a =
nie się badanych zmiennych.1W literaturze b 1 = 0 Δ Lmożna Y
wyróżnić dwat zasadnicze
( 3)
– Ytp( 3) → MINbadań w tym zakre-
nurty
τt
t = R +1
sie. W pierwszym
a1 = b1 = 0 wskaźnikami ( 3)
wyprzedzającymi są najczęściej pojedyncze zmienne ekonomiczne (zob.
y af
Estrella, Mishkin 1998; McGuckin, tOzyildirim,
t Zarnowitz
ˆ 1 Z Y2000).
(3)
, i =W1,drugim
2, 3, 4, podejściu jako wskaźniki
( 3) χ2 = PZ Ω tpi
yt a f t stosowane są zmienne
wyprzedzające v2 syntetyczne, będące kombinacjami wielu innych zmiennych (zob.
Bai, Ng 2008). Ponieważ tof tdrugie
= CpodejścieΣ
i f t i + ε t w istocie
(f)
nieR +różni
P
się od metod czynnikowych, w niniej- 2
Σ( )
R+P
1 Yt (3) – w1Ytp(31) – w2Ytp(32) – w3Ytp(33) – w4Ytp(34) → MIN ,
Σ
v2

Σ Δ
i =1
ft = Cift i + ε t
szej pracy wybrano podejście
( f ) tradycyjne. Z = L H
τt t =t R +1
P t = R +1
Do prognozowania
i =1 wykorzystywano
k = {1, 2, 3, 4, modele5}, v =o{0postaci:
, 1}, v = {1, 2, 3}
1 2
Δ Lτt
k = {1, 2, 3, 4, 5}, v1 = ({30) , 1}, v 2 =Δ{L1τ,t H 2, t3}
y t + 3h = d 0 h + d1h y t(3) + d 2 h x1t + d 3h x 2t + εt + 3h (8)
y t + 3h = d 0 h + d1h y t + d 2 h x1t + d 3h x 2t +∞εt + 3h
( 3) ( 3)
( P → ) χ = PZ Ω Z
2 ˆ 1

gdzie x1 oraz x2 oznaczają główne εt +3h zmienne, opisane w tabeli 1, d są szacowanymi parametrami, nato-
ih
miast εt +3h jest składnikiem losowym. H t = 1 1
R+P

Ytp(3) Lit
Z= Σ Δ Lτt H t
P t = R +1
Powyższe
Ytp ( 3 ) modele szacowano R+P
oddzielnie dla każdego rozpatrywanego horyzontu prognoz, stosując
Σ ( ) → MIN (l ) –Δmin
) 2 Lτt H t (l )
standardową metodę najmniejszych Yt – kwadratów.
( 3)
Ytp(3m X it , l = 1, 2, …, Lit
R+P 1it = max X it

Σ
Procedura ( 3) selekcji
( 3) 2 głównych zmiennych przebiegała dwuetapowo. Najpierw ze zbioru wszystkich
(Y t
– Ytp ) →
t = R +1
MIN
l

( P
l

→ ∞ )
potencjalnych zmiennych objaśniających
t = R +1
Ytpi(3) , i = 1, 2, 3,wybrano 4, te, co do których podejrzewano, że mogą mieć cha-
1wskazanoLit
1 L1it (kolumna
Σ Σ
rakter wskaźników wyprzedzających. Zmienne
m = te ( X ( l ) w tabeli
– )X
2 5 z Aneksu
, X X it(l ) LI). Były
Y (3)
, i = 1, 2, 3, 4, R + P 2 it Hit t = 1 it it =
to przede wszystkim syntetyczne
tpi wskaźniki L
wyprzedzające, miesięczne L
zmienne it l opisujące dynamikę
Σ
l =1 1

rynku R+P pracy oraz zmienne ( Yt (3) – w1Ytakie


finansowe,
( 3)
tp1 –jak
( 3it)
w2Yindeks
tp 2 – w 3Ytp
WIG,
( 3)
L 3 stopa
it
)
– w4YWIBOR
( 3) 2
tp 4 →czyMIN kurs, EUR/PLN. Następ-

Σ ( )
( 3) ( 3) t = R +1( 3) ( 3) ( 3) 2
nie analizowanoY – w Ywłasności
– w Y w
prognostyczne
– Y – w Y
możliwych → MIN ,
dwuelementowych 1 T kombinacji tych zmiennych.
TX itΣ
t 1 tp 1 2 tp 2 3 tp 3 4 tp 4
m = max m m = ( l ) m 2 it
Ostatecznie do opracowania Δ Lprognoz wybierano i te, które dawały
2najmniejsze błędy X it(średniokwadratowe
t = R +1 l)
τt
1i 1it m1it = max i
t =1
– min , l = 1, 2, …, Lit
l l
Δ Lτt
ˆ 1Z
χ2 = PZ Ω 1 Lit
1 Lit

Σ (X ) ΣX
(l ) 2 (l )
m2it = – X it , X it =
ˆ 1Z
χ2 = PZ Ω Lit l =1
it
Lit l 1
it
R+P
1
R+P
Z= Σ Δ Lτt H t
i= 0
εt(1)
y t(3) = ln(Yt / Yt 3 ) yt(1) a f t
εt(1)
yt(1) a f t v1
y t(1) = a 0 + a1 y t(11) + Σ A i f t i + εt(1)
v1
y t = b0 + b1 y t(_33)(3+) Σ B i Z t _ i (+3) εt(3) v1
( 3)

y t(1) = a 0 + a1 y t(11) + Σ A i f t i +iΣ


Dokładność y t wybranych
=i = 0b0 + vb1 metod
1 yt _3 +
prognozowania...
B Z _ + εt(3) i= 0 171
= 0εt
(1)i t i

i= 0 ε (1)
Z t = f t + f t 1 + f t 2 , b0 = 3a 0 (1 + a1 + a12 ) , b1 t= a13 , B 02 = A 0 , B31 = A1 + a1 A 0 ,
εt(1) Z t = f t + f t 1 + f t 2 , b0 = 3a 0 (1 + a1 + a1 ) , b1 = a1 , B 0 = A 0 , B1 = A1 + a1 A 0
na jeden kwartał poza próbę.
B 2 =Dodatkowe
A 2 + a1 A 1 badania + a12 A 0 ,symulacyjne
B m 2 = A2 m wskazały, + a1 A m (13)że + arozszerzanie równania
v1 (8)a 2 (A
Σ
2
y = 1 A+mb2 ,y (B
b 3)
_ 3 m+1
= a1 A m +
2B i Z t _ i + ε 1 3) m 1 ,
o opóźnione realizacje głównych zmiennych B 2 = nie A 2 prowadziło
+a v1 1 A 1 + a 1
do
A 0
istotnego
, B m 2
t = zwiększenia
A m
0 + a 1
1 A t
m 1
zdolności
+ a 1 A m
pro-
2 , B m
t = a A + a2A
1 1 m 1
i= 0

Σ B i Z t _ i + εt
2( 3)
gnostycznych modeli. B m = ay1t A=m ,b0 + b1 y t _ 3 + ( 3 ) (3 )

Można zauważyć, że w(3większości B m = a12 A mwybrane


przypadków i =,0 pary głównych
Z t = fwskaźników + f t 21 +(1f)t 2miały
ε
, b0 =podob-3a 0 (1 + a1(1+) a12 ) , 2b1 (1=) a1
ε
ny charakter. Jedna ze zmiennych
t
)
= ε (1)
+ (1
t opisywała + a ) ε
( 3)1 rynek
(1)
+ (1 + a +
t 1(1) pracy –1 miesięczne a 2
) ε (1)
+ (1
1(1) t 2 zatrudnienie + a t +
12 a )
(11) lub
+ …
t 3wynagrodzenia+ a 1 2(1 +(1a)1
) ε t m +1 + a1 ε t m
2 + a ) ε 3 + (1 + a2 + a ) ε
) Z t =natomiast
ε
f t + f t 1 +był= ε ,+ (1 +
2 b0 = 3a 0 (1
f t syntetyczny a ) ε +
+ a1 + B(1 + a ) , b1 =+aa1 ,AB 0+=a AA0 , ,BB1 = A=1 …
a1wyprzedzający. + + a1 (1
Aam1 A
+ , + a1 ) ε t
2 = A +a 0 1A m 1 + a
t t 1 t 1 1 1 t 2 1 1 t 3
w sektorze przedsiębiorstw.
yt(1_Drugą wskaźnik 2 1 1 1 0 m 2
1
y (1_)
B 2 = A 2 +t a11 A 1 + a12 A 0 , B m 2 = A m B + a1=A am 21A+ a,12 A m 2 , B m 1 = a1 A m + a12 A m 1 ,
a1 = b1 = 0 m 1 m
2 a1 = b1 = 0
3.4. Prognozy łączone( 3) B m = a1 A m , ε t(3) = εt(1) + (1 + a1 ) εt(11) + (1 + a1 + a12 )ε t(1)2 + (1 + a
yt a f t ( 3)
)y t a f ε (1)
Punktem wyjścia do tworzeniav2εprognoz t
( 3)
= εt(1łączonych
+ (1 + ta1były + (1 + a1 +
) t 1 prognozy a12 )εyt(t(11_)21) za
uzyskane + (1 a12 ) εt(1)3 + …czte-
+ a1 + najlepszych
pomocą + a1 (1 + a1 ) ε t(1)m +1 + a12
f t = ΣyCpowyżej
rech modeli z każdej omówionej (1i) f t i + εgrupy.
(f)
v2 W najprostszym przypadku wszystkie prognozy miały

Σ Ccząstkowych,
t
i =1 t _1
f = ift i + ε t
(f) a1 = b1 = 0
równe wagi. Biorąc pod uwagę jakość prognoz t
i =1
badano także jakość prognoz łączonych,
w których nie uwzględniano
k = {1modeli, a21, =3,b41VAR
,=5}0, oraz
v1 = {BVAR.
0, 1}, vUzyskane
2 = {1, 2, 3}
wyniki yt( 3porównywano
)
a ft z prognozami
otrzymanymi przy zastosowaniu optymalnych k = {1, 2wag , 3, 4ex, 5post.
}, v1Dzięki
= {0, 1temu
}, v 2 można = {1, 2,było 3} ocenić, na ile wy-
( 3)
a f t ywag
y t(+33) h =ytdrównych 2 t + εt + 3 h
( 3)
0h + d d 2 h x1t + dod
+odbiegają 3( 3h)xnajlepszego
v2
niki uzyskane przy zastosowaniu wyniku, który( fmożna byłoby
Σ ε )
1h ( 3)t
y t + 3h = dwagi.
0 h + d 1h y t + d 2 h x1t f+t =d 3h x 2C i f tεit ++
t +
osiągnąć w danej próbie, optymalniev2 dobierając i =1
3h t

Wagi optymalne byłyεtwyznaczane


+3h f =
t C t i + εt
wi fnastępujący
i =1 εt + 3h
Σ
(f)
sposób. Ponieważ jako kryterium jakości prognoz
k = {1, 2,poza 3, 4,próbę,
5}, v1 =
wykorzystano błąd średniokwadratowy prognoz wygasłych na jeden kwartał {0, poszu-
więc 1}, v 2 = {1, 2, 3}
(3)
kiwano takich prognoz Ytp , by: k = {1, 2, 3,(34) , 5}, v1 = {0, 1}, v 2 = {1, 2,y3(3}) = d + d y (3) + d x + d x + ε
Ytp t + 3h 0h 1h t 2 h 1t 3h 2t t + 3h
R+P

Σ (Y ) d1h y t(3) + d2 2 h x1t + d 3h x 2t ε+ εt + 3h


( 3) ( 3) ( 3) 2
y Yt– d → MIN
= R0+hP +
Σ Yt – Ytp → MIN
+ 3 h tp
t = R +1
t
(
( 3) ( 3)
) t +3h
(9)
ε t = R +1
Ytpi(3) , i =t +1,3h 2, 3, 4, (3) Ytp(3)
Ytpi , i = 1, 2, 3, 4,
(3)
gdzie R oznacza długość R + Ppróby, Y na podstawie której szacowano parametry R+P modeli, a2 P jest długością
Σ ( Σ ) ( )
( 3) tp ( 3) ( 3) ( 3) ( 3) 2
okresu weryfikacji prognoz. Y – w Y R + P– w Y – w Y – w Y → YMIN( 3)
– ,Ytp( 3) 2 → MIN
( 3) Σ ( 3t) 2
t = R +1
t
R+P
1 tp1
(
(23) tp 2 (33) tp 3 (43) tp 4
Y – w1Ytp1 – w2Ytp 2 – wt3=YRtp+13 – w4Ytp(34) → MIN , ( 3) t
)
ΣR +1 Yt t =–liniową
R +Y (
1tp → MIN )
Prognoza łączona jestΔ Lτt kombinacją
t = prognoz składowych Ytpi( 3) , i = 1, 2, 3, 4, więc problem
(9) można też przedstawić jako: ( 3) Δ Lτt
Ytpi , i = 1, 2, 3, 4, R+P

Σ ( ) 2
χ = PZ Ω Z 2
2 ˆ 1
Yt (3) – w1Ytp(31) – w2Ytp(32) – w3Ytp(33) – w4Ytp(34) → MI
R+P χ = PZ Ω Z ˆ 1
t = R +1

Σ ( )
2
Y (3) – w1Ytp(31) – w2Ytp(32) – w3Ytp(33) – w4Ytp(34) → MIN ,
R+Pt (10)
1t = R +1
Z= Σ τt Z t= 1 Δ L H
Δ L H R+P Δ L τt
P t = R +1
Δ Lτt Σ
P t = R +1
τt t

Δ Lτt H t
gdzie wi reprezentują wagi. χ2 = PZ Ω ˆ 1Z
Δ Lτ1t H t
χ2 = PZ Ω ˆ Z
Rozwiązanie problemu
( P →(10) ∞ )jest tożsame ze znalezieniem ocen parametrów liniowego modelu eko-
R+P
1
nometrycznego bez wyrazu wolnego,Rw (+P
P →
którym ∞ ) jako wartości zmiennej
Z = Σ
objaśnianej
Δ Lτt H t
P t = R +1 występują rzeczy-
1
H = 1
wiste realizacje zmiennejt prognozowanej,
Z= Σ Δ L=aτt1H
P t = RH+1t były
jakot
zmienne objaśniające – prognozy uzyskane różnymi
metodami. Innymi słowyL wagi dobierane w taki sposób, by przyΔdanych Lτt H t prognozach cząstkowych
it
błąd średniokwadratowy prognoz Δ Lτt H wygasłych Lit był jak najmniejszy.
t
(P →∞)
m1it = max X it(l ) – min X it(l ) , l(l=) 1, 2, …,(l L it
( P l→ ∞ )m1it =l max X it – min l
X it ) , l H = 1,=2, 1 …, Lit
l t

H 1= 1Lit 1 Lit L(l )it


Σ ( ) Σ2 X it
(l ) 2
m2it = t X – X Lit, X =
1 1 Lit (l )
LitLit l =1 m2it = L Σ X it –LX ( Lit Σ
)
it it it(l )
it itl 1 , X it = X it
it l =1 m1it = max lX1 ( l ) – min X ( l ) , l = 1, 2, …, L
it it it
l l
0,5 0,5 1
X = FL

172 y t(1) = lnJ.(YAced 1 ) s k i , J. B e rn ais, A. M ast al e rz-Ko dzis


t / Yt ań

y t(3) = ln(Yt / Yt 3 )
4. Metodologiayt(1badania
)
a ft
v1
4.1. Schemat prognostyczny
y t(1) = a 0 + a1 y t(11) + ΣA f + εt
(1)
i t i
i= 0

Podstawą oceny zdolności prognostycznych rozważanych modeli był błąd średniokwadratowy pro-
εt(1)
gnoz wygasłych dla horyzontu τ = 1, 2, 3, 4 kwartały. Kryterium to jest bardzo popularne i stosowane
w wielu opracowaniach. Wyniki prezentowane v1 w niniejszej pracy dotyczą rolowanego schematu pro-
Σ t i + ε
( 3) ( 3) (3)
y
gnozowania (ang. rolling
t = b0 + b
scheme), y
1 tw _ + B
3 którymi liczbaZ _ obserwacji
t wykorzystywanych do szacowania para-
i= 0
metrów modeli jest stała i oznaczana przez R. Wydaje się, że takie podejście jest bardziej uzasadnione
od schematu rekursywnego (ang. recursive scheme) ze zwiększającą się liczebnością próby estymacyjnej
Z = f t + f t 1 + f t 2 , b0 = 3a 0 (1 + a1 + a12 ) , b1 = a13 , B 0 = A 0 , B1 = A1 + a1 A 0 ,
ze względu na ciągłet zmiany strukturalne zachodzące w polskiej gospodarce. Badania, których wyniki
przedstawiono w podrozdziale
B 2 = A 2 + a5.4, wskazały,2 że stosowanie schematu rekursywnego2 w większości2 przy-
1 A 1 + a1 A 0 , B m 2 = A m + a1 A m 1 + a1 A m 2 , B m 1 = a1 A m + a1 A m 1 ,
padków nie prowadziło do istotnego zmniejszania się błędów prognoz.
B m = a12liczby
Z powodu niewielkiej A m , obserwacji prognozowanych zmiennych rozważano próby estymacyj-
ne liczące 20 oraz 30(3)obserwacji kwartalnych, czyli liczba obserwacji miesięcznych wynosiła R = 60 oraz
ε t = εt(1) + (1 + a1 ) εt(11) + (1 + a1 + a12 )ε t(1)2 + (1 + a1 + a12 ) εt(1)3 + … + a1 (1 + a1 ) ε t(1)m +1 + a12 ε t(1)m
R = 90. W pierwszym przypadku ocena prognoz obejmowała okres od II kwartału 2004 do II kwartału
2013 r., w drugim natomiast
yt(1_1) okres od IV kwartału 2006 do II kwartału 2013 r. W przypadku krótszych
prób estymacyjnych liczba postawionych prognoz była równa P = 102, a dla prób dłuższych P = 72. Po-
a1 = b1 = 0zawsze z zachowaniem struktury dostępnych informacji na końcu próby
szczególne próby tworzono
w danym momencie, za każdym razem cofając się o jeden miesiąc. Uwzględniano też relację pomię-
yt( 3) a f t
dzy dostępnością danych miesięcznych oraz kwartalnych. W zależności od miesiąca dostępne były dane
z jednego, dwóch lub trzech v miesięcy z kwartału następującego po ostatnim kwartale, z którego po-
Σ
2

ift i + ε t
(f)
chodziły dostępnef t dane
= oCzmiennych prognozowanych. Można więc powiedzieć, że dane miesięczne
i =1
wyprzedzały dane kwartalne o jeden, dwa lub trzy miesiące. Takie podejście miało na celu odwzorowa-
nie rzeczywistej sytuacji,
k = {1, 2z, 3którą , 4, 5ma }, vdo czynienia, badacz opracowujący prognozy w każdym miesiącu.
1 = {0, 1} v 2 = {1, 2, 3}
Należy jeszcze zaznaczyć, że najlepsze modele z każdej grupy były wybierane ze względu na błąd
średniokwadratowy y t(+3prognoz
)
3h = d 0 h na + djeden ( 3)
1h y t kwartał
+ d 2 h x1do d 3 h x 2 t + εt + 3 h
t + przodu.

εt +3h
4.2. Testy zdolności prognostycznych
Ytp(3)
Do badania istotnościR + P zaobserwowanych różnic między zdolnościami prognostycznymi stosowano test

Σ( )3) 2
Diebolda i Mariano (Diebold,Yt (3) – Ytp(Mariano
→ MIN
1995) oraz test warunkowej zdolności prognostycznej CPA (ang.
conditional predictive ability) opracowany przez Giacominiego i White’a (2006). Poniżej krótko omówio-
t = R +1

no drugi z testów, Ytpiktóry


(3)
, i =stanowi
1, 2, 3, uogólnienie
4, testu Diebolda i Mariano.
Test CPA umożliwia warunkowe porównywanie zdolności prognostycznych dwóch modeli,
z uwzględnieniem R + P dodatkowych informacji dostępnych w momencie budowy prognoz. Pozwala więc

Σ( )
2
Yt (3) – w1Ytp(31) – w2Ytp(32) – w3Ytp(33) – w4Ytp(34) → MIN ,
odpowiedzieć na pytanie, czy po wprowadzeniu określonej informacji dodatkowej jeden z modeli
t = R +1
rzeczywiście będzie generował lepsze prognozy.
Jeżeli przez Δ Lτt oznaczyć różnicę między kwadratami błędów prognoz wygasłych o horyzoncie τ,
uzyskanych za pomocą dwóch różnych modeli w okresie t, natomiast przez Ht – h-elementowy wektor
informacji dodatkowej
χ2 = Pdostępnej
ZΩ ˆ 1 Z w momencie formułowania prognoz, to statystyka testowa testu CPA
przyjmuje postać:
R+P
1
Z= Σ Δ Lτt H t
P t = R +1

Δ Lτt H t
Ytpi(3) , i = 1, 2, 3, 4, B 2 = A 2 + a1 A 1 + a1 A 0 , B m 2 = A m + 2a1 A m 1 + a3 1 A m 2R,+ PB m 1 = a1 A m + a1 A m 1 ,
3, +4,a1R++ Pa1 ) , b1 = a1 , B 0 = A 0Y, (B
Σ
Z t = f t + f t 1 + fYt tpi(23,) ,bi0==1,3a2,0 (1 3) = A ( 3+ ) a A , ( 3)
R+P ( 1– w Y1 –1w20Ytp2 2 – w3Ytp 3
(3

Σ Yt R + P–Yw(13Y) tp–1 w–Yw(32)Ytp–2w–YBBw(2m33Y) ==tp–3Awa–12YAw+(m34a)Y,1–tpA4Rw1+ P+Y→ =, At =Σ


( ( 3) ( 3) ( 3) ( 3 ) 2 (
)
3 ) 2
MIN , ( ( 3) ( 3) ( 3) t
Yt – w1Ytp12 – w2t =YRtp+12 – w3Ytp 3 – w4Y2tp 4 → MIN ( 31) tp1
) ( 3)

t = R +1
Σ
t = R +1
(t 1 tp1 2 tp( 32) 3(1) tp 3
( )
a(312) A2 0→
ε t = ε2t + (1 +Σa1 ) tεt 1 + (11 +tp1a1 + a21 )tpε2t 2 + (1
4 tp 4( 3(1) )
Y –
, BMIN
w Y
m 2
( 3)
– w
m 1 a1 A m 1 + a1 A m 2 , B
R ++
2Y ( 3)(1)– w Y ( 3) – w Y
3 tp +3 a1 + a ) 2 m 1
2 ( 3) (1) → MIN ,
4 1 tp
= a1 A m + a1 A m 1 ,
)4εΔt L3 τ+t … + a1 (1 + a1 ) ε t(1)m +1 + a12 ε t(
Δ Lτt B m
Dokładność
= a 1 A m , wybranych
t = R +1 metod prognozowania...
Δ Lτt 173
Δ Lτt
(1)
y _
t 1
ε t(3) = εt(1) + (1 +ΔaL1 )τtεt(11) + (1 + a1 + a12 2)ε t(1)2 + (1 +1a1 + a12 ) εχt(21)3=+P… Z+Ω ˆa 1(1
1 Z + a1 ) ε t m + 1 + a1 ε t
(1) 2 (

χ = PZ Ω Z
2 ˆ 1
a1 = b1 = 0 χ = PZ Ω Z ˆ
χ2 = PZ Ω ˆ 1Z yt(1_1)
χ = PZ Ω ˆ Z 1
R+P

Σ Δ(11)Lτt H t
2 1
R+P y ( 3)
a f 1
R+P Z =
Σ
1
Σ1 Δ
t t
Z= Δ L R +H P a = b = 0 Z = L H P t = R +1
gdzie PZt ==R +1 Σ Δ Lτt H t , natomiast
τ t t 1 1 τ t t
v2 Ω̂ oznacza oszacowanie 1
R+P
macierzy kowariancji P t = R +1 wektorów o postaci
P t = R +1 f yt t= Σ
( 3 ) C
a ft i t i f + ε Z ( f= )
Σ
P t = R +1
Δ L τ t H t
Δ Lτt H t
Δ Lτt H t
Δ Lτt H t , uzyskane metodą Neweya
t
i =1 i Westa.
Δ Lτt H t (P →∞)
4, 5}Δ, (Lvf τ)t H
v2
fkt =={liczbie1Σ , 2C , 3i f,porównywanych
t i + εt 1
= t{0, 1}prognoz
, v 2 = {1(,P2,→ 3}∞ ) , statystyka testowa ma roz-
(P → ∞)
Asymptotycznie, przy dużej
kład χ(2 P ∞)
z h→stopniami swobody.(3W
i =1
) przypadku braku ( 3) warunkowej informacji dodatkowej H t = 1 . Wtedy
H = 1 y t + 3h = d 0 h + d 1h y t
(P → +∞d)2 h x1t + d 3h xH 2 t + =εt1+ 3 h
teżt test CPA jest tożsamy z testem k = {1, 2Diebolda , 3, 4, 5},i vMariano. = {0, 1}Test , v 2 =Giacominiego
{1, 2t, 3} i White’a może być stoso-
Ht = 1 1 Lit
wany
Lit w przypadku rolowanego εt +(33schematu prognozowania.
H t ( 3)= 1 Dla schematuL it
rekursywnego asymptotyczny
3 h x 2 t + εt + 3 h wartości krytycznych testu( l )
)h
rozkładLstatystyki testowej niey tjest = d 0 h +W
+ 3 h znany.
d1takiej
h yt d 2 h x1t +dodwyznaczenia
+sytuacji
it
Lit m (l=) max X it – min X it(l ) , l = 1,
można wykorzystać (l )
m1it = max X it min X it Y – metody ( l ) bootstrapowe.
, l = 1, 2, …, Lit
( 3 ) Test bezwarunkowy wskazuje,
m = max któreX ( l )podejście1itgenerowało
– min X it , l =l 1, 2, …, Ll it
dokładniejsze prognozy. εtp l ) uznać, że powinno także wskazywać, 1it it
m1itl = max X it(l ) – Można
min tX+3it(hwięc , l = 1, 2, …, Lit (l )
l
które podejściel
będzie lep-
l l m = max X – min X it(l ) , l = 1, 2, …, Lit
sze w pewnym, bliżej nieokreślonym momencie w przyszłości. Test
l względny odpowiada natomiast 1 na Lit

Σ
R P 1 it it
( )
+

Σ
2

) ( )
1 ( 3 )Y ( 3) – Y ( 3)Lit → MIN
1
2 l
1 Lit m =2
( l ) prognoz wyga- 1 it
X (lL)it – X(lit) , X it
Σ Lit Σ
Lit

Σ=1 1X itLit –podejście, Σ


pytanie, czy na podstawie innychY t informacji dostępnych w próbie, poza średnią ( jakością ) 2 it
m2it = ( (l ) 2
X it t = R,+1X it2 =
tp
tp (l )
1X it Lit (l ) L m2it = X it – X it , Xitit l==1 L X it
Lit Σ mit 2itΣ
m2itLit= lwskazać
słych, można X (
(l )
– X ) które , XLbędzie =l 1 generowało X 1 prognozy lepsze L
w it określonych
l =1 1 Lit warunkach. l 1

Lit Σ Lit Σ
( )
it it 2
it R P it it it
+
X it(l ) – X it , X it = X it(l )
Σ
( 3)3,2L 1=
l =1
(
Ytpi(3) Y , it (3=) –1,Y2, ) 4, →l MIN 1 T
T Σ
tp l =1 l 1
t = R +1 T
1 m = max1 1it m
T m =
m 2i R=+ P(3) Σ m 2i = i Σ m 2it
1i 2i
m max m1it sekwencyjnego
1i = Wpływ m12itT (3) m1i =(3max m1it
4.3. ( 3) odsezonowania zmiennych
Σ
t =1
m1ii = max m1it Ytpi (
mTY2i,tt =i=1=–1,wΣ Ym
12, tp3,
( 3)
– w2Ytp 2 – w3Ytp 3 – w4Ytp 4 1→TMIN ,
12 it4,
( 3)
) ) 2i
T t =1
i t = R +1 T t =1 m1i = max m1it m 2i = Σ m 2it
i T 1
Należy zaznaczyć, że w pracy R + P każdorazowo nie dokonywano odsezonowaniat =szeregów czasowych, lecz
Σ ( ) ( 3) 2
Δ L Y ( 3)
– w Y ( 3)
badano szereg już wcześniej pozbawiony sezonowości. Pod tym względem badanie różniło się od rze-
τt t 1 tp 1 – w 2 Y ( 3)
tp 2 – w 3 Y ( 3)
tp 3 – w 4 Y tp 4 → MIN ,
t = R +1
czywistych sytuacji. Sekwencyjne dodawanie kolejnych obserwacji zmienia nieco wartości odsezonowa-
χΔ2 L=τt PZnaΩ
nych obserwacji, co może wpływać ˆ zdolności
1
Z prognostyczne omawianych metod.
Aby ocenić skalę wahań wartości obserwacji w wyniku sekwencyjnego odsezonowania szeregów,
R+P
1
Σ
przeprowadzono następującą2 analizę. ˆΔDla
1 każdej zmiennej dokonywano sekwencyjnego odsezonowa-
χ == PZ Ω
Z LZτt H t
nia, za każdym razem dodając naPkońcu t = R +1 próby jedną obserwację. Stosowano procedurę TRAMO/SEATS
z automatyczną identyfikacją modeli R + P(RSA = 4; zob. Gomez, Maravall 1998). Następnie każdy odsezo-
1
nowany szereg sprowadzono Δ
ZLdo=τt Hpostaci
t
P t = R +1
Δ Lstacjonarnej
τt H t Σ
oraz zestandaryzowano. W rezultacie dla każdej
zmiennej i oraz obserwacji t uzyskano Lit wartości z usuniętą sezonowością. Liczba ta zależy od tego,
(P →∞)
jaką długość ma cały szeregΔiLjaką
τt H t
pozycję zajmuje w nim dana obserwacja. W zasadzie im późniejsza
obserwacja, tym mniej obliczano
H t = 1dla niej wartości odsezonowanych. W dalszej kolejności dla każdej ob-
( P → ∞ różnicę:
serwacji wyznaczano maksymalną )
Lit
Ht = 1
mL1it = max X it(l ) – min X it(l ) , l = 1, 2, …, Lit (12)
it l l

oraz odchylenie standardowe:


m1it = max (l )
1 XLitit – (min X it(l ) 2, l = 1, 2, …,
1 LL
Σ( ) Σ
it
l) it ( l )
m2it = l X it l – X it , X it = X it
Lit l =1 Lit l 1

1 Lit
1 Lit

Σ ( ) ΣX (13)
2
m2it = X it(l ) – X it , XTit = (l )
1 it
m1i = maxLmit l =1
1it m 2i = Σ m 2itLit l 1
i T t =1
1 T
m1i = max m1it
i
m 2i =
T Σm
t =1
2 it
Lit

m1it = max X it(l ) – min X it(l ) , l = 1, 2, …, Lit


l l
174 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

1 Lit
1 Lit (l )
Σ (X Lit Σ
)
(l ) 2
m2it = it X it
– X it , X it =
l =1Lit l 1
Na koniec dla każdej zmiennej wyznaczono maksymalną wartość m1it oraz średnią wartość m2it :
1 T
m1i = max m1it
i
m 2i =
T Σm
t =1
2 it (14)

Miary te wskazują więc maksymalną różnicę oraz średnie odchylenie standardowe poszczególnych
obserwacji spowodowane sekwencyjnym odsezonowaniem, mierzone w stosunku do odchylenia stan-
dardowego szeregu odsezonowanego, pozbawionego trendu oraz zestandaryzowanego.

5. Wyniki

5.1. Przeciętna dokładność prognoz

W tabeli 2 przedstawiono błędy średniokwadratowe, wyrażone w punktach procentowych, prognoz wy-


gasłych uzyskanych za pomocą najlepszych modeli z każdej badanej grupy. Liczba gwiazdek przy wy-
nikach wskazuje, w ilu porównaniach parami za pomocą testu Diebolda i Mariano dany model okazał
się istotnie lepszy od modelu konkurencyjnego. Analizując przedstawione wyniki, można zauważyć
kilka prawidłowości. Po pierwsze, w przypadku horyzontu τ wynoszącego jeden kwartał największą
dokładnością cechowały się zawsze prognozy łączone z modeli DF oraz LI. W odniesieniu do dynamiki
liczby pracujących w gospodarce narodowej oraz liczby pracujących według BAEL przewaga prognoz
łączonych nad wszystkimi innymi modelami była istotna statystycznie. Wniosek ten dotyczy również
dłuższych horyzontów dla tych dwóch zmiennych przy krótszych próbach estymacyjnych, liczących 60
obserwacji. W tabeli 2 nie przedstawiono wyników prognoz łączonych dla wszystkich czterech grup mo-
deli, gdyż prawie we wszystkich analizowanych przypadkach cechowały się większymi błędami w po-
równaniu z prognozami łączonymi uwzględniającymi tylko modele DF oraz LI.
Jednocześnie rozpatrując w dalszym ciągu horyzont jednego kwartału, można zauważyć, że mo-
dele autoregresyjne VAR i BVAR wypadały gorzej od modeli DF oraz LI, przy czym nie we wszystkich
przypadkach różnica ta była statystycznie istotna. Jedynie prognozy dynamiki wynagrodzeń uzyskane
za pomocą modeli autoregresyjnych przy próbach liczących 60 obserwacji były nieco lepsze od prognoz
najlepszego z modeli czynnikowych. Przewagę modeli DF oraz LI nad modelami autoregresyjnymi ob-
serwowano także w przypadku większości dłuższych horyzontów prognoz.
Powyższe obserwacje spowodowały, że przy łączeniu prognoz brano pod uwagę jedynie modele DF
oraz LI. Słuszność tej decyzji potwierdza porównanie błędów prognoz generowanych za pomocą modeli
łączonych DF + LI i modeli łączonych z optymalnymi wagami ex post (JO OPT). Poza przypadkiem wska-
zanym w poprzednim akapicie różnice te nie przekraczały jednego punktu bazowego. Branie pod uwa-
gę tylko modeli DF oraz LI przy łączeniu prognoz okazało się więc wyborem zbliżonym do optymalnego.
Rezultaty porównań modeli DF z LI okazały się niejednoznaczne. Przykładowo w prognozowaniu
dynamiki wynagrodzeń przy krótszych próbach lepiej sprawdzały się modele LI. Z kolei w przypadku
dłuższych prób większą dokładnością charakteryzowały się modele DF. Ponadto w prognozowaniu licz-
by pracujących w gospodarce narodowej lepsze wyniki dawały modele DF, a w odniesieniu do liczby
pracujących – modele LI. Również porównywanie modeli VAR z BVAR dawało niejednoznaczne wnio-
ski. Można jedynie zauważyć, że najlepsze prognozy generowane były przez modele VAR z niewielką
liczbą opóźnień, tymczasem w odniesieniu do modeli BVAR korzystniejsze było ich rozbudowanie.
Dokładność wybranych metod prognozowania... 175

5.2. Warunkowa dokładność prognoz

Rezultaty przedstawione w poprzednim podpunkcie są wynikami uśrednionymi. Aby zbadać warun-


kową dokładność prognoz, przeprowadzono dwa ćwiczenia. Na wykresach 3−5 przedstawiono kształ-
towanie się w czasie błędów absolutnych prognoz dla poszczególnych modeli przy próbach estyma-
cyjnych liczących 60 obserwacji. W celu uzyskania większej czytelności błędy wygładzono, obliczając
pięciookresowe średnie ruchome. Mimo to trudno wysnuć jednoznaczne wnioski. Można zauważyć,
że błędy wygładzone są dość silnie skorelowane, przy czym w ostatnich dwóch latach zróżnicowanie
dokładności prognoz było niewielkie, co prawdopodobnie ma związek ze zmniejszeniem się wahań
zmiennych prognozowanych w tym okresie. W przypadku prognozowania dynamiki liczby pracują-
cych w gospodarce narodowej oraz liczby pracujących według BAEL widać, że w początkowym okre-
sie weryfikacji prognoz modele LI zwykle cechowały się najmniejszą dokładnością, która z czasem
stopniowo się poprawiała.
Aby zbadać, czy istnieje zależność pomiędzy odmiennymi zdolnościami prognostycznymi poszcze-
gólnych modeli a wartościami zmiennych prognozowanych, przeprowadzono testy warunkowych zdol-
ności prognostycznych Giacominiego i White’a, gdzie jako zmienną instrumentalną przyjęto zmienne
prognozowane. Zamierzano zidentyfikować pary modeli, które różniły się warunkowymi zdolnościami
prognostycznymi w taki sposób, że przy wysokich wartościach zmiennej prognozowanej jeden z mode-
li dawał prognozy obarczone mniejszym błędem niż drugi, a przy niskich wartościach badanej zmien-
nej zachodziła sytuacja odwrotna. Poszukiwano przypadków, w których test CPA wskazywał na staty-
stycznie istotne różnice, natomiast test Diebolda i Mariano nie wykazywał istotnych różnic. Biorąc pod
uwagę dwie różne długości prób, cztery horyzonty prognoz oraz wszystkie możliwe pary modeli, dla
dynamiki wynagrodzeń zidentyfikowano łącznie siedem takich przypadków, natomiast dla liczby pra-
cujących w gospodarce narodowej i pracujących według BAEL było to, odpowiednio, osiem oraz pięć
przypadków.
Aby dodatkowo ocenić siłę obserwowanych zależności, liczono kwadraty wartości współczynników
korelacji liniowej Pearsona pomiędzy zmiennymi prognozowanymi a różnicami kwadratów błędów
predykcji dla danej pary modeli. W żadnym przypadku nie przekraczały one 0,15. Szczegółowe wyni-
ki zawiera tabela 6. Należy dodać, że nawet gdy analizowano wszystkie statystycznie istotne różnice
między warunkowymi zdolnościami prognostycznymi niezależnie od rezultatów testu Diebolda i Ma-
riano, współczynniki nie były dużo wyższe. Można więc stwierdzić, że różnice te występowały rzadko
i były niewielkie.

5.3. Dokładność prognoz a napływ nowych danych miesięcznych

Aby ocenić, czy napływ nowych danych miesięcznych poprawia zdolności prognostyczne modeli, ana-
lizowano przeciętną dokładność prognoz osobno dla trzech możliwych wartości wyprzedzeń danych
miesięcznych względem danych kwartalnych. Wyniki badań znajdują się w tabelach 7−9. Widać, że
różnice pomiędzy modelami przy różnej liczbie wyprzedzeń są bardzo niewielkie. Świadczy to, że na-
pływ nowych danych miesięcznych nie prowadził do poprawy zdolności prognostycznych analizowa-
nych modeli.
176 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

Należy zaznaczyć, że przedstawione wyniki dotyczą modeli najlepszych z punktu widzenia zdol-
ności prognostycznych dla wszystkich wyprzedzeń łącznie, a więc tych samych modeli, co w tabeli 2.
Powyższy wniosek nie zmieniłby się jednak, gdyby do porównań wzięto modele dające najlepsze pro-
gnozy dla danego wyprzedzenia.

5.4. Schemat rolowany czy schemat rekursywny?

W tabeli 3 zestawiono średnie błędy prognoz uzyskane przy zastosowaniu rekursywnego schematu
prognozowania. Porównując je z wynikami zawartymi w tabeli 2, trudno sformułować jednoznacz-
ną odpowiedź na pytanie postawione w tytule podrozdziału. Widać jedynie, że schemat rekursywny
wyraźnie poprawiał zdolności prognostyczne modeli VAR. Poprawa ta nastąpiła prawie we wszystkich
analizowanych przypadkach. Można także zauważyć również, że gdy prognozowano dynamikę wy-
nagrodzeń za pomocą schematu rolowanego z próbą R = 60 obserwacji, wszystkie metody generowały
mniej dokładne prognozy, niż gdy stosowano schemat rekursywny. Z drugiej jednak strony, jeśliby brać
pod uwagę prognozy na jeden kwartał do przodu uzyskane za pomocą najlepszych modeli łączonych
(DF + LI), to poza wspomnianym powyżej przypadkiem schemat rolowany dawał lepsze wyniki bądź
takie same.

5.5. Długość prób a dokładność prognoz

Gdy ocenia się, jak długość próby estymacyjnej w schemacie rolowanym wpływa na jakość prognoz, nie
można bezpośrednio porównywać rezultatów zestawionych w tabeli 2. Odmienne były bowiem okresy
weryfikacji prognoz dla prób liczących 60 oraz 90 obserwacji miesięcznych. W celu zapewnienia porów-
nywalności prognozy wyznaczane na podstawie krótszych prób poddano ocenie w tym samym okresie,
jaki stosowano przy próbach dłuższych. Wyniki takich analiz przedstawiono w tabeli 4.
Wyraźną różnicę w dokładności prognoz widać jedynie w przypadku dynamiki wynagrodzeń.
Wszystkie modele generowały tu dokładniejsze prognozy, jeżeli do oszacowania ich parametrów wyko-
rzystano dłuższe próby. W przypadku dwóch pozostałych zmiennych zróżnicowanie dokładności pro-
gnoz nie jest już tak wyraźne. Warto jednak odnotować, że prognozy otrzymywane za pomocą modeli
łączonych DF + LI prawie zawsze były dokładniejsze, gdy stosowano dłuższe próby.

5.6. Wahania spowodowane sekwencyjnym odsezonowaniem zmiennych

W tabeli 6 dla każdej zmiennej zestawiono wartości statystyk m1 oraz m2, oceniających poziom wahań
poszczególnych obserwacji występujących w wyniku sekwencyjnego odsezonowania zmiennych. Moż-
na zauważyć, że zastosowana procedura eliminacji wahań sezonowych przy dodawaniu kolejnych ob-
serwacji na końcach szeregów w niektórych przypadkach powodowała dość duże wahania wartości po-
szczególnych obserwacji. Maksymalne różnice między wartościami większości zmiennych przekraczały
odchylenie standardowe szeregu, czasami nawet kilkakrotnie. Jednocześnie wahania średnie stanowiły
zwykle około kilkunastu procent wahań badanej zmiennej, co należy uznać za wynik umiarkowany.
Dokładność wybranych metod prognozowania... 177

Wahania zmiennych prognozowanych były nieco wyższe niż większości omawianych zmiennych. Mak-
symalne różnice przekraczały trzykrotność standardowych odchyleń szeregów, a uśrednione stanowiły
około 20% zmienności.
Powyższe rezultaty wskazują, że przyjęta metoda oraz sekwencyjność odsezonowania szeregów
wywołują ich wahania, których nie można ignorować. Na podstawie przeprowadzonych analiz trud-
no jednak ocenić, jaki jest wpływ tych czynników na zdolności prognostyczne rozpatrywanych modeli.
W tym zakresie potrzebne są dalsze badania.

6. Podsumowanie

W artykule analizowano dokładność prognoz wybranych zmiennych charakteryzujących rynek pracy


w Polsce w latach 1998−2013. Zastosowano modele wektorowej autoregresji VAR, bayesowskie mode-
le VAR, dynamiczne modele czynnikowe, modele wskaźników wyprzedzających oraz metody łączenia
prognoz.
Na podstawie przeprowadzonych analiz można uznać, że w badanym okresie prognozy łączone
uzyskane za pomocą modeli czynnikowych oraz modeli wskaźników wyprzedzających cechowały się
największą dokładnością mierzoną błędem średniokwadratowym prognoz wygasłych. Ponadto progno-
zy uzyskane w wyniku zastosowania indywidualnych modeli czynnikowych oraz wskaźników były do-
kładniejsze niż prognozy wygenerowane przez modele wektorowej autoregresji. Wyniki badań nie po-
twierdzają jednak prawdziwości hipotezy, że wraz z napływem kolejnych danych miesięcznych wzrasta
dokładność prognoz na dany kwartał uzyskiwanych za pomocą modeli wskaźników wyprzedzających
oraz dynamicznych modeli czynnikowych.
Dodatkowo pokazano, że rodzaj schematu prognozowania oraz długość prób służących do esty-
macji parametrów nie miały dużego wpływu na zdolności prognostyczne analizowanych modeli w
przypadku dynamiki liczby pracujących. Prognozy dynamiki zatrudnienia uzyskane na podstawie
krótszych prób z zastosowaniem schematu rolowanego były wyraźnie mniej dokładne od pozostałych.
W schemacie rolowanym mniejsza była także dokładność prognoz sporządzanych za pomocą modeli VAR.
Powyższe wnioski sformułowano, porównując średnie błędy prognoz w całym rozpatrywanym
okresie. Jednocześnie nie zauważono, by relatywne zdolności prognostyczne modeli z poszczególnych
grup wyraźnie zmieniały się w czasie lub zależały od poziomu zmiennych prognozowanych. Zaobser-
wowano jedynie, że w ostatnich dwóch latach zdolności prognostyczne analizowanych modeli cecho-
wały się mniejszym zróżnicowaniem.

Bibliografia

Alessi L., Barigozzi M., Capasso M. (2010), Improved penalization for determining the number of
factors in approximate factor models, Statistics and Probability Letters, 80(23−24), 1806−1813.
Angelini E., Camba-Mendez G., Giannone D., Runstler G., Reichlin L. (2011), Short-term forecasts of
euro area GDP growth, Econometrics Journal, 41(1), C25−C44.
Bai J., Ng S. (2002), Determining the number of factors in approximate factor models, Econometrica,
70(1), 191−221.
178 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

Bai J., Ng S. (2008), Forecasting economic time series using targeted predictors, Journal of Econometrics,
146, 304−317.
Banerjee A., Marcellino M., Masten I. (2005), Leading indicators for euro-area inflation and GDP
growth, Oxford Bulletin of Economics and Statistics, 67, Supplement, 785−813.
Bańbura M., Giannone D., Reichlin L. (2010), Large Bayesian vector auto regressions, Journal of Applied
Econometrics, 25(1), 71−92.
Baranowski P., Leszczyńska A., Szafrański G. (2010), Krótkookresowe prognozowanie inflacji z użyciem
modeli czynnikowych, Bank i Kredyt, nr 41(4), 28−44.
Barhoumi K., Benk S., Cristadoro R., Den Reijer A., Jakaitiene A., Jelonek P., Rua A., Ruth K.,
Van Nieuwenhuyze C., Runstler G. (2008), Short-term forecasting of GDP using large monthly datasets:
a p seudo r eal-time f orecast e valuation e xercise, Working Paper Research, 133, National Bank
of Belgium.
Boivin J., Ng S. (2005) Understanding and comparing factor-based forecasts, International J ournal o f
Central Banking, 1(3), 117−151.
Boivin J., Ng S. (2006), Are more data always better for factor analysis? Journal of Econometrics, 132(1),
169−194.
Christoffel K., Warne A., Coenen G. (2010), Forecasting with DSGE models, ECB Working Paper Series,
1185.
Cichocki S., Saczuk K., Strzelecki P., Tyrowicz J., Wyszyński R. (2013), Kwartalny raport o r ynku pracy –
I kwartał 2013 r., Narodowy Bank Polski, Warszawa.
Diebold F.X., Mariano R.S. (1995), Comparing predictive accuracy, Journal o f B usiness & E conomic
Statistics, 13(3), 253−263.
Doan T., Litterman R., Sims C. (1984), Forecasting and conditional projections using a realistic prior
distribution, Econometric Reviews, 3, 1−100.
Eickmeier S., Ziegler C. (2008), How successful are dynamic factor models at forecasting output and
inflation? A meta-analytic approach, Journal of Forecasting, 27(3), 237−265.
Estrella A., Mishkin F.S. (1998), Predicting U.S. recessions: financial variables as leading indicators,
The Review of Economics and Statistics, 80(1), 45−61.
Giacomini R., White H. (2006), Tests of conditional predictive ability, Econometrica, 74(6), 1545−1578.
Giannone D., Reichlin L., Small D. (2008), Nowcasting: the real-time informational content of
macroeconomic data, Journal of Monetary Economics, 55(4), 665−676.
Gomez V., Maravall A. (1998), Programs TRAMO and SEATS. Instructions for the u ser, http://www.bde.
es/f/webbde/SES/servicio/software/tramo/manualdos.pdf.
Gupta R., Kabundi A., Miller S., Uwilingiye J. (2011), Using large data sets to forecast sectoral employment,
Working Papers, 2011-02, University of Connecticut, Department of Economics.
GUS (2008), Zasady m etodyczne s tatystyki r ynku p racy i w ynagrodzeń, Główny Urząd Statystyczny,
Warszawa.
GUS (2010), Zatrudnienie i w ynagrodzenia w g ospodarce n arodowej w I k wartale 2 010, I nformacje
i opracowania statystyczne GUS, Warszawa.
GUS (2013), Aktywność e konomiczna l udności P olski. I k wartał 2 013, Główny Urząd Statystyczny,
Warszawa.
Jacobs J., Otter P. (2008), Determining the number of factors and lag order in dynamic factor models:
a minimum entropy approach, Econometric Reviews, 26(4−6), 385−397.
Dokładność wybranych metod prognozowania... 179

Koop G., Korobilis D. (2011), UK macroeconomic forecasting with many predictors: Which models
forecast best and when do they do so?, Economic Modelling, 28(5), 2307−2318.
Marcellino M., Stock J.H., Watson M.W. (2003), Macroeconomic forecasting in the euro area: country
specific versus area-wide information, European Economic Review, 47(S1), 755−783.
McGuckin R.H., Ozyildirim A., Zarnowitz V. (2000), The composite index of leading economic indicators:
How t o m ake i t m ore t imely, Economics Program Working Paper Series, #08-01, The Conference
Board, http://www.conference-board.org/economics.
Onatsky A. (2009), Testing hypothesis about the number of factors in large factor models, Econometrica,
77(5), 1447−1479.
Rapach D.E., Strauss J.K. (2008), Forecasting US employment growth using forecast combining methods,
Journal of Forecasting, 27(1), 75−93.
Rapach D.E., Strauss J.K. (2012), Forecasting US state-level employment growth: an amalgamation
approach, International Journal of Forecasting, 28(2), 315−327.
Siliverstovs B. (2013), Do business tendency surveys help in forecasting employment?: A real-time
evidence for Switzerland, OECD J ournal: J ournal o f B usiness C ycle M easurement a nd A nalysis,
DOI 10.1787/jbcma-2013-5k4bxlxjkd32.
Stock J.H., Watson M.W. (1998), Diffusion indexes, NBER Working Papers, 6702.
Stock J.H., Watson M.W. (1999), Forecasting inflation, Journal of Monetary Economics, 44(2), 293−335.

Podziękowania

Autorzy składają podziękowania wszystkim uczestnikom seminarium NBP, na którym prezentowane


były wstępne wyniki badań, jak również dwóm anonimowym Recenzentom za cenne uwagi oraz wska-
zówki, które przyczyniły się do znaczącej poprawy wcześniejszych wersji pracy.
180 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

Accuracy of selected forecasting methods for wages


and employment in Poland

Summary
The aim of the paper is to analyse accuracy of selected methods used for forecasting variables
describing labour market in Poland in years 1998−2013. We focus on quarterly data on employment
in national economy published by National Statistical Office, employment according to the Labour
Force Survey and average monthly wages and salaries in national economy. We compare classical and
Bayesian VAR models, dynamic factor models, leading indicators as well as combined methods. The
results show that for the most cases the best forecasts in terms of mean square errors were generated by
averaging forecasts from factor models and leading indicator models. The individual models from these
two classes outperform autoregression models. Moreover we find no evidence that availability of more
recent monthly data in a given quarter improves forecasting abilities of the methods for that quarter.

Keywords: forecasting, job market, dynamic factor models, leading economic indices, pooled forecasts
Dokładność wybranych metod prognozowania... 181

Aneks 1

Wykres 1
Kwartalna dynamika wynagrodzeń w gospodarce narodowej według GUS

pkt proc.
4

3
Dynamika

2011
1998

1999

2000

2001

2002

2003

2005

2006

2007

2008

2009

2010

2012
2004

Źródło: opracowanie na podstawie danych GUS.

Wykres 2
Kwartalna dynamika pracujących wg BAEL i pracujących w gospodarce narodowej według GUS

pkt proc.
2

1
Dynamika

-1

-2

-3

-4
2011
1998

1999

2000

2001

2002

2003

2005

2006

2007

2008

2009

2010

2012
2004

Pracujący wg BAEL Zatrudnienie w gospodarce narodowej wg GUS

Źródło: opracowanie na podstawie danych GUS.


182 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

Rysunek 3
Wygładzone absolutne błędy prognoz na jeden kwartał do przodu dla wynagrodzeń w gospodarce narodowej
(dane miesięczne)

pkt proc.
2,0

1,5
Błąd

1,0

0,5

0
2004

2005

2006

2007

2008

2009

2010

2011

2012
DF VAR BVAR LI DF+LI

Wykres 4
Wygładzone absolutne błędy prognoz na jeden kwartał do przodu dla pracujących w gospodarce narodowej
według GUS (dane miesięczne)

pkt proc.
1,00

0,75
Błąd

0,50

0,25

0
2004

2005

2006

2007

2008

2009

2010

2011

2012

DF VAR BVAR LI DF+LI


Dokładność wybranych metod prognozowania... 183

Wykres 5
Wygładzone absolutne błędy prognoz na jeden kwartał do przodu dla pracujących według BAEL (dane
miesięczne)

pkt proc.

1,00

0,75
Błąd

0,50

0,25

2011
2004

2005

2006

2007

2008

2009

2010

2012
DF VAR BVAR LI DF+LI

Tabela 1
Zmienne tworzące wskaźniki wyprzedzające

Zmienna
Wariant X1 X2
prognozowana

R = 60 Przeciętne zatrudnienie
Pracujący IFO Climate – Germany
P = 102 w sektorze przedsiębiorstw
w gospodarce
narodowej R = 90 Przeciętne zatrudnienie
Wskaźnik koniunktury PMI
P = 72 w sektorze przedsiębiorstw

R = 60 Business Climate Indicator –


WIBOR3m
Pracujący P = 102 Poland (Eurostat)
według BAEL R = 90 OECD Composite Leading Business Climate Indicator –
P = 72 Indicator – Germany (OECD) Poland (Eurostat)
R = 60 Przeciętne zatrudnienie w
Średnie miesięczne Podaż pieniądza M3
P = 102 sektorze przedsiębiorstw
wynagrodzenie
w gospodarce Przeciętne miesięczne
R = 90 Business Climate Indicator –
narodowej wynagrodzenie w sektorze
P = 72 Poland (Eurostat)
przedsiębiorstw
184 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

Tabela 2
Błędy średniokwadratowe prognoz wygasłych dla wszystkich wyprzedzeń łącznie (w pkt bazowych)

R = 60, P = 102 R = 90, P = 72

Wynagrodzenia w gospodarce narodowej

Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4

DF 0022 57 62 76 86 DF 0021 46* 44** 50*** 57***


VAR 2 55 57 76 90 VAR 2 50* 57 70 75
BVAR 6 55 62 70 76 BVAR 1 59 66 69 69
LI 51 53* 66 69 LI 47* 52 60 67
DF + LI 51* 54* 67* 70* DF + LI 44** 45*** 53*** 61**
JO OPT 48 46 59 65 JO OPT 44 45 54 62

Pracujący w gospodarce narodowej według GUS

Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4

DF 0033 37** 42** 52** 63* DF 1022 31** 36* 46* 56


VAR 1 46 57 67 76 VAR 2 40 44* 55 61
BVAR 6 45 53* 62* 68* BVAR 6 43 49 59 65
LI 35** 44** 51** 57** LI 28** 43 49 57
DF + LI 33*** 34**** 42**** 48**** DF + LI 26**** 38** 48 56
JO OPT 33 41 49 56 JO OPT 26 36 47 55

Pracujący według BAEL

Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4

DF 0031 51** 55** 55** 62** DF 0051 47* 47** 46** 54**
VAR 1 65 72 73 76 VAR 3 58 53* 53** 59
BVAR 6 60* 68* 68* 70* BVAR 6 57 65 64 67
LI 52** 57** 61* 68* LI 53 57 68 75
DF + LI 46**** 49**** 52*** 57**** DF + LI 40**** 41**** 48** 53**
JO OPT 46 53 54 60 JO OPT 39 41 42 50

Uwagi:
R – długość próby służącej do estymacji parametrów,
P – liczba prognoz wygasłych,
τ – horyzont prognozy w kwartałach.
Cyfry w modelu DF oznaczają: liczbę opóźnień v1, występowanie części autoregresyjnej w modelu (3), liczbę dodatkowych
opóźnień v2 oraz liczbę czynników k.
JO OPT – prognozy łączone z wagami optymalnymi ex post.
Liczba gwiazdek wskazuje liczbę przypadków w porównaniach parami, w których dany model generował lepsze prognozy
według testu Diebolda-Mariano na poziomie istotności 0,1 (z testów wyłączony był model JO OPT).
Dokładność wybranych metod prognozowania... 185

Tabela 3
Błędy średniokwadratowe prognoz wygasłych dla rekursywnego schematu prognozowania (w pkt bazowych)

Rmin = 60, P = 102 Rmin = 90, P = 72


Wynagrodzenia w gospodarce narodowej
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0053 57 59 66 75 DF 0051 55 57 64 74
VAR 4 52 55 65 79 VAR 4 50 50 57 78
BVAR 5 51 53 60 65 BVAR 4 52 58 63 69
LI 47 49 58 54 LI 49 50 62 68
DF + LI 48 49 58 61 DF + LI 48 49 57 69
JO OPT 43 46 53 58 JO OPT 45 46 52 67
Zatrudnienie w gospodarce narodowej według GUS
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0052 34 43 51 61 DF 0033 30 39 47 60
VAR 2 41 44 59 68 VAR 2 41 43 55 61
BVAR 6 49 59 69 77 BVAR 6 44 47 55 60
LI 37 45 57 61 LI 28 44 48 57
DF + LI 33 41 53 59 DF + LI 26 38 45 55
JO OPT 31 37 49 57 JO OPT 25 41 48 59
Pracujący według BAEL
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0122 50 53 56 60 DF 0023 43 44 44 47
VAR 4 58 58 54 62 VAR 6 47 53 44 43
BVAR 6 62 69 69 71 BVAR 6 53 56 54 55
LI 58 55 59 61 LI 50 49 60 59
DF + LI 51 50 54 58 DF + LI 44 41 50 50
JO OPT 47 49 51 56 JO OPT 39 41 41 42

Uwagi:
P – liczba prognoz wygasłych,
τ – horyzont prognozy w kwartałach.
Cyfry w modelu DF oznaczają: liczbę opóźnień v1, występowanie części autoregresyjnej w modelu (3), liczbę dodatkowych
opóźnień v2 oraz liczbę czynników k.
JO OPT – prognozy łączone z wagami optymalnymi ex post.
186 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

Tabela 4
Błędy średniokwadratowe prognoz wygasłych dla schematu rolowanego w takim samym okresie weryfikacji
(w pkt bazowych)

R = 60, P = 72 R = 90, P = 72
Wynagrodzenia w gospodarce narodowej
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0022 56 63 75 87 DF 0021 46 44 50 57
VAR 2 59 63 82 98 VAR 2 50 57 70 75
BVAR 6 60 69 76 81 BVAR 1 59 66 69 69
LI 53 52 60 72 LI 47 52 60 67
DF + LI 51 51 60 70 DF + LI 44 45 53 61
JO OPT 50 50 61 71 JO OPT 44 45 54 62
Zatrudnienie w gospodarce narodowej wg GUS
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0022 31 34 45 58 DF 1022 31 36 46 56
VAR 1 41 46 58 65 VAR 2 40 44 55 61
BVAR 6 43 46 53 57 BVAR 6 43 49 59 65
LI 29 48 52 65 LI 28 43 49 57
DF + LI 29 39 44 56 DF + LI 26 38 48 56
JO OPT 29 41 45 57 JO OPT 26 36 47 55
Pracujący wg BAEL
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0021 47 46 48 59 DF 0051 47 47 46 54
VAR 1 56 58 59 63 VAR 3 58 53 53 59
BVAR 4 55 60 61 62 BVAR 6 57 65 64 67
LI 53 47 56 59 LI 53 57 68 75
DF + LI 46 43 50 55 DF + LI 40 41 48 53
JO OPT 45 44 49 55 JO OPT 39 41 42 50

Uwagi:
R – długość próby służącej do estymacji parametrów,
P – liczba prognoz wygasłych,
τ – horyzont prognozy w kwartałach.
Cyfry w modelu DF oznaczają: liczbę opóźnień v1, występowanie części autoregresyjnej w modelu (3), liczbę dodatkowych
opóźnień v2 oraz liczbę czynników k.
JO OPT – prognozy łączone z wagami optymalnymi ex post.
Dokładność wybranych metod prognozowania... 187

Tabela 5
Lista zmiennych objaśniających wykorzystanych w pracy

Przekształ-
Obszar Nazwa zmiennej Źródło Częstotli- cenie LI m1 m2
wość zmiennej
Przewidywane zatrudnienie
w przedsiębiorstwie w ciągu GUS m − − 1,93 0,15
Koniunktura w budownictwie

trzech miesięcy
Opóźnienie płatności GUS m − − 1,88 0,17

Przewidywana sytuacja finansowa GUS m − − 1,80 0,12


przedsiębiorstw
Przewidywany portfel zamówień
na roboty budowlano-montażowe GUS m − − 1,29 0,15
na rynku krajowym

Wskaźnik klimatu ogółem GUS m − − 2,83 0,18

Przewidywane zatrudnienie
w przedsiębiorstwie w ciągu GUS m − − 2,02 0,19
trzech miesięcy

Ilość sprzedawanych towarów GUS m − − 5,06 0,21


Koniunktura w handlu

Ceny sprzedawanych towarów GUS m − − 1,45 0,10

Ogólna sytuacja ekonomiczna GUS m − − 3,51 0,24

Przewidywana ogólna sytuacja GUS m − − 1,96 0,19


ekonomiczna

Przewidywane ceny towarów GUS m − − 1,10 0,07

Zapasy towarów GUS m − − 0,49 0,06

Przewidywane zatrudnienie
w przedsiębiorstwie w ciągu GUS m − − 1,47 0,14
trzech miesięcy
Prognoza ogólnej sytuacji
Koniunktura w przemyśle

gospodarczej na najbliższe GUS m − − 1,26 0,14


trzy miesiące
Przewidywane ceny sprzedaży GUS m − − 1,12 0,09
wyrobów

Stan zapasów wyrobów gotowych GUS m − − 0,99 0,09

Wskaźnik ogólnego klimatu GUS m − − 1,35 0,12


koniunktury

Wskaźnik wykorzystania mocy GUS q ind. − 2,08 0,19


produkcyjnych
188 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

Przeciętne miesięczne
wynagrodzenie w sektorze GUS m ind. T 4,38 0,22
przedsiębiorstw − ubruttowione
Przeciętne zatrudnienie w sektorze GUS m ind. T 3,62 0,10
przedsiębiorstw

Przeciętne zatrudnienie w sektorze GUS m ind. T 5,22 0,20


przedsiębiorstw − przemysł

Bezrobotni zarejestrowani GUS m ind. − 5,83 0,19


dotychczas niepracujący

Bezrobotni nowo zarejestrowani GUS m ind. − 5,42 0,20

Oferty pracy zarejestrowane GUS m ind. T 3,57 0,17


w ciągu miesiąca
Rynek pracy

Oferty pracy wg stanu na koniec GUS m ind. T 4,30 0,18


miesiąca

Prawdopodobieństwo znalezienia NBP m − T 1,49 0,19


pracy

Prawdopodobieństwo utraty pracy NBP m − T 1,63 0,16

Stopa bezrobocia rejestrowanego GUS m przyr. − 1,32 0,18

Pracujący w gospodarce
narodowej (stan na koniec GUS q ind. − 1,98 0,25
kwartału)
Wydajność pracy (na podstawie
PKB oraz pracujących według GUS q przyr. − 1,92 0,32
BAEL) (PKB, BAEL)
Wydajność pracy (na podstawie
wartości dodanej brutto oraz GUS q przyr. − 2,07 0,32
zatrudnienia wg GUS)

Przeciętna liczba emerytów


i rencistów z pozarolniczego GUS m ind. − 2,66 0,21
systemu ubezpieczeń
społecznych
Ubezpieczenia społeczne

Przeciętna emerytura i renta GUS m ind. − 3,90 0,05


rolników indywidualnych

Przeciętna emerytura i renta


z pozarolniczego systemu GUS m ind. − 5,84 0,15
ubezpieczeń społecznych

Zasiłki dla bezrobotnych GUS m ind. − 2,53 0,14


Dokładność wybranych metod prognozowania... 189

Średnia oczekiwana stopa inflacji NBP m − T 1,73 0,10


w ciągu najbliższych 12 miesięcy

Stopa inflacji HICP (m/m) Eurostat m − − 1,90 0,13

Stopa inflacji HICP − żywność Eurostat m − − 1,61 0,11


i napoje bezalkoholowe (m/m)
Stopa inflacji HICP − napoje
alkoholowe i wyroby tytoniowe Eurostat m − − 3,31 0,11
(m/m)
Stopa inflacji HICP − odzież Eurostat m − − 4,03 0,29
i obuwie (m/m)

Stopa inflacji HICP − utrzymanie Eurostat m − − 5,63 0,16


mieszkania (m/m)
Stopa inflacji HICP − meble
i artykuły gospodarstwa Eurostat m − − 1,43 0,13
domowego (m/m)
Stopa inflacji HICP − zdrowie Eurostat m − − 3,32 0,09
(m/m)
Inflacja

Stopa inflacji HICP − transport Eurostat m − − 0,60 0,10


(m/m)

Stopa inflacji HICP − Eurostat m − − − −


Komunikacja (m/m)

Stopa inflacji HICP − rozrywka Eurostat m − − 2,10 0,21


i kultura (m/m)

Stopa inflacji HICP − edukacja Eurostat m − − 7,22 0,14


(m/m)

Stopa inflacji HICP − restauracje Eurostat m − − 1,95 0,11


i hotele (m/m)

Stopa inflacji HICP − pozostałe Eurostat m − − 4,64 0,16


dobra i usługi (m/m)
Stopa inflacji HICP − dobra
przemysłowe z wyłączeniem Eurostat m − − 1,39 0,16
energii (m/m)
Stopa inflacji HICP − energia Eurostat m − − 1,05 0,08
(m/m)

WIG20 (średnia miesięczna) stooq.pl m ind. T 1,34 0,15


Wskaźniki finansowe

Kurs EUR/PLN (średni


stooq.pl m ind. T 1,15 0,08
miesięczny)

Podaż pieniądza M3 NBP m ind. T 3,91 0,18

WIBOR3m (średnia miesięczna) stooq.pl m − T 1,15 0,10


190 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

Wskaźnik koniunktury PMI Markit m − T 1,62 0,13

IFO Climate Germany IFO m − T 1,47 0,15


Wskaźniki koniunktury

IFO Situation Germany IFO m − T 1,36 0,16

IFO Expectations Germany IFO m − T 0,48 0,09

Composite Leading Indicator − OECD m − T 0,95 0,08


Germany

Composite Leading Indicator − OECD m − T 0,86 0,09


Poland

Business Climate Indicator − Eurostat m − T 1,58 0,20


Poland

Produkcja sprzedana przemysłu GUS m ind. − 2,65 0,17

Import (w zł) GUS m ind. − 1,36 0,11


Sfera realna

Eksport (w zł) GUS m ind. − 2,12 0,14

Produkt krajowy brutto w cenach GUS q ind. − 2,51 0,19


bieżących

Wartość dodana brutto w cenach GUS q ind. − 3,32 0,28


bieżących

Przeciętne zatrudnienie GUS q ind. − 3,35 0,27


w gospodarce narodowej
prognozowane
Zmienne

Pracujący według BAEL GUS q ind. − 2,06 0,21

Przeciętne wynagrodzenie GUS q ind. − 3,26 0,23


miesięczne brutto

Uwagi:
Częstoliwość m – miesieczna, q – kwartalna.
Przekształcenie zmiennej: ind. – indeksy łańcuchowe, przyr. – przyrosty łańcuchowe.
W kolumnie LI T oznacza, że dana zmienna była zakwalifikowana jako potencjalna zmienna objaśniająca w modelach
wskaźników wyprzedzających.
m1 – maksymalna różnica spowodowana sekwencyjnym odsezonowaniem w stosunku do odchylenia standardowego
szeregu odsezonowanego (dla Rmin = 21 obserwacji kwartalnych lub Rmin = 60 obserwacji miesięcznych),
m2 – średnie odchylenie standardowe poszczególnych obserwacji będące skutkiem sekwencyjnego odsezonowania
w stosunku do odchylenia standardowego szeregu odsezonowanego.
Dokładność wybranych metod prognozowania... 191

Tabela 6
Istotne wyniki testów warunkowej zdolności prognostycznej Giacominiego i White’a

R2
Zmienna Model 1 Model 2 T h
(w %)
LI VAR 90 1 2,8
VAR DF 60 2 5,5
VAR BVAR 60 2 4,3
Wynagrodzenia
VAR DF + LI 60 2 2,1
w gospodarce narodowej
BVAR DF 60 2 1,7
LI DF + LI 60 2 8,7
LI DF 60 4 3,5
DF VAR 90 4 8,0
DF BVAR 90 4 3,9
DF LI 90 4 11,1
Pracujący DF DF + LI 90 4 10,0
w gospodarce narodowej
według GUS DF + LI BVAR 90 4 10,3
DF LI 60 1 5,6
DF DF + LI 60 1 10,4
DF LI 60 2 4,9
DF DF + LI 90 3 4,7
DF DF + LI 90 4 8,8
Pracujący według BAEL VAR BVAR 90 4 0,7
VAR LI 90 4 2,1
DF DF + LI 60 3 2,9

Uwagi:
Model 1 – model, który daje lepsze prognozy dla niskich wartości zmiennej prognozowanej,
Model 2 – model, który daje lepsze prognozy dla wysokich wartości zmiennej prognozowanej,
R2 – współczynnik determinacji, opisujący siłę zależności pomiędzy zmienną prognozowaną a kwadratami błędów prognoz.
192 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

Tabela 7
Błędy średniokwadratowe prognoz wygasłych dla zmiennej wynagrodzenia w gospodarce narodowej
(w pkt bazowych)

R = 60, P = 102 R = 90, P = 72


Wyprzedzenie o 1 miesiąc
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0022 59 66 79 91 DF 0021 45* 44** 49* 59**
VAR 2 52 57 76 90 VAR 2 49 56 69 73
BVAR 6 54 62 70 76 BVAR 1 59 66 69 69
LI 50 54 65 65 LI 47 52 58 67
DF + LI 52* 57* 68* 72* DF + LI 44* 47** 52 62*
JO OPT 46 48 58 64 JO OPT 43 46 52 63
Wyprzedzenie o 2 miesiące
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0022 55 59 74 78 DF 0021 44* 41** 49** 54***
VAR 2 52 57 76 90 VAR 2 49 56 69 73
BVAR 6 54 62 70 76 BVAR 1 59 66 69 69
LI 51 56 70 74 LI 44* 52 61 68
DF + LI 50 53 67 68 DF + LI 41** 44*** 53** 59*
JO OPT 46 47 60 67 JO OPT 41 43 53 60
Wyprzedzenie o 3 miesiące
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0022 57 62 74 89 DF 0021 49 46** 51* 58
VAR 2 60 57 77 90 VAR 2 52 59 73 77
BVAR 6 58 62 70 76 BVAR 1 58 66 69 69
LI 52 47** 64 66 LI 50 51 59 67
DF + LI 52 51* 66* 72* DF + LI 47 46** 53** 61*
JO OPT 50 43 58 64 JO OPT 47 47 54 62

Uwagi:
R – długość próby służącej do estymacji parametrów,
P – liczba prognoz wygasłych,
τ – horyzont prognozy w kwartałach.
Cyfry w modelu DF oznaczają: liczbę opóźnień v1, występowanie części autoregresyjnej w modelu (3), liczbę dodatkowych
opóźnień v2 oraz liczbę czynników k.
JO OPT – prognozy łączone z wagami optymalnymi ex post.
Liczba gwiazdek wskazuje liczbę przypadków w porównaniach parami, gdy dany model generował lepsze prognozy według
testu Diebolda i Mariano na poziomie istotności 0,1 (z testów wyłączono model JO OPT).
Dokładność wybranych metod prognozowania... 193

Tabela 8
Błędy średniokwadratowe prognoz wygasłych dla zmiennej pracujący w gospodarce narodowej według GUS
(w pkt bazowych)

R = 20, P = 102 R = 30, P = 72


Wyprzedzenie o 1 miesiąc
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0033 37** 39** 51** 59* DF 1022 31* 36* 49 56
VAR 1 46 57 67 76 VAR 2 40 43 56 61
BVAR 6 45 52 62* 68* BVAR 6 43 48 59 65
LI 38** 44* 47** 56* LI 31* 44 49 58
DF + LI 36** 33*** 41**** 47**** DF + LI 29** 39** 49 58
JO OPT 37 40 47 54 JO OPT 28 37 48 56
Wyprzedzenie o 2 miesiące
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0033 35** 42** 51** 61* DF 1022 33* 40 46 58
VAR 1 46 57 67 76 VAR 2 40 43 56 61
BVAR 6 45 52 62* 68* BVAR 6 43 48 59 65
LI 33** 45* 56* 59* LI 29** 45 53 59
DF + LI 31** 36*** 45**** 48*** DF + LI 25*** 39* 48* 56
JO OPT 32 42 55 56 JO OPT 26 37 47 54
Wyprzedzenie o 3 miesiące
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0033 37** 45** 52** 67** DF 1022 28** 32*** 44 56
VAR 1 47 58 67 77 VAR 2 40 44* 55 61
BVAR 6 45 54 62* 69* BVAR 6 43 50 58 67
LI 33** 42** 50** 53** LI 24** 41* 46 53
DF + LI 32** 34**** 42**** 50*** DF + LI 24** 37** 46 55
JO OPT 32 41 49 57 JO OPT 23 34 46 54

Uwagi:
R – długość próby służącej do estymacji parametrów,
P – liczba prognoz wygasłych,
τ – horyzont prognozy w kwartałach.
Cyfry w modelu DF oznaczają: liczbę opóźnień v1, występowanie części autoregresyjnej w modelu (3), liczbę dodatkowych
opóźnień v2 oraz liczbę czynników k.
JO OPT – prognozy łączone z wagami optymalnymi ex post.
Liczba gwiazdek wskazuje liczbę przypadków w porównaniach parami, gdy dany model generował lepsze prognozy według
testu Diebolda i Mariano na poziomie istotności 0,1 (z testów wyłączono model JO OPT).
194 J. Aced ań s k i , J. B e rn ais, A. M ast al e rz-Ko dzis

Tabela 9
Błędy średniokwadratowe prognoz wygasłych dla zmiennej pracujący według BAEL
(w pkt bazowych)

R = 20, P = 102 R = 30, P = 72


Wyprzedzenie o 1 miesiąc
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0031 51** 56** 55* 61* DF 0051 47 47* 43** 55**
VAR 1 65 72 73 75 VAR 3 57 52* 53** 59
BVAR 6 60 68 67 69 BVAR 6 56 64 63 67
LI 51* 57** 62* 70 LI 52 58 71 76
DF + LI 45*** 50** 53*** 58*** DF + LI 38** 42*** 49*** 54**
JO OPT 47 54 56 61 JO OPT 38 42 42 52
Wyprzedzenie o 2 miesiące
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0031 53* 55** 53** 58*** DF 0051 48 46* 51** 55**
VAR 1 65 72 73 75 VAR 3 57 52* 53** 59
BVAR 6 60 68 67 69 BVAR 6 56 64 63 67
LI 53* 62 62 71 LI 52 58 71 76
DF + LI 46*** 51** 51*** 56*** DF + LI 38*** 42** 49** 54**
JO OPT 46 55 54 60 JO OPT 38 40 43 51
Wyprzedzenie o 3 miesiące
Model τ=1 τ=2 τ=3 τ=4 Model τ=1 τ=2 τ=3 τ=4
DF 0031 50* 54** 58* 67 DF 0051 46 47* 44** 54**
VAR 1 66 73 74 78 VAR 3 60 53* 54* 60
BVAR 6 60* 69 69* 73 BVAR 6 60 65 66 68
LI 53 51** 58* 65* LI 54 54 62 75
DF + LI 47** 46**** 51*** 56**** DF + LI 44* 40*** 45** 51**
JO OPT 47 50 52 60 JO OPT 40 41 40 48

Uwagi:
R – długość próby służącej do estymacji parametrów,
P – liczba prognoz wygasłych,
τ – horyzont prognozy w kwartałach.
Cyfry w modelu DF oznaczają: liczbę opóźnień v1, występowanie części autoregresyjnej w modelu (3), liczbę
dodatkowych opóźnień v2 oraz liczbę czynników k.
JO OPT – prognozy łączone z wagami optymalnymi ex post.
Liczba gwiazdek wskazuje liczbę przypadków w porównaniach parami, gdy dany model generował lepsze prognozy według
testu Diebolda-Mariano na poziomie istotności 0,1 (z testów wyłączono model JO OPT).
Dokładność wybranych metod prognozowania... 195

Wyprowadzenie
Aneks 2 wzoru (6)

v1

ΣA f + εt
(1) ( 3)
Niech : y t = ln (Yt / Yt 1 ), yt = ln (Yt / Yt 3 ) oraz y t = a 0 + a1 y t 1 +
(1) (1) (1)
i t i
i= 0

wtedy:

y t(3) = y t(1) + y t(11) + y t(1)2 =


v1 v1 v1
= a 0 + a1 y t(11) + Σ A i f t i + ε t + a0 + a1 yt 2 + Σ A ift + εt(11) + a 0 + a1 y t(1)3 + ΣA f + ε t(1)2 =
(1) (1)
1 i i t 2 i
i= 0 i= 0 i= 0
v1

Σ A (f )+ ε +ε +ε
(1) (1) (1) (1) (1) (1)
= 3a 0 + a1 ( y t 1 +y t 2 +y t 3 )+ i t i + ft 1 i + ft 2 i t t 1 t 2 =
i= 0
v1 \2
= 3a 0 + a1 y t( 31) + ΣA Z Σε
(1)
i t i + t j
i= 0 j =0

przy czym y t(31) = y t(11) + y t(1)2 + y t(1)3 oraz Z t i = ft i + ft 1 i + ft 2 i

v1

ΣA Z
\2
Wstawiając y t(31) = 3a 0 + a1 y t(32) + Σε
(1)
i t 1 i + t 1 j , uzyskujemy:
i= 0 j =0

( )
v1 v1

Σ Ai Zt i +
\2

Σ Ai Zt
\2
y t(3) = 3a 0 + a1 3a 0 + a1 y t(32) + Σ εt 1 Σε
(1) (1)
1 i + j + t j =
i= 0 j =0 i= 0 j =0

v1 v1 \2

Σε
\2

Σ A i Z t i + a1 Σ A i Z t Σ εt
2 ( 3) (1) (1)
= 3a 0 (1 + a1 ) + a1 y t 2 + 1 i + j + a1 t 1 j
i= 0 i= 0 j =0 j =0

Powtarzając procedurę dla y t( 32) , mamy:

( )
v1 \2 v1 v1
y t(3) = 3a0 (1 + a1 ) + a12 3a 0 + a1 y t(33) + Σ Ai Zt
i= 0
2 i + Σ εt(1)2
j =0
j + Σ A i Z t i + a1 Σ A i Z t
i= 0 =0
1 i

\2 \2

Σε Σε
(1) (1)
+ t j + a1 t 1 j =
j =0 j =0
v1 v1 v1
= 3a 0 (1 + a1 + a12 ) + a13 y t( 33) + Σ A i Z t i + a1 Σ A i Z t
i= 0 i= 0
1 i + a12 ΣA Z
i= 0
i t 2 i +
\2 \2

Σ εt j + a1 Σ ε t 1 j + a1 Σε
\2
(1) (1) 2 (1)
+ t 2 j
j =0 j =0 j =0

Stąd: v1

y t(3) = b0 + b1 yt(33) + Σ BiZ


i= 0
t i + εt
( 3)
(6)

gdzie :
b 0 = 3 a 0 (1 + a 1 + a 1 ) , b1 = a 13 , B 0 = A 0 , B 1 = A 1 + a 1 A 0 , B 2 = A 2 + a 1 A 1 + a 1 A 0 ,
2 2

Bm 2 = A m + a1 A m 1 + a 12 A m 2 , B m 1 = a 1 A m + a 12 A m 1 , B m = a 12 A m ,
ε t(3) = ε t(1) + (1 + a 1 ) ε t(11) + (1 + a 1 + a 12 )ε t(1)2 + (1 + a 1 + a 12 ) ε t(1)3 + … + a 1 (1 + a 1 ) ε t(1)m +1 + a 12 ε t(1)m

You might also like