Professional Documents
Culture Documents
PROGNOSTICKÉ METODY
Načtení datového souboru se provádí kliknutím na ikonu s popisem otevřít v levé části
systémové lišty programu Statistica.
2
Po vybrání a potvrzení zvoleného datového souboru, se otevře následující okno,
v kterém, pro přehlednost v rámci další práce se softwarem, je vhodné zvolit „Importovat
vybraný list do tabulky“. Tento list excelovského souboru je zvolen a potvrzen v dalším okně:
Následující okno potom slouží jednak pro výběr načítané datové oblasti z vybraného sešitu
MS Excel (viz část Rozsah), tak i pro uspořádání dat v rámci úvodní programové relace.
Výběrem „1. řádek jako názvy proměnných“, budou v úvodní relaci programu názvy
proměnných uvedeny v záhlaví datového pole, stejně tak po zvolení „1. sloupec jako názvy
případů“ bude první sloupec vyčleněn pro dataci daného pozorování časové řady. Po kliknutí
na „OK“, dojde k načtení souboru, tak jak je vidět na následujícím snímku.
3
1.2 Ukládání průběžných výsledků prováděné analýzy do MS Word
Program Statistica umožňuje nastavit ukládání veškerých vygenerovaných výstupů přímo do
wordovského dokumentu. Tato funkce se aktivuje přes hlavní nabídku softwaru a kliknutím
na „Správce výstupů“.
4
V rámci rolovací nabídky pod označením „Výstup Microsoft Word“ je zvoleno „Do jednoho
dokumentu Word (společný pro všechny analýzy/grafy)“. Po potvrzení aktivace této funkce
pomocí „OK“, se od tohoto okamžiku, veškeré výstupy programu Statistica zároveň zkopírují
do wordovského dokumentu, který je možné libovolně upravovat – například vkládat ke
zvoleným výstupům komentáře.
Proto existuje na systémové liště programu v záložce „Domů“ v části „Okna“, šikovná funkce
„Přepnout okna“. Poklepáním, případně vyrolováním, je možné zobrazit seznam všech
aktivních oken a mezi nimi potom vybírat (aktivovat) okna, které chce uživatel právě zobrazit.
5
1.4 Vytvoření liniového grafu pro deskripci chování zvolené časové řady
V následující části bude provedeno vykreslení liniového grafu časové řady původní, časové
řady v prvních diferencích a časové řady v druhých diferencích. Tím bude názorně zachyceno
chování časové řady, včetně jejích dynamických vlastností.
Pro vykreslení jakéhokoliv grafu je nejprve nutné přejít na záložku „Grafy“ systémové lišty a
následně zvolit typ grafu „Spojnice“.
Otevře se okno pro editaci liniového grafu. Nejprve je nutné zvolit proměnné, pro které se má
daný typ grafu vykreslit. Výběr je proveden poklepáním na „Proměnné“.
6
Výběr zvolených proměnných se provede pomocí klávesy ctrl a poklepáním myší. Výběr je
opět potvrzen pomocí „OK“.
Následně je v okně pro editaci grafu vidět, že k volbě proměnných opravdu došlo. Jelikož
cílem je vykreslit pro každou proměnnou samostatný graf, není nutné dále nic upravovat a
výběr opět potvrdit pomocí „OK“.
7
Vykreslené grafy se zobrazí jak přímo v systému Statistica, tak rovněž v MS Word.
V softwaru je možné mezi jednotlivými grafy přecházet pomocí lišty umístěné pod grafem.
8
Zobrazí se následující okno. Výchozí volba už je přímo na popisných statistikách, proto stačí
pouze potvrdit pomocí „OK“.
Opět je prvním krokem volba proměnné, pro kterou se mají popisné statistiky spočíst. Výběr
proměnných se provede poklepáním na „Proměnné“.
9
Následně je vybrána proměnná, jež má být pomocí deskriptivních statistik popsána – v tomto
případě původní časová řada. Výběr je potvrzen pomocí „OK“.
Pro výběr statistik, které se mají pro danou časovou řadu spočítat, je proveden pomocí
záložky „Detailní výsledky“.
10
Po zvolení vybraných popisných statistik, je pro jejich výpočet nutné kliknout na pole
„Výpočet“.
11
1.6 Tabulka rozdělení četností
Tabulku rozdělení četností lze získat opět v okně „Popisné statistiky“, ovšem je nutné přejít
pod záložku „Normalita“. Kde je možné zvolit příslušný test normality (zde zvolen Shapiro-
Wilkův test), jehož výsledek (včetně p-hodnoty) bude obsažen v záhlaví tabulky četností.
Rovněž je možné ověřit počet intervalů, které pro popis rozdělení četností budou využity.
Poklepáním na pole „Tabulky četností“ bude daná tabulka softwarem vygenerována.
12
Tabulka četností je opět zobrazena jak v softwaru samotném, tak v MS Word.
1.7 Histogram
Jelikož je histogram grafickým znázorněním rozdělení četností náhodné veličiny, probíhá jeho
výběr ve stejném okně, resp. liště, jako v případě tabulky četností. Zvolený test normality a
zvolený počet intervalů zůstávají v tomto případě stejné, tak aby tabulkový a grafický popis
rozdělení četností korespondoval. Histogram je vygenerován poklepáním na pole
„Histogramy“.
13
1.8 Q-Q graf
Pro popis normality, resp nenormality distribuce náhodné veličiny, lze rovněž využít
normálního pravděpodobnostního (q-q) grafu. Opět v okně „Popisné statistiky“ je vybrána
záložka „Pravd. & bod. grafy“ a q-q graf je vygenerován poklepáním na pole „Normální
pravděpod. graf“.
14
Výstup s q-q grafem vypadá následovně.
15
V následujícím okně je opět nejprve nutné zvolit proměnnou.
Jako závisle proměnná je volena proměnná (časová řada), jejíž distribuci je cílem pomocí box
plotu popsat. Grupovací proměnná v tomto případě využívána není, proto toto pole zůstává
prázdné.
16
Jelikož, pokud jde o box plot, je častější zobrazovat medián jako horizontální přímku, spíše
než bod, došlo v tomto případě k předefinování vzhledu grafu pomocí rolovací nabídky
„Styl“.
Nyní již stačí potvrdit „OK“. Výsledek odpovídá zvoleným vlastnostem grafu.
17
2. Sezónní očišťování pomocí metody CENSUS v programu
Statistica
2.1 Volba typu modelu pro sezónní očištění
V tomto případě se jako vhodný přibližný nástroj nabízí bodový graf. Znovu tedy záložka
„Grafy“ na systémové liště programu Statistica a následně výběr „Bodový graf“.
V dalším okně je nejprve nutné zvolit závisle (y) a nezávisle (x) proměnou. V tomto případě
nezávisle proměnná bude sledovaná časová řada a její vývoj bude sledován v čase, tzn.
nezávisle proměnnou je časový vektor.
18
Jestliže jsou příslušné proměnné vybrány, stačí kliknout na „OK“. Graf bude rovněž proložen
lineární přímkou, jelikož tato volba byla ponechána na výchozí úrovni.
19
Graf tedy vypadá následovně a lze z něj přibližně určit, že vhodnější model pro sezónní
očištění bude model multiplikativní.
20
Poté je zvolená proměnná, jež bude cílem sezónního očištění.
21
Nyní je již možné přistoupit k samotnému sezónnímu očištění. Volíme „Sezónní rozklad
(Census 1)“.
22
V tomto okně je potřeba zvolit typ modelu, který pro dekompozici bude využit (v tomto
případě multiplikativní) a typ sezónnosti (v tomto případě je měsíční – proto 12; v případě
čtvrtletní sezónnosti, se volí hodnota sezónního posuvu rovna 4). Volbu potvrdíme pomocí
„Shrnutí: Sezónní rozklad“.
V tomto výstupu nás zajímají sloupce „Sezónní faktory“ a „Očištěné řady“. U sezónních
faktorů se jedná o průměrné hodnoty, tzn. každému měsíci je přiřazen právě jeden faktor.
Jelikož se hodnoty logicky v tomto sloupci opakují, stačí pro zachycení významnosti sezónní
složky vypsat pouze prvních dvanáct hodnot (u měsíční sezónnosti).
23
To znamená, že opět vybereme časový vektor levým tlačítkem myši, a poté pravým tlačítkem
vyvoláme nabídku, z které vybereme „Vložit“. Výstražné okno odklikneme.
Nyní je již možné přímo zobrazit potřebný graf. Záložka „Grafy“ a výběr „Spojnice“.
24
Opět vybereme proměnné a vícenásobný typ grafu – obě časové řady chceme zobrazit
v jednom grafu.
Za proměnné samozřejmě zvolíme původní časovou řadu a časovou řadu sezónně očištěnnou.
25
Nyní již stačí výběr potvrdit pomocí „OK“. Výstup má potom následující podobu.
26
3. Deterministické modelování trendu pomocí SW Gretl
3.1 Načtení dat do softwaru
Z nabídkové lišty vybereme „Soubor“, „Otevřít data“, „Importovat“ a následně zvolíme typ
souboru, tzn. v našem případě „Excel“.
27
Vybereme příslušný soubor a klikneme na „Otevřít“. Nyní zvolíme list MS Excel, v kterém
jsou data umístěna. Volbu potvrdíme „Budiž“.
Po zavření informačního okna, vyskočí okno s dotazem na určení typu používaného datového
souboru. Jelikož máme data ve formě časových řad, je nutné vybrat „Ano“.
28
Nyní je nutné zvolit frekvenci časové řady – v tomto případě měsíční.
V následujícím okně definuje první pozorování časové řady – v tomto případě je to leden roku
2002, tzn. vkládáme „2002:01“. Opět potvrdíme pomocí „Vpřed“.
29
Nyní už stačí kliknout pouze na „Použít“ a data jsou načtená v samotném softwaru, tak jak je
to vidět na následujícím snímku.
30
3.2 Odhad modelu lineární trendové funkce
Nejprve je nutné vytvořit časovou proměnnou. Z nabídkové lišty vybereme „Přidat“ a
následně klikneme na „Časový trend“.
31
Odhad trendové funkce budeme provádět pomocí běžné metody nejmenších čtverců (BMNČ).
V nabídkové liště vybereme „Model“ a následně „Metoda nejmenších čtverců“.
32
Poklepáním na „Budiž“ je proveden odhad modelu lineární trendové funkce.
Pomocí výběru „Testy“ z nabídkové lišty softwaru Gretl, je možné v rámci odhadnutého
modelu testovat předpoklady LRM (předpoklady aplikace BMNČ).
33
Veškeré výsledky je samozřejmě možné ze SW Gretl překopírovat do MS Word – pomocí
„Upravit“ na nabídkové liště, zvolíme „Kopírovat“.
V následujícím oknu potvrdíme RTF (MS Word) kliknutím na „Budiž“. Následně otevřeme
wordovský dokument a použijeme klávesovou zkratku pro vkládaní kopírovaného textu
Ctrl+V.
34
3.3 Ex-post prognóza v rámci modelu lineární trendové funkce
Nejprve je nutné stanovit ex-post prognostický horizont, neboli je nutné určit velikost tzv.
zatajeného vzorku – v tomto případě volíme posledních 12 měsíců.
Nyní přichází část zatajený vzorek vytvořit – přes „Výběr“, „Zadat rozsah“.
Objeví se okno pro zadání rozsahu. Plný rozsah časové řady je od ledna 2002 do prosince
2010.
Jelikož je prognostický horizont zvolen na posledních 12 měsíců dané časové řady, potom
tuto časovou řadu právě o těchto 12 měsíců zkrátíme (vytvoříme zatajený vzorek o dvanácti
pozorováních).
Zkrácený výběr bude tedy od ledna 2002 do prosince 2009. Celkový počet pozorování se
zkrátí ze 108 na 96.
35
O existenci zatajeného souboru nás rovněž informuje popisek v dolní části úvodní relace SW
Gretl.
Model lineární trendové funkce je nyní nutné pro tento redukovaný výběr znovu odhadnout
pomocí BMNČ – stejná procedura a stejný výběr proměnných jako v úvodním odhadu.
36
Nyní máme odhad modelu lineární trendové funkce pro omezený výběr (n=96). Ex-post
prognózu provedeme kliknutím na „Analýza“ a ze zobrazené nabídky vybereme
„Předpovědi“.
Otevře se následující okno, kde stačí pouze potvrdit pomocí „Budiž“ (software sám rozpoznal
zatajený vzorek“).
37
Výstup ex-post prognózy vypadá následovně.
Prognostická činnost v rámci regresních modelů má dvě fáze. V první fázi predikujeme
hodnoty regresorů pro zvolený prognostický horizont (tady 12 měsíců). Výhodou modelu
lineární trendové funkce je to, že je nutné stanovit pouze predikci časového vektoru, což je
pouze prodloužení této časové řady o zvolený počet pozorování, s přiřazením odpovídajícího
pořadí.
Označíme tedy časovou proměnnou v SW Gretl, poté pomocí pravého tlačítka myši vyvoláme
pro tuto proměnnou nabídku a z ní vybereme „Upravit hodnoty“.
38
Objeví se okno s hodnotami jednotlivých pozorování pro danou proměnnou. Klikneme levým
tlačítkem myši na symbol „Plus“, tedy přidat a z vyvolané nabídky vybereme „Přidat
Pozorování“.
39
V dalším okně vybereme počet pozorování s ohledem na prognostický horizont (tady oněch
12). Potvrdíme.
Nyní už pouze zadáme hodnoty – v tomto případě 109 až 120, a uložíme je pomocí „zelené
fajfky“. Tím je prognóza regresoru ve formě časového vektoru provedena.
Opět je potřeba znovu model lineární trendové funkce odhadnout – stejná procedura BMNČ a
stejné proměnné, jako v předchozích dvou případech.
Dostáváme stejný výstup, jako v úvodní trendové regresi, neboť opět byly použity stejné
proměnné a stejný počet pozorování (n=108).
40
Stejně jako u ex-post prognózy, tak také u ex-ante prognózy není potřeba nic měnit a výběr
stačí potvrdit pomocí „Budiž“. Software sám identifikoval horizont a typ předpovědi na
základě předchozích kroků.
41
Výstup ex-ante prognózy včetně grafu je následující.
42
4. Testování stacionarity pomocí DF-testu s využitím SW Gretl
Prvním úkolem je zvolit příslušný model pro Dickey-Fullerovu regresi, tzn. A, B nebo C,
podle průběhu zkoumané časové řady (v tomto případě byl zvolen model B).
Pro testování stacionarity časové řady v původních, nijak neupravených hodnotách (levelech),
je nejprve nezbytné nadefinovat novou proměnnou, ve formě první diference původní časové
řady.
V seznamu proměnných se nám objeví nová proměnná (písmenko „d“ značí, že se jedná o
první diferenci).
43
Nyní už je možné přímo přejít k prvnímu stupni Dickey-Fullerovy regrese, pro testování
stacionarity původní časové řady. Dickey-Fullerův test provedeme pomocí klasické BMNČ
procedury, tzn. z nabídkové lišty vybereme „Model“ a následně „Metoda nejmenších
čtverců“.
44
Výstup prvního stupně Dickey-Fullerovy regrese vypadá následovně:
Před použitím tohoto výstupu pro posouzení stacionarity časové řady v původních hodnotách,
je nejprve nutné ověřit, zda lze tento výstup vůbec použít – tzn. zda lze aplikovat klasickou
verzi DF-testu nebo zdali je nutné přejít k jeho rozšířené verzi, tedy k ADF-testu. V případě,
že se v rámci odhadnutého modelu klasické Dickey-Fullerovy regrese vyskytují
autokorelovaná rezidua, potom je nutné přejít k rozšířené Dickey-Fullerově regresi (ADF-
testu).
45
signifikantně autokorelovaná pouze v rámci prvního řádu zpoždění. A tedy pro modelování
této autokorelace stačí využít AR (1) proces.
46
Specifikujeme rozšířenou Dickey-Fullerovu regresi. AR(1) proces do modelu zavedeme
zahrnutím vysvětlované proměnné, zpožděné o jedno období, mezi proměnné vysvětlující.
Tím je specifikován ADF test a je možno pokračovat v odhadu pomocí „Budiž“.
47
Výstup rozšířené Dickey-Fullerovy regrese je vidět níže. Zároveň po provedeném testu
autokorelace, můžeme prohlásit, že zavedením AR(1) procesu do modelu, se povedlo
autokorelaci reziduí odstranit. Výstup je tedy v tomto případě možné použít, pro posouzení
stacionarity časové řady v původních hodnotách. V případě, že by se znovu autokorelace
reziduí v modelu vyskytovala, je zpravidla nutné volit větší řád AR procesu (většinou se
postupuje, s ohledem na sílu DF testu, od méně rozsáhlých AR procesů, k těm rozsáhlejším).
Nezbývá tedy nic jiného než porovnat příslušnou vypočtenou t statistiku (pro
nediferencovanou proměnnou zpožděnou o jedno období) s příslušnou kritickou hodnotou.
Tedy:
48
Pro druhý stupeň Dickey-Fullerovy regrese je nutné nejprve vytvořit novou proměnnou, ve
formě druhé diference původní časové řady. To znamená, že vybereme první diference a na
ně aplikujeme znovu první diference přes „Přidat“, „První diference vybraných proměnných“.
49
Druhý stupeň Dickey-Fullerovy regrese provádíme opět přes klasickou BMNČ proceduru,
tzn. „Model“, „Metoda nejmenších čtverců“. Přičemž specifikace je následující (opět
začínáme s klasickou DF regresí, ovšem v tomto případě v druhém stupni). Mezi nezávisle
proměnnými je opět konstanta, neboť pořád zůstáváme u typu modelu B. Pokud máme
specifikováno provedeme odhad pomocí „Budiž“.
Výstup této regrese je vidět na následující straně. Zároveň podle provedeného testu
autokorelace, nebyla zjištěna sériová závislost dílčích reziduálních složek (p-hodnota LM
testu je větší než zvolená hladina významnosti 5 %) – tzn. k posouzení stacionarity časové
řady v prvních diferencích, je možné použít klasický DF-test. V případě, že by se
autokorelace v tomto modelu opět vyskytla, je nutné ji řešit jako v předchozím případě
(prvním stupni), pomocí AR procesu.
50
V tomto případě pro posouzení stacionarity časové řady v prvních diferencích, můžeme tedy
využít tento výstup klasického DF-testu a komparovat příslušnou t-hodnotu (v druhém stupni
je to t-hodnota pro proměnnou jednou diferencovanou) s hodnotou kritickou.
Tedy:
V případě, že by i ve druhém stupni nebylo možné nulovou hypotézu zamítnout (časová řada
nestacionární v prvních diferencích), potom je nutné přejít ke stupni třetímu – testování
stacionarity časové řady v druhých diferencích. Postup je stejný jako v předchozích dvou
stupních, pouze jako závisle proměnná vystupují třetí diference a jako nezávisle proměnná
51
konstanta a zpožděnné druhé diference o jedno období. Samozřejmě opět je nutné, v případě
že se vyskytuje, zachytit autokorelaci reziduí pomocí AR procesu.
52