You are on page 1of 170

PIGUŁKA 2:

Twierdzenie Gaussa-Markowa
środa 19.05.
godz. 19:00

PIGUŁKA 3:
PIGUŁKA 1: Szeregi czasowe
Weryfikacja modelu czwartek 20.05.
wtorek 18.05. godz. 19:00
godz. 19:00
2

Ważne informacje
•Po każdym wykładzie udostępniamy prezentację na
facebookowym wydarzeniu, także nie musicie robić
szczegółowych notatek
•Jesteśmy tu dla Was – śmiało pytajcie o wszystko, co wydaje
się niejasne, proście o powtórzenie, itp.
•Poza samymi wykładami chętnie pomożemy Wam z wszelkimi
ekonometrycznymi problemami czy zadaniami – śmiało piszcie
na fanpage SKNu lub maila skn.ekonometrii.sgh@gmail.com
PIGUŁKA 1.
Weryfikacja modelu
18 maja 2021

Mateusz Janowicz
Konrad Taber
Weronika Pachulska
Plan warsztatu
Model liniowy

Modele nieliniowe

Modele zmiennej jakościowej

Zadania
Część 1

Specyfikacja Modelu Liniowego


6

Czym zajmuje się ekonometria?

• To połączenie teorii ekonomii, danych ekonomicznych, demograficznych


i finansowych oraz zastosowań matematyki i statystyki, dzięki któremu
możemy badać jak dane zjawiska wpływają na gospodarkę

• Ekonometria skupia się na badaniu wpływu jednej lub wielu zmiennych


OBJAŚNIAJĄCYCH (egzogenicznych) na zmienną OBJAŚNIANĄ
(endogeniczną)
7

Rodzaje danych:

• DANE PRZEKROJOWE T=1, n duże

• SZEREGI CZASOWE n=1, T duże

• DANE PANELOWE n>1, T>1


8
Teoretyczny liniowy model ekonometryczny

yi = β0 + β1 x1i + β2 x2i + … + βk xki + ɛi , dla i = 1,2,…,N

gdzie:
yi - zmienna objaśniana
x1i, …, xki - zmienne objaśniające
β1, …, βk - parametry strukturalne modelu
β0 - wyraz wolny
ɛi – składnik losowy

i jest indeksem obserwacji, a N - liczbą obserwacji


9

Zapis macierzowy modelu

y = Xβ + ɛ
10

Czym jest ɛ?
11

Estymator MNK – Metoda Najmniejszych Kwadratów


12

Metoda Najmniejszych Kwadratów

Prostą, która wyznacza równanie modelu liniowego nazywamy prostą regresji,


zaś sam model - modelem regresji liniowej
13
14

TEST ISTOTNOŚCI ZMIENNEJ – TEST t-Studenta


Testujemy czy oszacowanie parametru jest statystycznie istotnie różne od 0
15

p – value
• p-value to prawdopodobieństwo popełnienia błędu I rodzaju czyli
odrzucenie hipotezy zerowej, gdy w rzeczywistości jest prawdziwa

• Przyjęcie lub odrzucenie H0 zależy od przyjętego poziomu istotności,


najczęściej przyjmujemy 5%

• Jeżeli p-value
16
17

MIARY DOPASOWANIA MODELU

współczynnik determinacji R-kwadrat – pokazuje w jakim


stopniu model wyjaśnia zmienność zmiennej objaśnianej

UWAGA Dodając kolejne zmienne do modelu, współczynnik R-kwadrat


będzie zawsze wzrastał, niekoniecznie ze względu na poprawę dopasowania
modelu. Z tego względu, przy porównywaniu modeli o różnych liczbach
regresorów będziemy korzystać z wartości skorygowanego R-kwadrat lub z
kryteriów informacyjnych (AIC, BIC, HIC)
18

GDY DO PORÓWNANIA ALTERNATYWNYCH SPECYFIKACJI


MODELU WYKORZYTUJEMY:

• SKORYGOWANY R-KWADRAT – Wybieramy model o najwyższej


wartości skorygowanego R^2

• KRYTERIA INFORMACYJNE - Wybieramy model z najniższymi


wartościami AIC, BIC lub HIC
Część 2

MODELE NIELINIOWE
20

MODELE NIELINIOWE
• Jak uwzględnić nieliniowość w modelu?
Jednym ze sposobów jest przekształcanie zmiennych w ramach regresji liniowej.
Najczęstsze przekształcenia to:
1. logarytmy - logarytmowanie powoduje zmniejszenie zakresu wartości zmiennych, może
ograniczyć problem heteroskedastyczności i redukować wpływ obserwacji nietypowych
2. kwadraty zmiennych - funkcja kwadratowa jest dobrym sposobem, aby ująć rosnące
bądź malejące efekty krańcowe
Oprócz tego można też wprowadzić zmienne binarne, czy iloczyny zmiennych. Iloczyn
reprezentuje w modelu interakcję, czyli wspólne, jednoczesne działanie dwóch lub kilku
zmiennych.

• Nieuwzględnienie nieliniowości może stanowić błąd specyfikacji !!!


21
Interpretacje parametrów w zależności od postaci modelu:

Model liniowy
Specyfikacja: ,
Int: Zmiana x o jednostkę wiąże się ceteris paribus ze zmianą y o β jednostek.
Model Log – liniowy
Specyfikacja: ,
Int: Zmiana x o 1 jednostkę wiąże się ceteris paribus ze zmianą y o β *100%.
Model liniowo – logarytmiczny
Specyfikacja: ,
Int: Zmiana x o 1% wiąże się ceteris paribus ze zmianą y o β /100 jednostek.
Model log – log
Specyfikacja: ,
Int: Zmiana x o 1% wiąże się ceteris paribus ze zmianą y o β %.
22

TEST RESET - badanie specyfikacji modelu

• H0: postać funkcyjna modelu jest poprawna (specyfikacja


modelu jest poprawna)

• H1: postać funkcyjna modelu nie jest poprawna (specyfikacja


modelu nie jest poprawna)

• Odrzucenie hipotezy zerowej może sugerować nie tylko błąd


doboru postaci funkcyjnej, lecz także pominięcie ważnych dla
modelu zmiennych
Część 3

MODELE ZMIENNEJ JAKOŚCIOWEJ


24

LMP – Liniowy Model Prawdopodobieństwa

• LMP budujemy podobnie jak standardowe modele liniowe,


korzystając z MNK, przy czym zmienną objaśnianą będzie zmienna
binarna (jakościowa). Wartości teoretyczne z modelu to
prawdopodobieństwo wystąpienia danej wartości zmiennej.

• Problemem LMP jest to że mogą występować wartości teoretyczne


spoza przedziału [0,1], ponadto pojawia się problem
heteroskedastyczności składnika losowego.
25
Model Logitowy
Model regresji logistycznej zwany modelem logitowym, objaśnia zmienną binarną
(dychotomiczną), która może przyjmować tylko 2 wartości. Zmienne objaśniające mogą
przyjmować dowolny charakter.

W modelu logitowym związek między prawdopodobieństwem, a zmiennymi objaśniającymi


można opisać za pomocą wzoru:

W powyższym wzorze P(Y) oznacza prawdopodobieństwo, że zmienna objaśniana przyjmie


wartość 1.

Po transformacji logistycznej powyższy wzór przyjmuje następującą postać:

Logit jest zatem logarytmem ilorazu prawdopodobieństwa przyjęcia i nieprzyjęcia wartości 1 przez
zmienną objaśnianą (logarytmem ilorazu szans).
26
Estymacja modelu logitowego
Modele logitowe estymuje się za pomocą Metody Największej Wiarygodności. Opiera się ona na zbudowaniu
odpowiedniej funkcji wiarygodności związanej z analizowanym zdarzeniem.

Koncepcja MNW wiąże się z wyznaczeniem takich oszacowań parametrów, dla których owa funkcja osiąga
wartość maksymalną, czyli maksymalne prawdopodobieństwo zdarzenia w określonej próbie statystycznej.
Stosowanie Metody Największej Wiarygodności w modelu logitowym nie wymaga założenia o normalności
rozkładu składnika losowego.

Estymatory uzyskane tą metodą:


• Są zgodne
• Mają asymptotyczny rozkład normalny
• Są co najmniej asymptotycznie nieobciążone i asymptotycznie najefektywniejsze
27
Poprawność oszacowania modelu logitowego

W modelu logitowym łączną istotność zmiennych bada się za pomocą testu ilorazu
wiarygodności. H0 mówi, że wszystkie parametry modelu (poza wyrazem wolnym) są równe
zero. Wartość p-value mniejsza od 0,05 oznacza, że co najmniej jedna zmienna objaśniająca w
modelu jest istotna statystycznie.

Stopień dopasowania mierzy natomiast pseudo-R^2 McFaddena

gdzie 𝑙𝑛𝐿𝑀𝑃 jest logarytmem funkcji wiarygodności dla modelu pełnego, natomiast 𝑙𝑛𝐿𝑀𝑍 –
dla modelu zredukowanego do wyrazu wolnego.
28

Stopień dopasowania określa również tablica trafności:

Na jej podstawie możemy obliczyć udział trafnych prognoz w


łącznej liczbie obserwacji. Udział ten jest miarą trafności prognoz
ex post. Otrzymaną w ten sposób wartość określa się
zliczeniowym R^2.
Część IV

ZADANIA
30
Zadania - Modele Liniowe

1. W teście t-studenta dla parametru przy zmiennej X1 otrzymano p = 0,2467.

a. Wzrost zmiennej X1 o jednostkę powoduje przeciętny wzrost zmiennej Y o 0,2467 jednostek, ceteris paribus.
b. Szacując parametr przy zmiennej X1 mylimy się przeciętnie o 0,2467
c. Zmienna X1 jest nieistotna statystycznie.

2. Jeżeli wartość p w teście Walda jest bardzo niska to:

a. Model nie jest istotny


b. Wszystkie zmienne są istotne
c. Co najmniej jeden parametr jest różny od zera
d. Model ma zmienną nieistotną

3. Jeżeli statystyka testowa w teście t-studenta wynosi 2,5 a wartość krytyczna to 1,67 to:

a. Brak podstaw do stwierdzenia, że zmienna jest nieistotna


b. Zmienna jest istotna
c. Brak podstaw do stwierdzenia, że zmienna jest istotna
d. Zmienna jest nieistotna
31
Zadania - Modele Liniowe

1. W teście t-studenta dla parametru przy zmiennej X1 otrzymano p = 0,2467.

a. Wzrost zmiennej X1 o jednostkę powoduje przeciętny wzrost zmiennej Y o 0,2467 jednostek, ceteris paribus.
b. Szacując parametr przy zmiennej X1 mylimy się przeciętnie o 0,2467
c. Zmienna X1 jest nieistotna statystycznie.

2. Jeżeli wartość p w teście Walda jest bardzo niska to:

a. Model nie jest istotny


b. Wszystkie zmienne są istotne
c. Co najmniej jeden parametr jest różny od zera
d. Model ma zmienną nieistotną

3. Jeżeli statystyka testowa w teście t-studenta wynosi 2,5 a wartość krytyczna to 1,67 to:

a. Brak podstaw do stwierdzenia, że zmienna jest nieistotna


b. Zmienna jest istotna
c. Brak podstaw do stwierdzenia, że zmienna jest istotna
d. Zmienna jest nieistotna
32
Zadania - Modele Liniowe

1. W teście t-studenta dla parametru przy zmiennej X1 otrzymano p = 0,2467.

a. Wzrost zmiennej X1 o jednostkę powoduje przeciętny wzrost zmiennej Y o 0,2467 jednostek, ceteris paribus.
b. Szacując parametr przy zmiennej X1 mylimy się przeciętnie o 0,2467
c. Zmienna X1 jest nieistotna statystycznie.

2. Jeżeli wartość p w teście Walda jest bardzo niska to:

a. Model nie jest istotny


b. Wszystkie zmienne są istotne
c. Co najmniej jeden parametr jest różny od zera
d. Model ma zmienną nieistotną

3. Jeżeli statystyka testowa w teście t-studenta wynosi 2,5 a wartość krytyczna to 1,67 to:

a. Brak podstaw do stwierdzenia, że zmienna jest nieistotna


b. Zmienna jest istotna
c. Brak podstaw do stwierdzenia, że zmienna jest istotna
d. Zmienna jest nieistotna
33
Zadania - Modele Liniowe

1. W teście t-studenta dla parametru przy zmiennej X1 otrzymano p = 0,2467.

a. Wzrost zmiennej X1 o jednostkę powoduje przeciętny wzrost zmiennej Y o 0,2467 jednostek, ceteris paribus.
b. Szacując parametr przy zmiennej X1 mylimy się przeciętnie o 0,2467
c. Zmienna X1 jest nieistotna statystycznie.

2. Jeżeli wartość p w teście Walda jest bardzo niska to:

a. Model nie jest istotny


b. Wszystkie zmienne są istotne
c. Co najmniej jeden parametr jest różny od zera
d. Model ma zmienną nieistotną

3. Jeżeli statystyka testowa w teście t-studenta wynosi 2,5 a wartość krytyczna to 1,67 to:

a. Brak podstaw do stwierdzenia, że zmienna jest nieistotna


b. Zmienna jest istotna
c. Brak podstaw do stwierdzenia, że zmienna jest istotna
d. Zmienna jest nieistotna
34

4. Zaznacz fałszywe zdanie. Współczynnik determinacji:

a. to miara dopasowania modelu do danych empirycznych


b. przyjmuje wartości z przedziału <-1,1>
c. opisuje się wzorem wynikającym z dekompozycji wariancji całkowitej zmiennej objaśnianej
d. interpretuje się w procentach
35

4. Zaznacz fałszywe zdanie. Współczynnik determinacji:

a. to miara dopasowania modelu do danych empirycznych


b. przyjmuje wartości z przedziału <-1,1>
c. opisuje się wzorem wynikającym z dekompozycji wariancji całkowitej zmiennej objaśnianej
d. interpretuje się w procentach
36

5. Jeśli parametr istotnie różni się od zera to oznacza, że:

a. zmienna objaśniająca, która stoi przy tym parametrze istotnie wpływa na zmienną
objaśnianą
b. parametr ten istotnie wpływa na zmienną objaśnianą
c. parametr ten istotnie wpływa na zmienną objaśniającą, przy której stoi
d. zmienna objaśniana istotnie wpływa na zmienną objaśniającą, która stoi przy tym
parametrze

6. Empiryczny poziom istotności (p-value):

a. oznacza prawdopodobieństwo popełnienia błędu I rodzaju, tzn odrzucenia hipotezy


H0, która w rzeczywistości jest prawdziwa.
b. powinien być niższy od p-value, aby można było na jego podstawie odrzucić H0.
c. określa, z jakim prawdopodobieństwem hipoteza H0 jest fałszywa.
d. wyznaczany dla testu VIF nie powinien przyjmować wartości wyższych niż 10.
37

5. Jeśli parametr istotnie różni się od zera to oznacza, że:

a. zmienna objaśniająca, która stoi przy tym parametrze istotnie wpływa na


zmienną objaśnianą
b. parametr ten istotnie wpływa na zmienną objaśnianą
c. parametr ten istotnie wpływa na zmienną objaśniającą, przy której stoi
d. zmienna objaśniana istotnie wpływa na zmienną objaśniającą, która stoi przy tym
parametrze

6. Empiryczny poziom istotności (p-value):

a. oznacza prawdopodobieństwo popełnienia błędu I rodzaju, tzn odrzucenia hipotezy


H0, która w rzeczywistości jest prawdziwa.
b. powinien być niższy od p-value, aby można było na jego podstawie odrzucić H0.
c. określa, z jakim prawdopodobieństwem hipoteza H0 jest fałszywa.
d. wyznaczany dla testu VIF nie powinien przyjmować wartości wyższych niż 10.
38

5. Jeśli parametr istotnie różni się od zera to oznacza, że:

a. zmienna objaśniająca, która stoi przy tym parametrze istotnie wpływa na


zmienną objaśnianą
b. parametr ten istotnie wpływa na zmienną objaśnianą
c. parametr ten istotnie wpływa na zmienną objaśniającą, przy której stoi
d. zmienna objaśniana istotnie wpływa na zmienną objaśniającą, która stoi przy tym
parametrze

6. Empiryczny poziom istotności (p-value):

a. oznacza prawdopodobieństwo popełnienia błędu I rodzaju, tzn odrzucenia


hipotezy H0, która w rzeczywistości jest prawdziwa.
b. powinien być niższy od p-value, aby można było na jego podstawie odrzucić H0.
c. określa, z jakim prawdopodobieństwem hipoteza H0 jest fałszywa.
d. wyznaczany dla testu VIF nie powinien przyjmować wartości wyższych niż 10.
39
7. Test t-Studenta

a. nie powinien być stosowany gdy wśród zmiennych objaśniających modelu znajdują się
zmienne opóźnione.
b. nie może być stosowany w przypadku gdy model został oszacowany na danych
przekrojowych.
c. zastępuje test RESET gdy pozwala stwierdzić istotność wszystkich zmiennych objaśniających
modelu.
d. może być wykorzystywany do badania istotności zmiennych binarnych.

8. Macierz obserwacji zmiennych objaśniających modelu o równaniu:


Y=β0+β1∗X1+β2∗X2+β3∗X1∗X2+ϵ

a. składa się z trzech kolumn.


b. musi mieć co najmniej 10 wierszy, żeby można było oszacować ten model stosując KMNK.
c. nie może być zastosowana do oszacowania parametrów tego modelu, ponieważ zmienna
X1*X2 stanowi liniową kombinację zmiennych X1 i X2
d. musi zawierać kolumnę jedynek ze względu na to, że w modelu jest wyraz wolny
40
7. Test t-Studenta

a. nie powinien być stosowany gdy wśród zmiennych objaśniających modelu znajdują się
zmienne opóźnione.
b. nie może być stosowany w przypadku gdy model został oszacowany na danych
przekrojowych.
c. zastępuje test RESET gdy pozwala stwierdzić istotność wszystkich zmiennych objaśniających
modelu.
d. może być wykorzystywany do badania istotności zmiennych binarnych.

8. Macierz obserwacji zmiennych objaśniających modelu o równaniu:


Y=β0+β1∗X1+β2∗X2+β3∗X1∗X2+ϵ

a. składa się z trzech kolumn.


b. musi mieć co najmniej 10 wierszy, żeby można było oszacować ten model stosując KMNK.
c. nie może być zastosowana do oszacowania parametrów tego modelu, ponieważ zmienna
X1*X2 stanowi liniową kombinację zmiennych X1 i X2
d. musi zawierać kolumnę jedynek ze względu na to, że w modelu jest wyraz wolny
41
7. Test t-Studenta

a. nie powinien być stosowany gdy wśród zmiennych objaśniających modelu znajdują się
zmienne opóźnione.
b. nie może być stosowany w przypadku gdy model został oszacowany na danych
przekrojowych.
c. zastępuje test RESET gdy pozwala stwierdzić istotność wszystkich zmiennych objaśniających
modelu.
d. może być wykorzystywany do badania istotności zmiennych binarnych.

8. Macierz obserwacji zmiennych objaśniających modelu o równaniu:


Y=β0+β1∗X1+β2∗X2+β3∗X1∗X2+ϵ

a. składa się z trzech kolumn.


b. musi mieć co najmniej 10 wierszy, żeby można było oszacować ten model stosując KMNK.
c. nie może być zastosowana do oszacowania parametrów tego modelu, ponieważ zmienna
X1*X2 stanowi liniową kombinację zmiennych X1 i X2
d. musi zawierać kolumnę jedynek ze względu na to, że w modelu jest wyraz wolny
42

9. Współczynnik determinacji wynosi 0,78, a skorygowany współczynnik determinacji 0,76. Oznacza to, że:

a. Około 76% zmienności wydatków na lody jest wyjaśniane przez model


b. Około 22% zmienności wydatków na lody nie jest wyjaśniane przez model.
c. Model słabo wyjaśnia badane zjawisko, bo 0,76 < 0,78.
d. Dołączenie do modelu drugiej zmiennej objaśniającej pogorszyło jakość modelu, bo 0,76 < 0,78.

10. Dla jednorównaniowego modelu ekonometrycznego z wyrazem wolnym szacowanego klasyczną


metodą najmniejszych kwadratów (KMNK):

a. Musi być spełnione założenie o normalności składnika losowego.


b. Skorygowany współczynnik determinacji przyjmuje zawsze wartości od 0 do 1.
c. Testowanie autokorelacji składnika losowego konieczne jest tylko w przypadku danych przekrojowych
d. Brak odrzucenia hipotezy zerowej w uogólnionym teście Walda oznacza, że badana regresja jest
nieistotna
43

9. Współczynnik determinacji wynosi 0,78, a skorygowany współczynnik determinacji 0,76. Oznacza to, że:

a. Około 76% zmienności wydatków na lody jest wyjaśniane przez model


b. Około 22% zmienności wydatków na lody nie jest wyjaśniane przez model.
c. Model słabo wyjaśnia badane zjawisko, bo 0,76 < 0,78.
d. Dołączenie do modelu drugiej zmiennej objaśniającej pogorszyło jakość modelu, bo 0,76 < 0,78.

10. Dla jednorównaniowego modelu ekonometrycznego z wyrazem wolnym szacowanego klasyczną


metodą najmniejszych kwadratów (KMNK):

a. Musi być spełnione założenie o normalności składnika losowego.


b. Skorygowany współczynnik determinacji przyjmuje zawsze wartości od 0 do 1.
c. Testowanie autokorelacji składnika losowego konieczne jest tylko w przypadku danych przekrojowych
d. Brak odrzucenia hipotezy zerowej w uogólnionym teście Walda oznacza, że badana regresja jest
nieistotna
44

9. Współczynnik determinacji wynosi 0,78, a skorygowany współczynnik determinacji 0,76. Oznacza to, że:

a. Około 76% zmienności wydatków na lody jest wyjaśniane przez model


b. Około 22% zmienności wydatków na lody nie jest wyjaśniane przez model.
c. Model słabo wyjaśnia badane zjawisko, bo 0,76 < 0,78.
d. Dołączenie do modelu drugiej zmiennej objaśniającej pogorszyło jakość modelu, bo 0,76 < 0,78.

10. Dla jednorównaniowego modelu ekonometrycznego z wyrazem wolnym szacowanego klasyczną


metodą najmniejszych kwadratów (KMNK):

a. Musi być spełnione założenie o normalności składnika losowego.


b. Skorygowany współczynnik determinacji przyjmuje zawsze wartości od 0 do 1.
c. Testowanie autokorelacji składnika losowego konieczne jest tylko w przypadku danych przekrojowych
d. Brak odrzucenia hipotezy zerowej w uogólnionym teście Walda oznacza, że badana regresja
jest nieistotna
45
Zadania - modele nieliniowe
1. W którym z poniższych modeli efekt krańcowy jest stały?
a. liniowy
b. logarytmiczno - liniowy
c. liniowo - logarytmiczny
d. logarytmiczno - logarytmiczny

2. Zależność pomiędzy x i y cechuje stała elastyczność równa -2. Oznacza to, że:

a. wzrost x o 1% powoduje spadek y o 2


b. wzrost x o 1% powoduje spadek y o 2%
c. wzrost x o 1 powoduje spadek y o 2
d. żadna z odpowiedzi nie jest poprawna

3. Zmienna x1 przyjmuje wartość 1 dla kobiet, zmienna x2 przyjmuje wartość 1 dla


zamężnych/żonatych. Wartość x1*x2=0 NIE oznacza:

a. mężatki
b. panny
c. kawalera
d. żonatego
46
Zadania - modele nieliniowe
1. W którym z poniższych modeli efekt krańcowy jest stały?
a. liniowy
b. logarytmiczno - liniowy
c. liniowo - logarytmiczny
d. logarytmiczno - logarytmiczny

2. Zależność pomiędzy x i y cechuje stała elastyczność równa -2. Oznacza to, że:

a. wzrost x o 1% powoduje spadek y o 2


b. wzrost x o 1% powoduje spadek y o 2%
c. wzrost x o 1 powoduje spadek y o 2
d. żadna z odpowiedzi nie jest poprawna

3. Zmienna x1 przyjmuje wartość 1 dla kobiet, zmienna x2 przyjmuje wartość 1 dla


zamężnych/żonatych. Wartość x1*x2=0 NIE oznacza:

a. mężatki
b. panny
c. kawalera
d. żonatego
47
Zadania - modele nieliniowe
1. W którym z poniższych modeli efekt krańcowy jest stały?
a. liniowy
b. logarytmiczno - liniowy
c. liniowo - logarytmiczny
d. logarytmiczno - logarytmiczny

2. Zależność pomiędzy x i y cechuje stała elastyczność równa -2. Oznacza to, że:

a. wzrost x o 1% powoduje spadek y o 2


b. wzrost x o 1% powoduje spadek y o 2%
c. wzrost x o 1 powoduje spadek y o 2
d. żadna z odpowiedzi nie jest poprawna

3. Zmienna x1 przyjmuje wartość 1 dla kobiet, zmienna x2 przyjmuje wartość 1 dla


zamężnych/żonatych. Wartość x1*x2=0 NIE oznacza:

a. mężatki
b. panny
c. kawalera
d. żonatego
48
Zadania - modele nieliniowe
1. W którym z poniższych modeli efekt krańcowy jest stały?
a. liniowy
b. logarytmiczno - liniowy
c. liniowo - logarytmiczny
d. logarytmiczno - logarytmiczny

2. Zależność pomiędzy x i y cechuje stała elastyczność równa -2. Oznacza to, że:

a. wzrost x o 1% powoduje spadek y o 2


b. wzrost x o 1% powoduje spadek y o 2%
c. wzrost x o 1 powoduje spadek y o 2
d. żadna z odpowiedzi nie jest poprawna

3. Zmienna x1 przyjmuje wartość 1 dla kobiet, zmienna x2 przyjmuje wartość 1 dla


zamężnych/żonatych. Wartość x1*x2=0 NIE oznacza:

a. mężatki
b. panny
c. kawalera
d. żonatego
49
Zadania - modele nieliniowe
4. Oszacowanie zmiennej interakcyjnej (zmiennej binarnej ze zmienną ciągłą):

a. nie wpłynie na prognozy dla jednostek, dla których zmienna binarna wynosi 0
b. przesunie prostą regresji równolegle w górę lub w dół, czyli zmieni się stała w modelu
c. obydwie odpowiedzi są poprawne
d. żadna z odpowiedzi nie jest poprawna

5. Tworzymy zmienne binarne oznaczające województwa w PL. Ile zmiennych binarnych


możemy umieścić w modelu?

a. 14
b. 17
c. 15
d. 16
50
Zadania - modele nieliniowe
4. Oszacowanie zmiennej interakcyjnej (zmiennej binarnej ze zmienną ciągłą):

a. nie wpłynie na prognozy dla jednostek, dla których zmienna binarna wynosi 0
b. przesunie prostą regresji równolegle w górę lub w dół, czyli zmieni się stała w modelu
c. obydwie odpowiedzi są poprawne
d. żadna z odpowiedzi nie jest poprawna

5. Tworzymy zmienne binarne oznaczające województwa w PL. Ile zmiennych binarnych


możemy umieścić w modelu?

a. 14
b. 17
c. 15
d. 16
51
Zadania - modele nieliniowe
4. Oszacowanie zmiennej interakcyjnej (zmiennej binarnej ze zmienną ciągłą):

a. nie wpłynie na prognozy dla jednostek, dla których zmienna binarna wynosi 0
b. przesunie prostą regresji równolegle w górę lub w dół, czyli zmieni się stała w modelu
c. obydwie odpowiedzi są poprawne
d. żadna z odpowiedzi nie jest poprawna

5. Tworzymy zmienne binarne oznaczające województwa w PL. Ile zmiennych binarnych


możemy umieścić w modelu?

a. 14
b. 17
c. 15
d. 16
52
Zadania - modele nieliniowe
6. Dany jest model ekonometryczny W = 28 - 4,1 C + 3,6 lnY + 0,05 t, gdzie: W – wydatki (w
tys. zł.), C – cena (w zł.), Y – dochód (w zł.), t – czas, ln – logarytm naturalny.

a. Wzrost dochodu o 1% powoduje wzrost wydatków przeciętnie o około 3,6 tysiąca złotych,
ceteris paribus.
b. Wzrost dochodu o 1% powoduje wzrost wydatków przeciętnie o około 36 złotych, ceteris
paribus.
c. Wzrost dochodu o 1 zł. powoduje wzrost wydatków przeciętnie o około 3,6 tysiąca
złotych, ceteris paribus.
d. Wzrost dochodu o 1 zł. powoduje wzrost wydatków przeciętnie o około 3,6 %, ceteris
paribus.
53
Interpretacje parametrów w zależności od postaci modelu:

Model liniowy
Specyfikacja: ,
Int: Zmiana x o jednostkę wiąże się ceteris paribus ze zmianą y o β jednostek.
Model Log – liniowy
Specyfikacja: ,
Int: Zmiana x o 1 jednostkę wiąże się ceteris paribus ze zmianą y o β *100%.
Model liniowo – logarytmiczny
Specyfikacja: ,
Int: Zmiana x o 1% wiąże się ceteris paribus ze zmianą y o β /100 jednostek.
Model log – log
Specyfikacja: ,
Int: Zmiana x o 1% wiąże się ceteris paribus ze zmianą y o β %.
54
Zadania - modele nieliniowe
6. Dany jest model ekonometryczny W = 28 - 4,1 C + 3,6 lnY + 0,05 t, gdzie: W – wydatki (w
tys. zł.), C – cena (w zł.), Y – dochód (w zł.), t – czas, ln – logarytm naturalny.

a. Wzrost dochodu o 1% powoduje wzrost wydatków przeciętnie o około 3,6 tysiąca złotych,
ceteris paribus.
b. Wzrost dochodu o 1% powoduje wzrost wydatków przeciętnie o około 36 złotych,
ceteris paribus.
c. Wzrost dochodu o 1 zł. powoduje wzrost wydatków przeciętnie o około 3,6 tysiąca
złotych, ceteris paribus.
d. Wzrost dochodu o 1 zł. powoduje wzrost wydatków przeciętnie o około 3,6 %, ceteris
paribus.
55
Zadania - modele nieliniowe
7. Dany jest model ekonometryczny ln W = 28 - 3,6 C + 4,1 Y + 0,02 t, gdzie: W – wydatki (w
tys. zł.), C – cena (w zł.), Y – dochód (w zł.), t – czas, ln – logarytm naturalny.

a. Z okresu na okres następował wzrost logarytmu wydatków przeciętnie o 2 tysiące złotych,


ceteris paribus.
b. Z okresu na okres następował wzrost wydatków przeciętnie o 0,02 tysiąca złotych, ceteris
paribus.
c. Z okresu na okres następował wzrost wydatków przeciętnie o 0,02%, ceteris paribus.
d. Z okresu na okres następował wzrost wydatków przeciętnie o 2%, ceteris paribus.
56
Zadania - modele nieliniowe
7. Dany jest model ekonometryczny ln W = 28 - 3,6 C + 4,1 Y + 0,02 t, gdzie: W – wydatki (w
tys. zł.), C – cena (w zł.), Y – dochód (w zł.), t – czas, ln – logarytm naturalny.

a. Z okresu na okres następował wzrost logarytmu wydatków przeciętnie o 2 tysiące złotych,


ceteris paribus.
b. Z okresu na okres następował wzrost wydatków przeciętnie o 0,02 tysiąca złotych, ceteris
paribus.
c. Z okresu na okres następował wzrost wydatków przeciętnie o 0,02%, ceteris paribus.
d. Z okresu na okres następował wzrost wydatków przeciętnie o 2%, ceteris paribus.
57
Zadania - modele nieliniowe
8. Oszacowano model trendu, w którym Y oznacza wartość nakładów inwestycyjnych w mld
jednostek pieniężnych (jp) rocznie:

t oznacza zmienną czasową (numer roku). Które zdanie jest prawdziwe?

a. Nakłady inwestycyjne wzrastały rocznie średnio o 4,5%


b. Nakłady inwestycyjne wzrastały rocznie średnio o 0,045 mld jp
c. Nakłady inwestycyjne wzrastały rocznie średnio o 0,45 mln jp
58
Zadania - modele nieliniowe
8. Oszacowano model trendu, w którym Y oznacza wartość nakładów inwestycyjnych w mld
jednostek pieniężnych (jp) rocznie:

t oznacza zmienną czasową (numer roku). Które zdanie jest prawdziwe?

a. Nakłady inwestycyjne wzrastały rocznie średnio o 4,5%


b. Nakłady inwestycyjne wzrastały rocznie średnio o 0,045 mld jp
c. Nakłady inwestycyjne wzrastały rocznie średnio o 0,45 mln jp
59
Zadania - modele zmiennej jakościowej
1. Na podstawie 1200 obserwacji oszacowano model logitowy, który 550 razy prawidłowo
przewidział wynik negatywny (0), 160 nieprawidłowo prognozował wynik negatywny i 140
razy nieprawidłowo prognozował wynik pozytywny (1). Ile wynosi zliczeniowy R^2?

a. 0,71
b. 0,46
c. 0,55
d. 0,75

2. Jak wyznaczyć graniczną wartość prawdopodobieństwa w modelu logitowym, od której


prognozujemy wartość 1 dla badanej zmiennej binarnej (próg odcięcia)? Zaznacz 2
odpowiedzi:

a. Możemy wybrać wartość 50% jako wartość graniczną


b. Możemy wykorzystać średnią wartość zmiennej zależnej
c. Możemy ustalić wartość równą udziałowi wartości "0" w próbie
d. Możemy ustalić wartość równą udziałowi wartości "1" w próbie
60
Zadania - modele zmiennej jakościowej
1. Na podstawie 1200 obserwacji oszacowano model logitowy, który 550 razy prawidłowo
przewidział wynik negatywny (0), 160 nieprawidłowo prognozował wynik negatywny i 140
razy nieprawidłowo prognozował wynik pozytywny (1). Ile wynosi zliczeniowy R^2?
1200 - 550 - 160 - 140 = 350; (350 + 550) / 1200 = 0,75

a. 0,71
b. 0,46
c. 0,55
d. 0,75

2. Jak wyznaczyć graniczną wartość prawdopodobieństwa w modelu logitowym, od której


prognozujemy wartość 1 dla badanej zmiennej binarnej (próg odcięcia)? Zaznacz 2
odpowiedzi:

a. Możemy wybrać wartość 50% jako wartość graniczną


b. Możemy wykorzystać średnią wartość zmiennej zależnej
c. Możemy ustalić wartość równą udziałowi wartości "0" w próbie
d. Możemy ustalić wartość równą udziałowi wartości "1" w próbie
61
Zadania - modele zmiennej jakościowej
1. Na podstawie 1200 obserwacji oszacowano model logitowy, który 550 razy prawidłowo
przewidział wynik negatywny (0), 160 nieprawidłowo prognozował wynik negatywny i 140
razy nieprawidłowo prognozował wynik pozytywny (1). Ile wynosi zliczeniowy R^2?
1200 - 550 - 160 - 140 = 350; (350 + 550) / 1200 = 0,75

a. 0,71
b. 0,46
c. 0,55
d. 0,75

2. Jak wyznaczyć graniczną wartość prawdopodobieństwa w modelu logitowym, od której


prognozujemy wartość 1 dla badanej zmiennej binarnej (próg odcięcia)? Zaznacz 2
odpowiedzi:

a. Możemy wybrać wartość 50% jako wartość graniczną


b. Możemy wykorzystać średnią wartość zmiennej zależnej
c. Możemy ustalić wartość równą udziałowi wartości "0" w próbie
d. Możemy ustalić wartość równą udziałowi wartości "1" w próbie
62
Zadania - modele zmiennej jakościowej
3. W liniowym modelu prawdopodobieństwa:

a. Może wystąpić problem homoskedastyczności


b. Prognozowane prawdopodobieństwo może być większe niż 1
c. Efekty krańcowe nie są stałe
d. Wszystkie odpowiedzi są poprawne

4. W modelu logitowym:

a. Efekty krańcowe są stałe


b. Wpływ zmiennej niezależnej na iloraz szans jest stały
c. Wpływ zmiennej niezależnej na logarytm ilorazu szans jest stały
d. Wszystkie odpowiedzi są prawidłowe
63
Zadania - modele zmiennej jakościowej
3. W liniowym modelu prawdopodobieństwa:

a. Może wystąpić problem homoskedastyczności


b. Prognozowane prawdopodobieństwo może być większe niż 1
c. Efekty krańcowe nie są stałe
d. Wszystkie odpowiedzi są poprawne

4. W modelu logitowym:

a. Efekty krańcowe są stałe


b. Wpływ zmiennej niezależnej na iloraz szans jest stały
c. Wpływ zmiennej niezależnej na logarytm ilorazu szans jest stały
d. Wszystkie odpowiedzi są prawidłowe
64
Zadania - modele zmiennej jakościowej
3. W liniowym modelu prawdopodobieństwa:

a. Może wystąpić problem homoskedastyczności


b. Prognozowane prawdopodobieństwo może być większe niż 1
c. Efekty krańcowe nie są stałe
d. Wszystkie odpowiedzi są poprawne

4. W modelu logitowym:

a. Efekty krańcowe są stałe


b. Wpływ zmiennej niezależnej na iloraz szans jest stały
c. Wpływ zmiennej niezależnej na logarytm ilorazu szans jest stały
d. Wszystkie odpowiedzi są prawidłowe
65
Zadania - modele zmiennej jakościowej
5. Na 234 obserwacje, dla których Y = 1 model wskazał wartość 1 w 198 przypadkach. Dla Y = 0
model wskazał wartość 1 w 32 przypadkach na 222. Zliczeniowy współczynnik determinacji
wynosi:
a. 198/234
b. 32/222
c. 230/456
d. 388/456

6. Oszacowanie modelu logitowego ma postać: Z = 1,236 - 0,104 X. Oznacza to, że:


a. Prawdopodobieństwo, że Y = 1 przy X równym 1 wynosi około 10%.
b. Prawdopodobieństwo, że Y = 1 przy X równym 1 wynosi exp(-0,104).
c. Iloraz szans jest mniejszy o około 10% wraz ze wzrostem X o jednostkę, ceteris paribus.
d. Iloraz szans wynosi około 10%, ceteris paribus.
66
Zadania - modele zmiennej jakościowej
5. Na 234 obserwacje, dla których Y = 1 model wskazał wartość 1 w 198 przypadkach. Dla Y = 0
model wskazał wartość 1 w 32 przypadkach na 222. Zliczeniowy współczynnik determinacji
wynosi:
((222 - 32) + 198) / (234 + 222)
a. 198/234
b. 32/222
c. 230/456
d. 388/456

6. Oszacowanie modelu logitowego ma postać: Z = 1,236 - 0,104 X. Oznacza to, że:


a. Prawdopodobieństwo, że Y = 1 przy X równym 1 wynosi około 10%.
b. Prawdopodobieństwo, że Y = 1 przy X równym 1 wynosi exp(-0,104).
c. Iloraz szans jest mniejszy o około 10% wraz ze wzrostem X o jednostkę, ceteris paribus.
d. Iloraz szans wynosi około 10%, ceteris paribus.
67
Zadania - modele zmiennej jakościowej
5. Na 234 obserwacje, dla których Y = 1 model wskazał wartość 1 w 198 przypadkach. Dla Y = 0
model wskazał wartość 1 w 32 przypadkach na 222. Zliczeniowy współczynnik determinacji
wynosi:
((222 - 32) + 198) / (234 + 222)
a. 198/234
b. 32/222
c. 230/456
d. 388/456

6. Oszacowanie modelu logitowego ma postać: Z = 1,236 - 0,104 X. Oznacza to, że:


a. Prawdopodobieństwo, że Y = 1 przy X równym 1 wynosi około 10%.
b. Prawdopodobieństwo, że Y = 1 przy X równym 1 wynosi exp(-0,104).
c. Iloraz szans jest mniejszy o około 10% wraz ze wzrostem X o jednostkę, ceteris
paribus.
d. Iloraz szans wynosi około 10%, ceteris paribus.
68
Zadania - modele zmiennej jakościowej
7. Zmienna Y = 1 oznacza posiadanie akwarium (Y = 0 oznacza nie posiadanie akwarium). Zmienna
X oznacza wiek osoby. Oszacowanie parametru przy zmiennej X ma wartość -0,105, a oszacowanie
wyrazu wolnego 1,5. Prawdopodobieństwo, że osoba w wieku 30 lat nie posiada akwarium wynosi
około:
a. 0,839
b. 0,808
c. 0,192
d. 0,161

8. Dla zmiennej X efekt krańcowy dla średnich wynosi 0,13. Oznacza to, że
a. Zmienna jest nieistotna, bo 0,13 > 0,05.
b. Wzrost X o jednostkę powoduje wzrost prawdopodobieństwa, że Y = 1 o około 0,13 dla średniej
wartości X.
c. Wzrost X o jednostkę powoduje wzrost ilorazu szans o około 13% dla średniej wartości X.
d. Wzrost X o jednostkę powoduje wzrost ilorazu szans o około exp(0,13) dla średniej wartości X.
69
Zadania - modele zmiennej jakościowej
7. Zmienna Y = 1 oznacza posiadanie akwarium (Y = 0 oznacza nie posiadanie basenu). Zmienna X
oznacza wiek osoby. Oszacowanie parametru przy zmiennej X ma wartość -0,105, a oszacowanie
wyrazu wolnego 1,5. Prawdopodobieństwo, że osoba w wieku 30 lat nie posiada akwarium wynosi
około:
a. 0,839
b. 0,808
c. 0,192
d. 0,161

8. Dla zmiennej X efekt krańcowy dla średnich wynosi 0,13. Oznacza to, że
a. Zmienna jest nieistotna, bo 0,13 > 0,05.
b. Wzrost X o jednostkę powoduje wzrost prawdopodobieństwa, że Y = 1 o około 0,13 dla średniej
wartości X.
c. Wzrost X o jednostkę powoduje wzrost ilorazu szans o około 13% dla średniej wartości X.
d. Wzrost X o jednostkę powoduje wzrost ilorazu szans o około exp(0,13) dla średniej wartości X.
70
Zadania - modele zmiennej jakościowej
7. Zmienna Y = 1 oznacza posiadanie akwarium (Y = 0 oznacza nie posiadanie basenu). Zmienna X
oznacza wiek osoby. Oszacowanie parametru przy zmiennej X ma wartość -0,105, a oszacowanie
wyrazu wolnego 1,5. Prawdopodobieństwo, że osoba w wieku 30 lat nie posiada akwarium wynosi
około:
a. 0,839
b. 0,808
c. 0,192
d. 0,161

8. Dla zmiennej X efekt krańcowy dla średnich wynosi 0,13. Oznacza to, że
a. Zmienna jest nieistotna, bo 0,13 > 0,05.
b. Wzrost X o jednostkę powoduje wzrost prawdopodobieństwa, że Y = 1 o około 0,13 dla
średniej wartości X.
c. Wzrost X o jednostkę powoduje wzrost ilorazu szans o około 13% dla średniej wartości X.
d. Wzrost X o jednostkę powoduje wzrost ilorazu szans o około exp(0,13) dla średniej wartości X.
71
Zadania - modele zmiennej jakościowej
9. Którego z następujących problemów nie można analizować przy użyciu modelu logitowego:
a. Student decyduje się na studia za granicą
b. Doświadczenie pracownika ma wpływ na jego poziom zarobków
c. Starający się o kredyt nie spłacą go
d. Student opuści dom rodzinny

10. W modelu logitowym Z = 2,158 - 0,4388 X. Y = 1 oznacza mieszkanie samodzielne, X oznacza


płeć (X = 1 - kobiety , X = 0 - mężczyźni) Interpretacja ilorazu szans zmiennej X przedstawia się
następująco:
a. Szansa, że student mieszka samodzielne, niż niesamodzielnie, jest średnio o około 36%
mniejsza dla kobiet niż dla mężczyzn.
b. Szansa, że student mieszka samodzielnie, niż niesamodzielnie, jest średnio o około 44%
mniejsza dla kobiet niż dla mężczyzn.
c. Szansa, że student mieszka samodzielnie, niż niesamodzielnie, jest średnio o około 64%
mniejsza dla kobiet niż dla mężczyzn.
72
Zadania - modele zmiennej jakościowej
9. Którego z następujących problemów nie można analizować przy użyciu modelu logitowego:
a. Student decyduje się na studia za granicą
b. Doświadczenie pracownika ma wpływ na jego poziom zarobków
c. Starający się o kredyt nie spłacą go
d. Student opuści dom rodzinny

10. W modelu logitowym Z = 2,158 - 0,4388 X. Y = 1 oznacza mieszkanie samodzielne, X oznacza


płeć (X = 1 - kobiety , X = 0 - mężczyźni) Interpretacja ilorazu szans zmiennej X przedstawia się
następująco:
a. Szansa, że student mieszka samodzielne, niż niesamodzielnie, jest średnio o około 36%
mniejsza dla kobiet niż dla mężczyzn.
b. Szansa, że student mieszka samodzielnie, niż niesamodzielnie, jest średnio o około 44%
mniejsza dla kobiet niż dla mężczyzn.
c. Szansa, że student mieszka samodzielnie, niż niesamodzielnie, jest średnio o około 64%
mniejsza dla kobiet niż dla mężczyzn.
73
Zadania - modele zmiennej jakościowej
9. Którego z następujących problemów nie można analizować przy użyciu modelu logitowego:
a. Student decyduje się na studia za granicą
b. Doświadczenie pracownika ma wpływ na jego poziom zarobków
c. Starający się o kredyt nie spłacą go
d. Student opuści dom rodzinny

10. W modelu logitowym Z = 2,158 - 0,4388 X. Y = 1 oznacza mieszkanie samodzielne, X oznacza


płeć (X = 1 - kobiety , X = 0 - mężczyźni) Interpretacja ilorazu szans zmiennej X przedstawia się
następująco:
a. Szansa, że student mieszka samodzielne, niż niesamodzielnie, jest średnio o około 36%
mniejsza dla kobiet niż dla mężczyzn.
b. Szansa, że student mieszka samodzielnie, niż niesamodzielnie, jest średnio o około 44%
mniejsza dla kobiet niż dla mężczyzn.
c. Szansa, że student mieszka samodzielnie, niż niesamodzielnie, jest średnio o około 64%
mniejsza dla kobiet niż dla mężczyzn.
Bibliografia:

• Gruszczyński Marek, Kuszewski Tomasz, Podgórska Maria; Ekonometria i badania


operacyjne: podręcznik dla studiów licencjackich;

• https://web.sgh.waw.pl/~mrubas/Econometrics/Econometrics.htm

• https://web.sgh.waw.pl/~jmuck/Ekonometria.html

• Marcin Topolewski, Modelowanie ekonometryczne


Informacje kontaktowe

Facebook: SKN Ekonometrii

YouTube: SKN Ekonometrii SGH

Mail: skn.ekonometrii.sgh@gmail.com

Dziękujemy za uwagę!
Zapraszamy do śledzenia
informacji o kolejnych
wydarzeniach ☺
PIGUŁKA 2:
WIELKA Twierdzenie Gaussa-Markowa

POWTÓRKA PIGUŁKA środa 19.05.


godz. 19:00
Z EKONOMETRII

PIGUŁKA 3:
PIGUŁKA 1: Szeregi czasowe
Weryfikacja modelu czwartek 20.05.
wtorek 18.05. godz. 19:00
godz. 19:00
PIGUŁKA 2.
Twierdzenie
Gaussa-Markowa
19 maja 2021
Daniel Zawrotny
Bartosz Zoła
Natalia Błaszczuk

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Plan warsztatu
Twierdzenie Gaussa - Markowa

Heteroskedastyczność

Autokorelacja

Współliniowość

Endogeniczność
CZĘŚĆ 01

Twierdzenie
Gaussa-Markowa

Twierdzenie Gaussa-Markowa - wprowadzenie


Założenia Klasycznej Metody Najmniejszych Kwadratów
Twierdzenie Gaussa-Markowa - wprowadzenie

Brak współliniowości Homoskedastyczność


𝑟𝑧 𝑿 = 𝑘 + 1 ≤ 𝑛 𝑉𝑎𝑟 𝜺 = 𝜎 ! I

KMNK
Ścisła egzogeniczność Brak autokorelacji
𝐸 𝜺 = 0 𝑜𝑟𝑎𝑧 𝐸 𝑿𝜀 = 0 𝑉𝑎𝑟 𝜺 = 𝜎 ! I

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Twierdzenie Gaussa-Markowa
Twierdzenie Gaussa-Markowa - wprowadzenie

Jeśli spełnione są założenia z poprzedniego slajdu,

! uzyskany KMNK jest estymatorem


to estymator 𝜷

BLUE (best linear unbiased estimator),

tzn. jest estymatorem:

- liniowym,

- zgodnym,

- nieobciążonym,

- najefektywniejszym w klasie liniowych i

nieobciążonych estymatorów.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Własności estymatora MNK
Twierdzenie Gaussa-Markowa - wprowadzenie

Nieobciążoność Efektywność
• Wartość oczekiwana 𝜷 ! jest równa prawdziwej • Miara efektywności – wariancja.
wartości parametru β.
• Oznacza, że jeżeli powtórzymy estymację z
KMNK • Im mniejsza wariancja, tym mniejsze błędy
szacunku, tym większa efektywność.
wykorzystaniem różnych obserwacji, to • MAŁA WARIANCJA
„średnio” oszacowania będą kształtowały
blisko prawdziwej wartości parametru.
• ŚREDNIO SIĘ NIE MYLIMY

Zgodność
• Im większa próba, tym większe
prawdopodobieństwo, że „trafimy” w
prawdziwą wartość parametru.
• IM WIĘCEJ OBSERWACJI, TYM WIELKA
LEPIEJ POWTÓRKA PIGUŁKA
Z EKONOMETRII
CZĘŚĆ 02

Twierdzenie Gaussa-
Markowa

Heteroskedastyczność
Heteroskedastyczność
Heteroskedastyczność

Heteroskedastyczność
Heteroskedastyczność oznacza zmienność wariancji składnika losowego i wiąże się z niespełnieniem założenia KMNK:
Var 𝜺 = 𝜎 ! I

Przyczyny Macierz wariancji-kowariancji składnika losowego:


1) Problem pominiętych zmiennych
2) Niepoprawna postać funkcyjna modelu

Skutki
1) Estymator przestaje być najbardziej
efektywny (nadal nieobciążony)
2) Nieprawidłowe oceny błędów
standardowych i w konsekwencji
niewiarygodne testy t-studenta Niejednorodna wariancja
istotności zmiennych

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 1
Heteroskedastyczność

Heteroskedastyczność składnika losowego oznacza, że:

1. Składnik losowy ma za dużą wariancję, co powoduje duże błędy szacunku parametrów.


2. Składnik losowy nie ma rozkładu normalnego.
3. Składnik losowy powoduje współliniowość zmiennych objaśniających.
4. Składnik losowy nie ma stałej wariancji, co powoduje duże błędy szacunku parametrów.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 2
Heteroskedastyczność

W przypadku heteroskedastyczności składnika losowego mamy do czynienia z:

1. Niezgodnością zarówno estymatora KMNK jak i estymatora wariancji-kowariancji


estymatora KMNK
2. Tylko z niezgodnością estymatora wariancji-kowariancji estymatora KMNK
3. Tylko z niezgodnością estymatora KMNK
4. Zgodnym zarówno estymatorem KMNK jak i estymatorem wariancji-kowariancji KMNK

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Test White’a

KROK 1 – regresja KMNK KROK 2 – regresja pomocnicza


Szacujemy model podstawowy: Szacujemy model pomocniczy, w którym
kwadraty reszt z modelu są zmienną
𝑦" = 𝛽𝑥" + 𝜀 objaśnianą. Zmiennymi objaśniającymi są
najczęściej regresory z podstawowego
Liczymy kwadraty reszt z
modelu, ich kwadraty i zmienne interakcyjne.
oszacowanego modelu

Idea testu Hipotezy i statystyka


Bez występującej heteroskedastyczności H0: reszty są homoskedastyczne
współczynnik 𝑅! w równaniu pomocniczym H1: reszty są heteroskedastyczne
powinien być niski.
𝑊 = 𝑇 ∗ 𝑅! ~ c!

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 3
Heteroskedastyczność

Chcąc przeprowadzić test White’a w modelu 𝑦! = 𝛽" + 𝛽# 𝑥#! + 𝛽$ 𝑥$! + 𝜀 korzystamy z


regresji pomocniczej:

W modelu pomocniczym kwadrat reszt z modelu podstawowego jest zmienną objaśnianą, natomiast
regresory z modelu podstawowego, ich kwadraty i interakcje są zmiennymi objaśniającymi.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 4
Heteroskedastyczność

Czy w modelu występuje problem heteroskedastyczności reszt?

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 4 - rozwiązanie
Heteroskedastyczność

Czy w modelu występuje problem heteroskedastyczności reszt?

Do sprawdzania Heteroskedastyczności używamy testu White’a:


H0: reszty są homoskedastyczne
H1: reszty są heteroskedastyczne

p-value < 0,05 zatem należy odrzucić hipotezę zerową na rzecz hipotezy alternatywnej, mówiącej o tym,
że reszty są heteroskedastyczne.
.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Test Goldfelda-Quandta

KROK 1 – podział próby KROK 2 – równość wariancji


Podziel próbę o liczebności N na dwie Przeprowadź test sprawdzający równość
podpróby (N=n1 + n2). wariancji w dwóch podpróbach.
Homoskedastyczny składnik losowy
Do podziału próby możesz wykorzystać implikuje jednorodność wariancji.
zmienne 0-1 (np. płeć) lub datę zmiany
strukturalnej (np. wejście do UE) H0: 𝜎# = 𝜎! - reszty homoskedastyczne
H1: 𝜎# ≠ 𝜎! - reszty heteroskedastyczne

Statystyka testowa – statystyka


F-Snedecora z n1-k, n2- k
stopniami swobody

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 5
Heteroskedastyczność

Oszacowaliśmy model, w którym zmienną objaśnianą są wydatki danej


osoby, zaś zmiennymi objaśniającymi jej dochód, wiek i płeć. Wyniki
otrzymane w przypadku analogicznych modeli przez innych badaczy
wskazują, iż wariancja składnika losowego jest różna w przypadku
kobiet i mężczyzn. Jakiego testu użyłabyś/użyłbyś do weryfikacji tej
hipotezy?

1. Testu White’a
2. Testu Breuscha-Pagana
3. Testu Goldfelda-Quandta
4. Testu t-Studenta

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
CZĘŚĆ 03

Twierdzenie Gaussa-
Markowa

Autokorelacja
Autokorelacja
Autokorelacja

Autokorelacja
Autokorelacja oznacza korelację pomiędzy kolejnymi obserwacjami tej samej zmiennej i wiąże się z niespełnieniem założenia
Var 𝜺 = 𝜎 ! I

Przyczyny Brak autokorelacji Autokorelacja składnika losowego

1) Problem pominiętych zmiennych


2) Niepoprawna postać funkcyjna modelu
3) Niewłaściwa dynamiczna struktura modelu
lub wysoka inercja zmiennej objaśnianej

Skutki
1) Estymator przestaje być najbardziej Autokorelacja – nielosowy układ reszt:

efektywny (nadal nieobciążony) • Długie serie reszt o tym samym znaku


2) Nieprawidłowe oceny błędów • Zmiana znaku w systematyczny sposób
standardowych i w konsekwencji • Inny, stały wzorzec
niewiarygodne testy t-studenta
istotności zmiennych
WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Metody postępowania
Zmiana specyfikacji modelu
Autokorelacja
• Wprowadzenie opóźnionej zmiennej objaśnianej
• Wprowadzenie opóźnienia regresorów
• Dodanie zmiennej czasowej / zmiennych sezonowych
• Zmiana rzędu opóźnienia zmiennej objaśnianej

HAC – błędy szacunku odporne na Zdefiniowana, symetryczna macierz


heteroskedastyczność i autokorelacje

AUTOKORELACJA Zmiana metody estymacji - UMNK


Pozbywamy się problemu niepoprawnych METODY POSTĘPOWANIA

błędów szacunku. Estymator UMNK

Pozostawienie
modelu WIELKA
POWTÓRKA PIGUŁKA
bez zmian.
Z EKONOMETRII
Testy autokorelacji
Autokorelacja

Test Durbina-Watsona Test mnożników Lagrange’a


• 𝐻" : Brak autokorelacji reszt • 𝐻" : Brak autokorelacji reszt
• 𝐻# : Występuje autokorelacja reszt • 𝐻# : Występuje autokorelacja reszt
Założenia: rozkład reszt jest normalny,
model zawiera wyraz wolny, brak 1) Estymacja modelu i obliczenie reszt
opóźnionej zmiennej Y w równaniu modelu,
tylko autokorelacja 1. rzędu 2) Estymacja parametrów regresji pomocniczej

3) Obliczenie statystyki

UWAGA! Test LM jest testem asymptotycznym,


Sprawdzamy, w którym z małe próby mogą zniekształcić wnioskowanie
przedziałów leży
statystyka d

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 1
Autokorelacja

Występowanie autokorelacji składnika


losowego

1. powoduje brak normalności reszt.


2. zawsze wymaga zastosowania testu
Durbina-Watsona.
3. sprawia, że oszacowania parametrów
modelu są obciążone.
4. sprawia, że estymator MNK traci na
efektywności.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 2
Autokorelacja

Czy w modelu występuje problem autokorelacji?

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 2 - rozwiązanie
Autokorelacja

Czy w modelu występuje problem autokorelacji?

Do sprawdzania autokorelacji używamy testu LM:


• 𝐻# : Brak autokorelacji reszt
• 𝐻$ : Występuje autokorelacja reszt

p- value < 0,05 zatem należy odrzucić hipotezę zerową na rzecz hipotezy alternatywnej, mówiącej o tym,
że występuje autokorelacja reszt.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 3
Autokorelacja

W przypadku występowania autokorelacji


reszt w modelu możemy:

1. Zastosować odporne błędy standardowe


2. Zmienić specyfikację modelu
3. Pozostawić model bez zmian
4. Wszystkie odpowiedzi są prawidłowe

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 4
Autokorelacja

W pewnej cukierni oszacowano model sprzedaży kremówek w czasie o następującej


specyfikacji: 𝐾% = 𝛽" + 𝛽# 𝐾%&# + 𝛽$ 𝑀% + 𝜀% ,
gdzie: K(t) – sprzedaż kremówek w okresie t, natomiast M(t) – liczba maturzystów w
okresie t. Wiadomo, że T=12 (liczba obserwacji), a w teście Durbina-Watsona
otrzymano wynik d=2,137. Co można na tej podstawie powiedzieć o autokorelacji
składnika losowego w tym modelu?

1. Nie występuje autokorelacja


2. Występuje autokorelacja dodatnia
3. Występuje autokorelacja ujemna
4. Nic

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 5
Autokorelacja

W teście LM na autokorelację pierwszego rzędu składnika losowego uzyskano


wartość p=0,0269. Należy wnioskować, że:

1.Przy poziomie istotności 0,01 autokorelacja występuje, ale przy poziomie istotności 0,05
nie występuje.
2.Przy poziomie istotności 0,05 autokorelacja występuje, ale przy poziomie istotności 0,01
nie występuje
3.Autokorelacja występuje przy poziomie istotności 0,01 i 0,05.
4.Autokorelacja nie występuje ani przy poziomie istotności 0,01, ani przy 0,05.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Kurtoza
Autokorelacja

https://statystykawpsychologii.blogspot.com/2014/05/kurtoza-w-sosie-wasnym_0.html
WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 6
Autokorelacja

Długie serie reszt dodatnich i ujemnych wskazują na:

1. Heteroskedastyczność składnika losowego


2. Ujemną autokorelację składnika losowego
3. Dodatnią autokorelację składnika losowego
4. Leptokurtyczny rozkład składnika losowego

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 7
Autokorelacja

Częste występowanie dużych co do wartości bezwzględnej („odstających”) reszt


wskazuje na:

1. Heteroskedastyczność składnika losowego


2. Ujemną autokorelację składnika losowego
3. Dodatnią autokorelację składnika losowego
4. Platykurtyczny rozkład składnika losowego

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
CZĘŚĆ 04
Twierdzenie Gaussa-
Markowa

Współliniowość
Współliniowość

Może wystąpić, gdy zmienne objaśniające są ze sobą silnie


skorelowane. Wyróżniamy:

Przybliżoną współliniowość Dokładną współliniowość


Może utrudniać interpretację Uniemożliwia oszacowanie
parametrów modelu estymatorów metodą KMNK

Do pomiaru współliniowości można wykorzystać


czynnik inflacji wariancji (CIW albo VIF – variance
inflation factor)
Wsp. determinacji z regresji, w której
Umownie uznaje się, że przybliżona współliniowość 𝑥' jest zmienną objaśnianą przez
stanowi problem jeżeli CIW > 10 pozostałe K-1 zmienne objaśniające
WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 1
Współliniowość

Na problem przybliżonej współliniowości może wskazywać:

1. Silna istotność zmiennych objaśniających połączona z dodatnią autokorelacją.

2. Silna istotność zmiennych objaśniających połączona z dużym stopniem


dopasowaniem modelu do danych.

3. Brak istotności zmiennych objaśniających połączona z dużym stopniem


dopasowania modelu do danych.

4. Brak istotności zmiennych objaśniających połączony z dodatnią autokorelacją


składnika losowego.

Wysoki R^2 i jednocześnie nieistotne zmienne objaśniające są


typowym „objawem” problemu przybliżonej współliniowości

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 2
Współliniowość

Co najmniej jaki stopień wyjaśniania wariancji jednego z regresorów w modelu


przez pozostałe wskazuje na problem przybliżonej współliniowości, jeżeli
uznamy CIW=10 za wartość graniczną?

1. 99%
2. 10%
3. 95%
4. 90%

Wystarczy skorzystać ze wzoru na CIW:

Podstawiając CIW=10 otrzymujemy R^2=90%

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
CZĘŚĆ 05

Twierdzenie Gaussa-
Markowa

Endogeniczność
Endogeniczność
Endogeniczność

Endogeniczność
Zmienna objaśniająca jest endogeniczna, gdy jest skorelowana ze składnikiem losowym modelu.
Niespełniony jest warunek o ścisłej egzogeniczności z założeń KMNK: 𝐸 𝜺 = 0 𝑜𝑟𝑎𝑧 𝐸 𝑿𝜀 = 0

Przyczyny Skutki

1) Problem pominiętych zmiennych 1) Niezgodność estymatora KMNK


2) Współprzyczynowość – sprzężenie 2) Obciążoność estymatora KMNK
zwrotne między zmiennymi x oraz y
3) Przyjęcie błędnej zmiennej przybliżającej
daną zmienną (błąd pomiaru)
4) Autokorelacja składnika losowego w
modelach autoregresyjnych

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 1
Endogeniczność

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zmienne instrumentalne
Endogeniczność

Aby poradzić sobie z endogenicznością, tworzymy zbiór dodatkowych zmiennych, które spełniają dwa warunki –
warunek skorelowania oraz warunek egzogeniczności.

Warunek
skorelowania + Warunek
egzogeniczności Dobry instrument

Instrument powinien być silnie Instrument powinien być


skorelowany z endogenicznym nieskorelowany ze składnikiem
regresorem, którego on zastepuje. losowym.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zależności między zmiennymi - intuicja
Endogeniczność

Estymator MNK jest zgodny i nieobciążony.

Estymator MNK nie jest zgodny (korelacja między regresorem


i składnikiem losowym).

Estymator IV jest zgodny.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Podwójna metoda najmniejszych kwadratów
Endogeniczność

Możemy ją zastosować, gdy mamy więcej lub tyle samo instrumentów co regresorów.

Zgodne i
nieobciążone
KROK 1 KROK 2 KROK 3
oszacowania
parametrów

!,
Przeprowadź regresję MNK y na 𝑿
Oszacuj metodą MNK parametry !
Oblicz wartości teoretyczne 𝑿 aby uzyskać wartości oszacowań
modelu, w którym każdy regresor
jest objaśniany przez wszystkie parametrów β.
instrumenty

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 2
Endogeniczność

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Testy związane z endogenicznością regresorów
Endogeniczność

Warunek skorelowania
Warunek egzogeniczności • W przypadku gdy mamy do czynienia
• Test Sargana (test restrykcji nałożonych z modelem, w którym jest tylko jeden
na nadmierne warunki identyfikujące) ENDOGENICZNY REGRESOR:
• 𝐻" : Wszystkie instrumenty są 1) Szacujemy model z pierwszego kroku
egzogeniczne. 2MNK (szacujemy metodą MNK
• 𝐻# : Co najmniej jeden z instrumentów parametry modelu, w którym dany
jest skorelowany ze składnikiem losowym regresor jest objaśniany przez
modelu, czyli jest endogeniczny. wszystkie instrumenty)
2) Obliczamy wartość statystyki F dla
testu łącznej istotności całego modelu.
3) Jeśli F>10 => brak dowodów na to, że
instrumenty są słabe.

Endogeniczność regresora
• Intuicja: estymator MNK jest bardziej efektywny niż
estymator MZI, dlatego wolimy uniknąć stosowania
MZI, jeśli nie jest to konieczne.
• Test Hausmana:
• a) 𝐻" : cov(x, 𝜀) = 0 – regresor egzogeniczny WIELKA
POWTÓRKA PIGUŁKA
• b) 𝐻# : co𝑣(x, 𝜀) ≠ 0 – regresor endogeniczny
Z EKONOMETRII
Zadanie 3
Endogeniczność

Ze względu na endogeniczność regresora, zaproponowano trzy instrumenty:

a) który z instrumentów spełnia warunki egzogeniczności, a który skorelowania?


b) który instrument jest najlepszy?

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 3 - rozwiązanie
Endogeniczność

Dobre instrumenty są
a) egzogeniczne, czyli nieskorelowane ze składnikiem losowym,
b) silnie skorelowane z endogenicznymi regresorami.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 4
Endogeniczność

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 4
Endogeniczność

Przeprowadzamy test Hausmanna (na endogeniczność regresora)

Na poziomie istotności p = 0.05 <0.07 brak jest podstaw do odrzucenia hipotezy zerowej postulującej
zgodność estymatora MNK (regresory są egzogeniczne).

Odp: Zastosowanie metody IV w tym modelu nie było konieczne – już MNK zapewniała zgodność
estymatorów.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Informacje kontaktowe

Facebook: SKN Ekonometrii

YouTube: SKN Ekonometrii SGH

Mail: skn.ekonometrii.sgh@gmail.com

Dziękujemy za uwagę!
Zapraszamy do śledzenia
informacji o kolejnych
wydarzeniach J

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
PIGUŁKA 2:
WIELKA Twierdzenie Gaussa-Markowa

POWTÓRKA PIGUŁKA środa 19.05.


godz. 19:00
Z EKONOMETRII

PIGUŁKA 3:
PIGUŁKA 1: Szeregi czasowe
Weryfikacja modelu czwartek 20.05.
wtorek 18.05. godz. 19:00
godz. 19:00
PIGUŁKA 3.
Weryfikacja modelu
20 maja 2021

Jan Zajko
Konrad Bochniarz
Paulina Krogulec

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Plan warsztatu
Stacjonarność

Kointegracja

Prognozowanie
PART 01
Szeregi czasowe

Stacjonarność
Stacjonarność
Co to jest?

40
%
Szeregiem stacjonarnym nazywamy szereg,
którego podstawowe własności są stałe w
60% 𝜇 = 𝐸 𝑋!
czasie. Te podstawowe własności to wartość 𝜎 " = 𝑉𝑎𝑟 𝑋! = 𝐸 𝑋! − 𝜇 "

oczekiwana i wariancja wartości obserwacji. 𝛾# = E 𝑋! − 𝜇 𝑋!$# − 𝜇


Dodatkowo wartość kowariancji pomiędzy
obserwacjami z dwóch okresów zależy
jedynie od odległości między nimi – słaba
stacjonarność.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Stacjonarność
Problemy wynikające z niestacjonarności

Badanie szeregów czasowych Warto zauważyć, że wartości zmiennych

jest trudnym zadaniem. w szeregu stacjonarnym fluktuują wokół


średniej z próby.

Badanie stacjonarnych szeregów


czasowych jest znacznie łatwiejsze –
do modelowania możemy wykorzystać Większość szeregów czasowych jest

własności wynikające ze stacjonarności. niestacjonarna – ryzyko regresji pozornej.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Stacjonarność
Szereg stacjonarny vs Szereg niestacjonarny

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Stacjonarność
Stopień zintegrowania szeregu

40
%
Większość szeregów jest niestacjonarna.
Jednym ze sposobów na uniknięcie
60% Przykład jednokrotnego zróżnicowania:
∆𝑦! = 𝑦! − 𝑦!"#
negatywnego wpływu niestacjonarności jest ∆𝑦! - pierwsze przyrosty
zróżnicowanie szeregu – obliczenie
przyrostów.

Najczęściej spotyka się szeregi czasowe


zintegrowane w stopniu 0 (stacjonarne), 1 lub
2.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Stacjonarność
Stopień zintegrowania szeregu

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Stacjonarność Testowana jest hipoteza zerowa
Badanie stopnia zintegrowania szeregu – Test Dickeya-Fullera postulująca, że szereg jest
niestacjonarny, lecz zintegrowany w
stopniu co najmniej pierwszym (δ = 0)
wobec hipotezy alternatywnej
postulującej stacjonarność ( 𝛿 < 0)
Test ten opiera się na założeniu,
że 𝑦! = 𝜌𝑦!"# + 𝜀! . Testowane jest Pomimo faktu, że tworzona jest statystyka t-
czy 𝜌 jest statystycznie istotnie studenta, to rozkładu t-studenta nie można
mniejsze niż 1 wykorzystać do wnioskowania
statystycznego.

Aby uniknąć regresji pozornej,


szacowanie parametru 𝜌 opiera się na Gdy nie możemy odrzucić hipotezy zerowej,

badaniu przyrostów zmiennej 𝑦! : nie poprzestajemy na twierdzeniu, że

∆𝑦! = 𝜌 − 1 𝑦!"# + 𝜀! , 𝜌 − 1 = 𝛿 szereg jest niestacjonarny lecz


zintegrowany w stopniu pierwszym – test
Dickeya-Fullera przeprowadzamy dla
drugich przyrostów zmiennej

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Stacjonarność
Test ADF – Augumented Dickey-Fuller Test

40
%
W praktyce do testowania stacjonarności
używa się testu ADF – rozszerzonego testu
60% Równanie w teście ADF ma postać:
𝑦! = 𝛿𝑦!"# + 𝑦# ∆𝑦!"# + 𝑦$ ∆𝑦!"$ + ⋯ + 𝑦% ∆𝑦!"% + 𝜀!
Dickeya-Fullera. Jest on znacznie lepszy niż
klasyczny test Dickeya-Fullera: omijamy
negatywny wpływ autokorelacji składnika
losowego.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Regresja pozorna
Czym jest i do czego prowadzi?

Regresja pozorna występuje w


przypadku analiz wykonywanych Wyniki oszacowań uzyskane z analizy
na szeregach niestacjonarnych. niestacjonarnych szeregów czasowych są
niewiarygodne – np. statystyki testu t.

Polega ona na występowaniu


statystycznie istotnych oszacowań Reszty w przypadku regresji pozornej

pomiędzy danymi pozostającymi bez często cechuje wysoka autokorelacja.

żadnego związku

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Regresja pozorna
Stopień zintegrowania szeregu

Mamy dwa szeregi: 𝑦! oraz 𝑥! - oba niestacjonarne: regresja 𝑦! względem 𝑥!


- ryzyko regresji pozornej
WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
PART 02
Szeregi czasowe

Kointegracja
Kointegracja
Między szeregami 𝑦! oraz 𝑥! zachodzi relacja
Co to jest? kointegrująca jeśli:

1. Szeregi 𝑦! oraz 𝑥! są zintegrowane w


stopniu pierwszym
2. Reszty 𝑒! = 𝑦! − 𝛽& − 𝛽# 𝑥! są stacjonarne

40 Testowanie kointegracji:
%
W wyniku regresji pozornej, wykazywane są
związki pomiędzy szeregami, które nie mają
60% 1. Zbadanie stacjonarności szeregów – jeśli
szeregi są zintegrowane w stopniu
pierwszym – OK
żadnego logicznego uzasadnienia. Czasami 2. Szacowanie parametrów relacji
jednak relacja pomiędzy takimi szeregami jest pomiędzy szeregami. Następnie
stabilna – wtedy (przy spełnionych testujemy stacjonarność reszt z modelu
założeniach) mamy do czynienia z relacją
kointegrującą.
𝐻& : 𝑒! ~𝐼 1 wniosek: 𝑦! oraz 𝑥! nie są
skointegrowane

𝐻# : 𝑒! ~𝐼(0) wniosek: 𝑦! oraz 𝑥! są skointegrowane

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Model korekty błędem
Co to jest?

Parametr 𝛿 mierzy tempo powrotu do


długookresowej równowagi – składnik korekty
40 błędem. Jeżeli 𝛿 = −1 to odchylenia od
%
Jeśli 𝑦! oraz 𝑥! są skointegrowane, to w modelu:
𝑦! = 𝛽& + 𝛽# 𝑥! + 𝑒! występuje długookresowa
60% poziomu równowagi wygasają w ciągu jednego
okresu. Jeśli 𝛿 = 0 to korekta błędem jest
nieaktywna.
równowaga. Modelem, który pozwala na
uwzględnienie odchylenia od stanu równowagi
jest model korekty błędem. Odchylenie to jest
mierzone opóźnionymi resztami 𝑒!"# : Jeśli 𝛿 ∈ −1,0 to oblicza się okres
) ) połowicznego wygaśnięcia (half-life, hl)
∆𝑦! = 𝜇 + 𝛿𝑒!"# + = 𝑝' ∆𝑦!"' + = 𝛽' ∆𝑥!"' + 𝜀! odchylenia zmiennej objaśnianej 𝑦! od
'(# '(#
poziomu równowagi wzorem:
ln(0,5)
ℎ𝑙 =
ln(1 + 𝛿)

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 1
W teście Dickey-Fullera dla szeregu 𝑥! otrzymano wartość p=0,465, a w teście Dickey-Fullera dla pierwszych
przyrostów szeregu 𝑥! otrzymano wartość p=0,00012.

Pierwsze przyrosty szeregu 𝑥! są niestacjonarne

Szereg 𝑥! jest I(0)

Szereg 𝑥! jest I(1)

Szereg 𝑥! jest I(2)

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 1
W teście Dickey-Fullera dla szeregu 𝑥! otrzymano wartość p=0,465, a w teście Dickey-Fullera dla pierwszych
przyrostów szeregu 𝑥! otrzymano wartość p=0,00012.

Pierwsze przyrosty szeregu 𝑥! są niestacjonarne

Szereg 𝑥! jest I(0)

Szereg 𝒙𝒕 jest I(1)

Szereg 𝑥! jest I(2)

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 2.1
Przeprowadzono rozszerzony test Dickeya-Fullera dla zmiennej DD (Domestic Demand). Zinterpretuj wyniki tego
testu. Przyjmij poziom istotności 𝛼=0.05

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 2.1
Przeprowadzono rozszerzony test Dickeya-Fullera dla zmiennej DD (Domestic Demand). Zinterpretuj wyniki tego
testu. Przyjmij poziom istotności 𝛼=0.05

Test DF
𝐻E : szereg NIE jest stacjonarny
𝐻F : szereg jest stacjonarny

p=0.9744 > 0.05

zatem nie mamy podstaw do odrzucenia


hipotezy zerowej

Zmienna DD jest zmienną niestacjonarną,


zintegrowaną w stopniu co najmniej 1.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 2.2
Poniżej zamieszczone są wyniki testu ADF dla pierwszych przyrostów badanej zmiennej. Określ czy zmienna DD
jest zintegrowana w stopniu pierwszym. Przyjmij poziom istotności 𝛼=0.05

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 2.2
Poniżej zamieszczone są wyniki testu ADF dla pierwszych przyrostów badanej zmiennej. Określ czy zmienna DD
jest zintegrowana w stopniu pierwszym. Przyjmij poziom istotności 𝛼=0.05

p = 0.0001289 < 0.05

mamy podstawy do odrzucenia hipotezy


zerowej, zatem pierwsze przyrosty zmiennej
DD są stacjonarne.

Gdy zmienna jest niestacjonarna (2a), a jej


pierwsze przyrosty są stacjonarne (2b) to można
uznać, że zmienna DD jest zintegrowana w
stopniu pierwszym.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 3
Przeprowadzono test ADF dla zmiennej GBR_INF (Consumer Price Index w UK). Określ czy zmienna jest zmienną
trendostacjonarną? Przyjmij poziom istotności 𝛼=0.05

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 3
Przeprowadzono test ADF dla zmiennej GBR_INF (Consumer Price Index w UK). Określ czy zmienna jest zmienną
trendostacjonarną? Przyjmij poziom istotności 𝛼=0.05

W celu sprawdzenia trendostacjonarności


szeregu,
Korzystamy z trzeciego wariantu testu ADF (test
z wyrazem wolnym i trendem liniowym).

𝐻E : zmienna NIE jest trendostacjonarna


𝐻F : zmienna jest trendostacjonarna

p = 0.1104 > 0.05

Zatem nie mamy podstaw do odrzucenia


hipotezy zerowej.
Zmienna GBR_INF nie jest trendostacjonarna

. WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 5
Kiedy możemy mówić, że zmienne są skointegrowane

Gdy zmienne 𝑥! i 𝑦! nie są zintegrowane w stopniu pierwszym, a reszty są stacjonarne

Gdy zmienne 𝑥! i 𝑦! nie są zintegrowane w stopniu pierwszym, a reszty są niestacjonarne

Gdy zmienne 𝑥! i 𝑦! są zintegrowane w stopniu pierwszym, a reszty są niestacjonarne

Gdy zmienne 𝑥! i 𝑦! są zintegrowane w stopniu pierwszym, a reszty są stacjonarne

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 5
Kiedy możemy mówić, że zmienne są skointegrowane

Gdy zmienne 𝑥! i 𝑦! nie są zintegrowane w stopniu pierwszym, a reszty są stacjonarne

Gdy zmienne 𝑥! i 𝑦! nie są zintegrowane w stopniu pierwszym, a reszty są niestacjonarne

Gdy zmienne 𝑥! i 𝑦! są zintegrowane w stopniu pierwszym, a reszty są niestacjonarne

Gdy zmienne 𝒙𝒕 i 𝒚𝒕 są zintegrowane w stopniu pierwszym, a reszty są stacjonarne

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 6
Sprawdź czy występuje kointegracja pomiędzy logarytmem naturalnym CO2t i logarytmem naturalnym GDPt.

Między szeregami 𝑦/ oraz 𝑥/ zachodzi relacja kointegrująca jeśli:

1. Szeregi 𝑦/ oraz 𝑥/ są zintegrowane w stopniu pierwszym

2. Reszty 𝑒/ = 𝑦/ − 𝛽0 − 𝛽1𝑥/ są stacjonarne

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 6.1
Sprawdzamy czy szeregi są zintegrowane w stopniu pierwszym.

Test ADF dla ln 𝐶𝑂" : Test ADF dla pierwszych różnic ln 𝐶𝑂" :
Rozszerzony test Dickeya-Fullera dla procesu l_CO2 Rozszerzony test Dickeya-Fullera dla procesu d_l_CO2

testowano istotność opóźnienia od rzędu 1, dla kryterium AIC testowano istotność opóźnienia od rzędu 1, dla kryterium AIC

liczebność próby 53 liczebność próby 53

Hipoteza zerowa: występuje pierwiastek jednostkowy a = 1; proces I(1) Hipoteza zerowa: występuje pierwiastek jednostkowy a = 1; proces I(1)

test bez wyrazu wolnego (const) test bez wyrazu wolnego (const)

dla opóźnienia pierwszego rzędu procesu (1-L)l_CO2 dla opóźnienia rzędu 0 procesu (1-L)d_l_CO2
model: (1-L)y = (a-1)*y(-1) + ... + e model: (1-L)y = (a-1)*y(-1) + e

estymowana wartość (a-1) wynosi: 0,000444695 estymowana wartość (a-1) wynosi: -0,526368

Statystyka testu: tau_nc(1) = 1,67167 Statystyka testu: tau_nc(1) = -4,29328


asymptotyczna wartość p = 0,9775 wartość p 5,31e-005

Autokorelacja reszt rzędu pierwszego: 0,050 Autokorelacja reszt rzędu pierwszego: 0,028
p=0.9775> 0.05
p = 5,31e-005 < 0.05
• Zatem nie mamy podstaw do odrzucenia hipotezy zerowej mówiącej o,
że szereg jest niestacjonarny. • mamy podstawy do odrzucenia hipotezy zerowej, zatem pierwsze przyrosty
• Zmienna ln 𝐶𝑂$ jest zmienną niestacjonarną, zintegrowaną w stopniu co zmiennej ln 𝐶𝑂$ są stacjonarne.
najmniej 1.
WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 6.1
Sprawdzamy czy szeregi są zintegrowane w stopniu pierwszym.

Test ADF dla ln 𝐺𝐷𝑃 : Test ADF dla pierwszych różnic ln 𝐺𝐷𝑃 :
Rozszerzony test Dickeya-Fullera dla procesu l_GDP
Rozszerzony test Dickeya-Fullera dla procesu d_l_GDP
testowano istotność opóźnienia od rzędu 1, dla kryterium AIC
testowano istotność opóźnienia od rzędu 1, dla kryterium AIC
liczebność próby 57
liczebność próby 57
Hipoteza zerowa: występuje pierwiastek jednostkowy a = 1; proces I(1)
Hipoteza zerowa: występuje pierwiastek jednostkowy a = 1; proces I(1)

test bez wyrazu wolnego (const)


test bez wyrazu wolnego (const)
dla opóźnienia pierwszego rzędu procesu (1-L)l_GDP
dla opóźnienia rzędu 0 procesu (1-L)d_l_GDP
model: (1-L)y = (a-1)*y(-1) + ... + e
model: (1-L)y = (a-1)*y(-1) + e
estymowana wartość (a-1) wynosi: 0,000666749
estymowana wartość (a-1) wynosi: -0,209844
Statystyka testu: tau_nc(1) = 4,34016
Statystyka testu: tau_nc(1) = -2,54942
asymptotyczna wartość p = 1
wartość p 0,01163
Autokorelacja reszt rzędu pierwszego: 0,048
Autokorelacja reszt rzędu pierwszego: -0,135
p=1 > 0.05
p = 0,01163 < 0.05
• Zatem nie mamy podstaw do odrzucenia hipotezy zerowej mówiącej o,
że szereg jest niestacjonarny. • mamy podstawy do odrzucenia hipotezy zerowej, zatem pierwsze przyrosty
• Zmienna ln 𝐺𝐷𝑃 jest zmienną niestacjonarną, zintegrowaną w stopniu co zmiennej ln 𝐺𝐷𝑃 są stacjonarne.
najmniej 1.
WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 6.2
Szacuje reszty modelu log 𝐺𝐷𝑃 = 𝛽* + 𝛽+ log 𝐶𝑂" + 𝜀

Rozszerzony test Dickeya-Fullera dla procesu uhat3


testowano istotność opóźnienia od rzędu 1, dla kryterium AIC
liczebność próby 53
Hipoteza zerowa: występuje pierwiastek jednostkowy a = 1; proces I(1)

test bez wyrazu wolnego (const)


dla opóźnienia pierwszego rzędu procesu (1-L)uhat3
model: (1-L)y = (a-1)*y(-1) + ... + e
estymowana wartość (a-1) wynosi: -0,0453071
Statystyka testu: tau_nc(1) = -1,18339
asymptotyczna wartość p = 0,2169
Autokorelacja reszt rzędu pierwszego: 0,004

p=0.2169> 0.05

Zatem zmienne nie są skointegrowane

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 7
Kiedy przechodzimy z modelu ARIMA do modelu SARIMA?

Gdy proces generujący dane dla zmiennej objaśnianej jest zintegrowany w stopniu
większym niż 0

Gdy zmienne 𝑥! i 𝑦! nie są zintegrowane w stopniu pierwszym, a reszty są niestacjonarne

Gdy zmienne 𝑥! i 𝑦! są zintegrowane w stopniu pierwszym, a reszty są niestacjonarne

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
PART 03
Prognozowanie

Stabilność parametrów i prognozowanie


Weryfikacja stabilności parametrów – Test Chowa

Test Chowa

Pozwala na statystyczną identyfikację zmiany strukturalnej parametrów

Okres próbny dzielimy na dwa podokresy

Numer obserwacji rozdzielającej definiujemy jako punkt zwrotny

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Weryfikacja stabilności parametrów – Test Chowa

Test Chowa
Zestaw hipotez:

H0 : 𝛽# = 𝛽$ (brak załamania strukturalnego)


H1 : 𝛽# ≠ 𝛽$ (występuje załamanie strukturalne)

𝛽# , 𝛽$ – wektory parametrów modeli dla podokresów

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Weryfikacja stabilności parametrów – Test Chowa

Test Chowa
Statystyka testowa:

𝑺𝑺𝑬#𝑺𝑺𝑬𝟏#𝑺𝑺𝑬𝟐

𝐅= 𝑲'𝟏
𝑺𝑺𝑬𝟏'𝑺𝑺𝑬𝟐
𝒏#𝟐(𝒌'𝟏)
SSE – suma kwadratów reszt dla modelu wyjściowego
SSE1 – suma kwadratów reszt dla modelu na podstawie podokresu 1
SSE2 – suma kwadratów reszt dla modelu na podstawie podokresu 2
n – liczba obserwacji w modelu wyjściowym
k+1 – liczba szacowanych parametrów w każdym z modeli

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Weryfikacja stabilności parametrów – Test Chowa

Test Chowa
Statystyka F ma rozkład F-Snoedecora z r1 = k+1 oraz r2 = n-2(k+1) stopniami swobody

Jeśli wartość F większa od wartości krytycznej testu na określonym poziomie istotności, to hipotezę zerową o stabilności oszacowań modelu
odrzucamy

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Błąd ex ante

Wartość średniego błędu ex ante wyznacza się z równania

𝑆!" =𝑆# ∗ 1 + 𝑋 $ + (𝑋 $ 𝑋)%& 𝑥

x – wektor wartości zmiennych objaśniających w okresie prognozy


X – macierz obserwacji zmiennych objaśniających
S – estymator wariancji składnika losowego

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Prognoza przedziałowa

Przedział ufności przy rozkładzie normalnym składnika losowego:


P(YPt - taSPt < Yt < YtP + taSPt) = 1-a

Przedział ufności przy braku informacji o rozkładzie składnika losowego:


!
P(YP t- ωSP t< Yt < Yt +
P ωSP t) =1-
"0
ω – dowolna stała dodatnia

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Prognoza punktowa

Prognozę punktową wyznacza się ze wzoru:

YtP = xTtb
b – wektor oszacowanych parametrów
xTt – wierszowy wektor wartości zmiennych objaśniających w
okresie t

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Błędy ex post

%
1
𝑀𝐸 = *(𝑦! −𝑦!& ) − Ś𝑅𝐸𝐷𝑁𝐼 𝐵ŁĄ𝐷 𝑃𝑅𝐸𝐷𝑌𝐾𝐶𝐽𝐼
𝑛
!#$

%
1
𝑀𝐴𝐸 = * |𝑦! − 𝑦!& | − Ś𝑅𝐸𝐷𝑁𝐼 𝐵ŁĄ𝐷 𝐴𝐵𝑆𝑂𝐿𝑈𝑇𝑁𝑌
𝑛
!#$

%
1 (𝑦! −𝑦!& )
𝑀𝑃𝐴𝐸 = * − Ś𝑅𝐸𝐷𝑁𝐼 𝐴𝐵𝑆𝑂𝐿𝑈𝑇𝑁𝑌 𝐵ŁĄ𝐷 𝑃𝑅𝑂𝐶𝐸𝑁𝑇𝑂𝑊𝑌
𝑛 𝑦!
!#$

$
𝑀𝑆𝐸 = ∑%!#$(𝑦! −𝑦!& )' − 𝐵ŁĄ𝐷 Ś𝑅𝐸𝐷𝑁𝐼𝑂𝐾𝑊𝐴𝐷𝑅𝐴𝑇𝑂𝑊𝑌
%

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Błędy ex post

Współczynnik Theila

I2= Σmt=1(Yt-YtP)2/Σmt=1Yt2
Wartość I informuje jaki jest przeciętny względny błąd prognozy w rozpatrywanych m
okresach

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Kryteria informacyjne

AIC – kryterium informacyjne Akaike’a


BIC – kryterium bayesowskie Schwarza
HQC – kryterium informacyjne Hannana-Quinna

Kryteria informacyjne służą przede wszystkim do porównywania i selekcji


najlepszego modelu. Im niższe kryteria informacyjne, tym model jest
lepszy.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 4
Prognozowane wartości zmiennej zależnej wyniosły kolejno: 10, 9, 8, 7, podczas, gdy wartości empiryczne miały
odpowiednio wartości: 11, 12, 7, 6. Ile wynosi średni absolutny błąd predykcji i błąd średniokwadratowy?

I
1
𝑀𝐴𝐸 = 6 |𝑦! − 𝑦!J |
𝑛
!HF

11 − 10 + 12 − 9 + 7 − 8 + 6 − 7
𝑀𝐴𝐸 = = 1,5
4

I
1
𝑀𝑆𝐸 = 6(𝑦! −𝑦!J )"
𝑛
!HF

(11 − 10)" +(12 − 9)" +(7 − 8)" +(6 − 7)"


𝑀𝐴𝐸 = =3
4

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 5
Na podstawie wartości AIC i BIC wybierz model lepszy w parach modeli ze zmienną objaśnianą fml i
ln(fml).
Model 2: Estymacja KMNK, wykorzystane obserwacje 1960:01-1994:12 (N = 420) Model 3: Estymacja KMNK, wykorzystane obserwacje 1960:01-1994:12 (N = 420)
Zmienna zależna (Y): FM1 Zmienna zależna (Y): FM1

Współczynnik Błąd stand. t-Studenta wartość p


Współczynnik Błąd stand. t-Studenta wartość p
const 180,536 3,89468 46,35 <0,0001 ***
const −38,9650 9,89520 −3,938 <0,0001 ***
sq_time 0,00741299 9,82704e-05 75,43 <0,0001 ***
time 2,24630 0,0407344 55,15 <0,0001 ***
time −0,874568 0,0427223 −20,47 <0,0001 ***
Średn.aryt.zm.zależnej 433,8817 Odch.stand.zm.zależnej 290,8108 Średn.aryt.zm.zależnej 433,8817 Odch.stand.zm.zależnej 290,8108
Suma kwadratów reszt 4282158 Błąd standardowy reszt 101,2146 Suma kwadratów reszt 292377,1 Błąd standardowy reszt 26,47913
Wsp. determ. R-kwadrat 0,879155 Skorygowany R-kwadrat 0,878866 Wsp. determ. R-kwadrat 0,991749 Skorygowany R-kwadrat 0,991709
F(1, 418) 3040,985 Wartość p dla testu F 6,4e-194 F(2, 417) 25061,07 Wartość p dla testu F 0,000000
Logarytm wiarygodności −2534,194 Kryt. inform. Akaike'a 5072,388 Logarytm wiarygodności −1970,519 Kryt. inform. Akaike'a 3947,037
Kryt. bayes. Schwarza 5080,468 Kryt. Hannana-Quinna 5075,582 Kryt. bayes. Schwarza 3959,158 Kryt. Hannana-Quinna 3951,828
Autokorel.reszt - rho1 0,999470 Stat. Durbina-Watsona 0,001062 Autokorel.reszt - rho1 0,993229 Stat. Durbina-Watsona 0,011162

Model 5: Estymacja KMNK, wykorzystane obserwacje 1960:01-1994:12 (N = 420)


Zmienna zależna (Y): l_FM1

Współczynnik Błąd stand. t-Studenta wartość p


const 4,72576 0,00715707 660,3 <0,0001 ***
time 0,00537262 2,94626e-05 182,4 <0,0001 ***

Średn.aryt.zm.zależnej 5,856697 Odch.stand.zm.zależnej 0,656257


Suma kwadratów reszt 2,240184 Błąd standardowy reszt 0,073207
Wsp. determ. R-kwadrat 0,987586 Skorygowany R-kwadrat 0,987556
F(1, 418) 33252,88 Wartość p dla testu F 0,000000
Logarytm wiarygodności 503,1222 Kryt. inform. Akaike'a −1002,244
Kryt. bayes. Schwarza −994,1638 Kryt. Hannana-Quinna −999,0505
Autokorel.reszt - rho1 0,988914 Stat. Durbina-Watsona 0,004284

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 5

Na podstawie wartości AIC i BIC wybierz model lepszy w parach modeli ze


zmienną objaśnianą fml i ln(fml).

• Jako że spośród pary modeli nr 2 i nr 3 o zmiennej objaśniającej fml model po


prawej stronie posiada mniejsze wartości kryteriów informacyjnych
definiujemy go jako lepszy.

• W parze modeli nr 4 i nr 5 kryteria są niższe w przypadku modelu nr 5.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 6
Tworzymy model dla okresu 2001 – 2007. Chcemy sprawdzić, czy w czerwcu 2004 nie wystąpiło
załamanie strukturalne. Dostajemy taki wynik testu Chowa:

Test Chowa przy podziale próby w obserwacji 2004:06 -


Statystyka testu: F(7, 53) = 11,0395
z wartością p = P(F(7, 53) > 11,0395) = 1,64127e-008

Czy wystąpiło załamanie strukturalne w czerwcu 2004 roku?

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Zadanie 6
Tworzymy model dla okresu 2001 – 2007. Chcemy sprawdzić, czy w czerwcu 2004 nie wystąpiło załamnie
strukturalne. Dostajemy taki wynik testu Chowa:

Zauważamy, że p value jest mniejsze od poziomu istotności


p=0,05. W związku z tym odrzucamy H0: brak załamania
strukturalnego na rzecz hipotezy alternatywnej H1: występuje
załamanie strukturalne.

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII
Informacje kontaktowe

Facebook: SKN Ekonometrii

YouTube: SKN Ekonometrii SGH

Mail: skn.ekonometrii.sgh@gmail.com

Dziękujemy za uwagę!
Zapraszamy do śledzenia
informacji o kolejnych
wydarzeniach J

WIELKA
POWTÓRKA PIGUŁKA
Z EKONOMETRII

You might also like