Professional Documents
Culture Documents
.
© Marek Gruszczyński, Szkoła Główna Handlowa w Warszawie 1
Wprowadzenie do mikroekonometrii
James Heckman
and Daniel McFadden
Mikroekonometria
„At its heart economic theory is about individuals (or families or firms) and their in-
teractions in markets and other social settings1.(...) The field of microeconometrics
emerged in the past forty years to aid economists in providing more accurate de-
scriptions of the economy, in designing and evaluating public policies, and in testing
economic theories and estimating the parameters of well posed economic models. It
is a scientific field within economics that links the theory of individual behaviour to
individual data, where individuals may be firms, persons or households.”
1
Słowa „(or families or firms)” zostały usunięte z tekstu przemówienia noblowskiego Jamesa Heckmana w późniejszych jego wydaniach.
Mikrodane (1)
− dane liczbowe o pojedynczych jednostkach (klienci banku, rodziny, firmy)
− zawierają informacje obiektywne lub subiektywne
− często zbierane są za pomocą specjalnie przygotowanych ankiet
− mogą być produktem ubocznym innych działalności, np. utrzymywania i zarzą-
dzania danymi z urzędów skarbowych, bądź z NFZ, czy też z ZUS,
− mogą stanowić próby ze zbiorów rozmaitych transakcji, takich jak zbiory danych
ze skanerów w supermarketach, zbiory danych o zachowaniu się klientów operatora
telefonii komórkowej itp.
− to są zbiory o dużej liczebności (setki, tysiące obserwacji)
− to na ogół dane przekrojowe
Mikrodane (2)
− To dane obserwacyjne
Dane obserwacyjne pochodzą z badań ankietowych bądź z dostępnych baz danych
administracyjnych. Ich przeciwieństwem są „dane eksperymentalne” pochodzące z od-
powiednich (zrandomizowanych) eksperymentów. Dane obserwacyjne mogą być obar-
czone błędem selekcji próby.
− Często są to dane o zmiennych mierzonych na skali nieciągłej, to jest zmiennych
jakościowych
A.C. Cameron, P.K. Trivedi (2010) „Microeconometrics Using Stata” 2nd ed.
Support materials for Microeconometrics Using Stata, Revised Edition | Stata Press (stata-press.com)
Modele mikroekonometrii
(a) Regresja liniowa (c) Modele dwumianowe
liniowy model prawdopodobieństwa (LMP)
model logitowy/ probitowy
model komplementarny log-log model
(b1) Modele zmiennych ograniczonych (d) Modele wielomianowe kategorii nieupo-
regresja ucięta rządkowanych
model tobitowy wielomianowy model logitowy i probitowy
dwugranicznymodel tobitowy warunkowy model logitowy (McFaddena)
model selekcji próby (Heckmana) zagnieżdżony model logitowy
mieszany model logitowy
(b2) Modele licznikowe (e) Modele wielomianowe kategorii uporząd-
regresja Poissonowska kowanych
model rozkładu ujemnego dwumianowego uporządkowany model logitowy i probitowy
uogólniony model uporządkowany
modele danych sekwencyjnych
(b3) Modele czasu trwania (f) Modele efektów oddziaływania i inne me-
tody quasi-eksperymentalne
(2) Czy zgadzasz się ze zdaniem: każda mama powinna zrezygnować z pracy i wy-
chowywać swoje dziecko.
Możliwe odpowiedzi:
Y=1 bardzo się nie zgadzam, Y=2 nie zgadzam się, Y=3 nie mam zdania,
Y=4 zgadzam się, Y=5 bardzo zgadzam się z tym zdaniem
Y* = skłonność do wyrażania zgody na to zdanie (zmienna ciągła)
Tutaj nadal mamy zmienną ciągłą Y*, ale więcej punktów na osi Y*, które nas interesu-
ją. Oznaczmy je jako 1, 2, 3, 4 (każdy większy od poprzedniego):
Y=1 dla Y*<1, Y=2 dla 1Y*<2, Y=3 dla 2Y*<3,
Y=4 dla 3Y*<4, Y=5 dla 4Y*
Wniosek: stosujemy model wielomianowy kategorii uporządkowanych.
Co modelujemy?
Prawdopodobieństwa p1, p2, p3, p4, p5 dla (odpowiednio) Y=1, 2, 3, 4 i 5
(5) Ile kosztował samochód, który Twoja rodzina kupiła w zeszłym roku?
Możliwe odpowiedzi:
Y=0 lub Y>0.
Y to zmienna o wartościach ciągłych nieujemnych z dużą liczbą zer. Z punktu widzenia
ekonomii te dwie informacje (Y=0 lub Y>0) mówią o tym, czy rodzina wybrała roz-
wiązanie brzegowe (corner solution) czy też rozwiązanie wewnętrzne (interior) zada-
nia maksymalizacji użyteczności gospodarstwa domowego.
Wniosek: powinniśmy zastosować model tobitowy (model rozwiązań brzegowych).
Co modelujemy?
Zmienną Y o warunkowym rozkładzie dyskretno-ciągłym, który jest mieszaniną roz-
kładu ciągłego (wartości Y>0) oraz rozkładu jednopunktowego (Y=0).
• (A) Podejście tradycyjne: podstawą jest zaufanie do teorii ekonomicznej i jej po-
stulowanych modeli. Badanie empiryczne powinno opierać się na modelu teore-
tycznym. Jednak: teoria ekonomii często nie podpowiada konkretnych postaci
modeli.
• (B) Podejście aplikacyjne: punktem wyjścia są dane: podstawą modelowania
powinno być wykorzystanie danych do lepszego zrozumienia interesującego nas
zjawiska. Modele to jedynie konstrukcje, które mogą się zmieniać w świetle in-
formacji, jakie niosą dane. Włączenie do modelu charakterystyk tych danych mo-
że prowadzić do lepszego zrozumienia opisywanego procesu ekonomicznego.
• Mikroekonometria a data-mining
Podobieństwa (B) i różnice (A).
Differences-in-differences
Ważny komentarz:
“Empirical evidence on any given causal effect is always local, derived from a particu-
lar time, place, and research design.”
Angrist, J. D., & Pischke, J. S. (2010). The Credibility Revolution in Empirical Economics: How Better Research De-
sign Is Taking the Con out of Econometrics. Journal of Economic Perspectives, 24 (2), 3-30
Endogeniczność: przykład
Baum (2008)
Endogeniczność: przykład
▪ Może być tak (i zwykle jest), że większe firmy wymagają zdolniejszych menedże-
rów, to znaczy istnieje zmienna „umiejętności menedżerskie”, która nie jest mie-
rzalna i nie występuje w modelu, jest reprezentowana przez składnik losowy (u).
▪ Zmienna X jest, być może, skorelowana ze zmienną opisującą umiejętności mene-
dżerskie (bo przecież: im większa firma tym te zdolności są/mogą/powinny być
wyższe). Mamy zatem klasyczną sytuację endogeniczności.
▪ ▪
Baum (2008)
▪ Jeszcze raz: Y jest objaśniana przez X, natomiast X jest objaśniana przez inną
zmienną – także służącą objaśnianiu Y. W modelu typu regresyjnego zmienne obja-
śniające (X) powinny być egzogeniczne. To gwarantuje zgodność i nieobciążoność
estymatorów parametrów stojących przy tych zmiennych.
▪ Rozwiązanie: (1) użycie zmiennych instrumentalnych, estymatory differences-in-
differences, a także regression discontinuity design, (2) wykorzystanie informacji o
endogeniczności w samym modelowaniu: użycie danych panelowych, metod dopa-
sowania (matching) oraz pomiaru, (3) quasi-naturalny eksperyment.
▪ Następny wykres (Panhans i Singleton 2015), pokazuje bibliometryczny wzrost tych
nowych tematów metodycznych w wiodących czasopismach.
Uses of Quasi-experimental Terms in Top Economics Field Journals (Panhans and Singleton 2015). Terms include
difference-in-differences, regression discontinuity, natural experiment, and randomized control trial. Data are drawn
from Web of Science.
Endogeniczność: rozwiązania?
Heterogeniczność
Próba losowa (simple random sample): każdy element populacji ma jednakowe praw-
dopodobieństwo dostania się do próby; indywidualne jednostki badania są wybierane
do próby bezpośrednio; przy dużych populacjach losowanie to nie jest wygodne; nie
jest także prawdą, że takie losowanie jest najlepsze z uwagi na dokładność otrzymy-
wanych wyników. Prosta próba losowa nie bierze pod uwagę cech jednostki loso-
wania, a te właśnie mogą stanowić podstawę dobrego doboru próby.
Próba celowa