You are on page 1of 12

 Kategória/nominális változók:

 Diszkrét változó: minden olyan adat, amely nem vehet fel folytonos, végtelen sok
értéket
 Minőségi változók a regresszióban -> a regressziós elemzés csak számadatokon
végezhető  ebben az esetben kódolásra van szükség

 Dummy kódolás:
 A kategória változókat úgy kódolhatjuk, hogy azok 0 és 1 értékeket vegyenek fel
 Annyi oszlopa lesz az adatmátrixnak, ahány ismérvváltozat az eredeti változóban volt
 N darab ismérvváltozat esetén az N-edik oszlop redundáns (új információt nem
tartalmaz), a kódolás N-1 oszloppal kivitelezhető

 Adatmátrix oszloprangja: az OLS módszer egyik fő lépése a mátrix invertálása, ez csak


teljes oszloprang mellett történhet meg, azaz, ha a változók nem írhatók fel egymás
lineáris kombinációjaként
 A dummy kódolás sosem szerepelhet egyszerre az összes kategória modellben,
referenciát kell meghatároznunk vagy kihagynunk a konstanst

 A konstans tagot akkor és csak akkor érdemes elhagyni, ha az a modell tartalmából


adódóan elméleti követelmény
 Az R négyzet mutató felbontása csak akkor működik, ha van konstans a modellben
 Ha elhagyjuk, ebben az esetben negatív értéket is vehet fel az R2, és korábbi
jelentését elveszti
 Kontraszt kódolás:
 a redundancia problémájára megoldás
 a dummy-k együtthatója nem a referencia-csoporthoz, hanem az átlaghoz képesti
eltérést jelenti

 Interakció a regresszióban:
 sokszor az adott csoportba tartozás valamelyik magyarázó változó hatását
befolyásolja ->> ez interakciós tagok bevonása által szerepeltethető a modellben

 Parciális derivált:
 Marginális hatás: a magyarázó változó kis növelésének hatására mekkora az
eredményváltozó egységnyi magyarázó változó-növelésre jutó változása
 Tipikus egyszerűsítés: a magyarázó változó egységnyi növelésének hatására mennyit
változik az eredményváltozó
 Komplexebb modellek esetén a precíz affiníció szerint határozzuk meg

 Kvadratikus tag:
 a változónkénti linearitás feloldása
 Parciális derivált – X marginális hatása
 A logaritmus-transzformációk négy típusa:

 Lineáris, lineáris-log, log-lineáris, log-log


 a nemlineáris kapcsolatok kezelésén felül a transzformációk azért is kedvezőbbek
lehetnek, mert az eredeti változók erősen ferde eloszlásait közelebb képesek hozni a
normálishoz
 Cobb-Douglas termelési függvény:
 kezelhető log-log modellként, ahol alfa és béta becsülendő paraméterek
 maradékelv alapják kiszámítható a TFP is
 Nincs egzakt multikollinearitás: az adatmátrix teljes oszloprangú, a változók nem írhatók fel
egymás lineáris kombinációjaként
 Multikollinearitás:
 magyarázó változók kapcsolatban vannak egymással
 standard hibák nőnek -> túl nagy p-érték -> nem szignifikáns változók
 strukturális: modellépítés okozza, interakció, kvadratikus tag beépítése
 adatok jellegéből adódó: természetes módon korrelálnak az adatok, pl. kor és
munkával eltöltött évek száma
 változók közötti összefüggés, azaz multikollinearitás mérése:

You might also like