You are on page 1of 32

Variables exògenes qualitatives

Econometria Economia
Curs 2020-2021
Facultat de Ciències Econòmiques i Empresarials
Universitat de Girona
Tipus de models

Models ANOVA .
Variable qualitativa dicotòmica

Models ANCOVA.
Variable qualitativa dicotòmica i una variable quantitativa
Variable qualitativa politòmica i una variable quantitativa
Diverses variables qualitatives i una variable quantitativa
Interacció entre dues variables qualitatives
Interacció entre una variable qualitativa i una de quantitativa
Interacció i efecte principal

Aplicacions
Efectes estacionals (series temporals)
Canvis estructurals
Variables dicotòmiques
ü Indicaran generalment absència o presència d’un determinat atribut:
- home/dona
- ric/pobre
- sa/malalt

ü Quantifiquem l’atribut introduint variables artificials amb valors 0,1.

0= indica l’absència de l’atribut


1= indica presència de l’atribut

ü Aquestes variables s’anomenen dicotòmiques o dummy


Models ANOVA

Yi=b1+b2Di+ui (1) Yi= sou


Di=0 si és home (categoria de referència)
Di=1 si és dona

Suposant b1>0 i b2>0 :

b1 + b 2 Dones

b1 Homes

Com que no hi ha cap variable numèrica, no tenim pendent, només


ordenada en l’origen o terme independent que és diferent segons el
sexe.
Models ANOVA

Suposant que el terme de pertorbació compleix els supòsits habituals


del MRL, podem veure si el sexe està relacionat amb el sou:

E[ Yi | Di=0] = b1 (sou esperat homes)


E[ Yi | Di=1] = b1+b2 (sou esperat dones)

b2 indica quin és l’efecte diferencial sobre el valor esperat de la


variable dependent quan l’individu té la característica identificada amb
el valor 1 de la variable fictícia respecte a l’individu que té la
característica identificada amb el valor 0, és a dir, b2 és la diferència
en el sou esperat entre homes i dones
Models ANOVA

ü Podem plantejar si el sou és o no diferent segons el sexe:

H0: b2=0

Si RH0, direm que el sexe està relacionat amb el sou.

ü Si hem usat la variable D i b2>0, direm que les dones, en termes


esperats, guanyaran més que els homes.

ü Si hem usat la variable D i b2<0, direm que les dones, en termes


esperats, guanyaran menys que els homes.

ü Tota la resta (estimació, residus, valors influents,...) es manté igual


suposant que es compleixin els supòsits
Models ANOVA

Observació Despesa Renda Sexe

1 1983 11557 1

2 2987 29387 1

3 2993 31463 1

4 3156 29554 1

5 2706 25137 1

6 2217 14952 1

7 2230 11589 0

8 3757 33328 0

9 3821 36151 0

10 3291 35448 0

11 3429 32988 0

12 2533 20437 0
Models ANOVA

> model1<-lm(despesa~sexe)
> summary(model1)

Call:
lm(formula = despesa ~ sexe)

Residuals:
Min 1Q Median 3Q Max
-946.8 -503.5 183.2 360.1 644.2

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3176.8 233.0 13.632 8.73e-08 ***
sexeD -503.2 329.6 -1.527 0.158
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 570.8 on 10 degrees of freedom


Multiple R-squared: 0.189, Adjusted R-squared: 0.1079
F-statistic: 2.331 on 1 and 10 DF, p-value: 0.1578

Resultats regressió amb categoria


de referència els homes.
Models ANOVA

> model<-lm(despesa~sexe)
> summary(model)

Call:
lm(formula = despesa ~ sexe)

Residuals:
Min 1Q Median 3Q Max
-946.8 -503.5 183.2 360.1 644.2

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2673.7 233.0 11.473 4.45e-07 ***
sexeH 503.2 329.6 1.527 0.158
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 570.8 on 10 degrees of freedom


Multiple R-squared: 0.189, Adjusted R-squared: 0.1079
F-statistic: 2.331 on 1 and 10 DF, p-value: 0.1578

Resultats regressió amb categoria


de referència les dones.
Nota: Nombre de categories. Per què no assignem una
variable dicotòmica per a cada categoria?

ü Norma general: si tenim una variable politòmica amb m categories, cal


introduir m-1 variables dicotòmiques
Models ANCOVA

Regressió amb dummy i quantitativa.

Yi=b1+b2X2i+b3Di +ui
Yi= despesa
X2i=sou
Di=0 si és home (categoria de referència)
Di=1 si és dona

En el cas dels homes (quan Di=0):

E[ Yi | Di=0] = b1+ b2X2

En el cas de les dones (quan Di=1):

E[ Yi | Di=1] = b1+ b2X2+ b3=(b1+ b3)+ b2X2


Models ANCOVA

Regressió amb dummy i quantitativa.

b2: pendent de la recta de regressió


b3: canvi en l’esperança de la variable dependent quan l’individu passa a
pertànyer a la categoria 1.

Dones
ü Rectes amb la mateixa
pendent; l’efecte del sou és
Homes
igual pels dos sexes

ü Podem plantejar el contrast


H0: b3=0, per veure si hi ha
diferència en la despesa
segons el sexe.
Models ANCOVA

Regressió amb dummy i quantitativa.

> model2<-lm(despesa~sexe+renda)
> summary(model2)

Call:
lm(formula = despesa ~ sexe + renda)

Residuals:
Min 1Q Median 3Q Max
-306.054 -75.430 0.563 77.272 284.989

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.506e+03 1.880e+02 8.012 2.19e-05 ***
sexeD -2.290e+02 1.071e+02 -2.139 0.0611 .
renda 5.898e-02 6.117e-03 9.642 4.84e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 178.8 on 9 degrees of freedom


Multiple R-squared: 0.9284, Adjusted R-squared: 0.9125
F-statistic: 58.36 on 2 and 9 DF, p-value: 7.025e-06
Models ANCOVA

1.- S’ha estimat la següent equació:

On la varaible sleep són els minuts dedicats a dormir (únicament per la nit) a la setmana, totwrk
són els minuts dedicats a treballar, educ són els anys d’educació formal, age l’edat (en anys) i
male és una variable fictícia per distingir el sexe.

a) Amb tota la resta constant, hi ha evidència que els homes dormen més que les dones?
b) És estadísticament significativa la disjuntiva entre treballar i dormir? Quina és
l’estimació d’aquesta disjuntiva?
c) Quina altra regressió necessites per contrastar la hipòtesi nul·la de que l’edat no afecta
al temps dedicat a dormir?
Models ANCOVA

Regressió amb politòmica i quantitativa

Variable qualitativa Regió on 1=Nord, 2=Sud i 3=Oest.

Creem tantes variables fictícies com categories té la variable menys una


que passa a ser la de referència (en aquest cas, Nord).

D2i= 1 si és regió Sud, 0 en cas


Yi= salari mig anual contrari.
Xi= despesa anual per alumne
Di= regió de residència D3i= 1 si és regió Oest, 0 en cas
contrari.

Yi=b1+b2D2i+b3D3i+b4Xi+ui
Models ANCOVA

Regressió amb politòmica i quantitativa


D’aquí es pot obtenir la funció del salari esperat en les tres regions com:

Yi=b1+b2D2i+b3D3i+b4Xi+ui

ü Salari esperat professors regió Nord: E[ Yi | D2i=0, D3i=0]=b1+b4Xi

ü Salari esperat professors regió Sud: E[ Yi | D2i=1, D3i=0]=b1+b2+b4Xi

ü Salari esperat professors regió Oest: E[ Yi | D2i=0, D3i=1]=b1+b3+b4Xi

El paràmetre b1 representa el salari anual mig de la regió de referència quan la


despesa per alumne és zero.

Els paràmetres b2 i b3 ens informen de la diferència del salari anual mig entre les
diferents regions.
Models ANCOVA

Regressió amb politòmica i quantitativa

Oest Si especifiquem el model així (forma


Sud additiva) estem dient que l’efecte de la
Nord despesa per alumne és el mateix per a
totes les regions (rectes paral·leles), i
que la influència de la regió només fa
variar el terme constant.

Si volem veure si el salari anual del professor està relacionat amb la regió plantejarem
el següent contrast d’hipòtesi: H0: b2 = b3 =0.

Si RH0 estem dient que hi ha relació entre aquestes dues variables.

Els contrastos t associats a b2 i b3 només ens permeten detectar diferències


significatives entre una categoria i la de referència (Sud versus Nord i Oest versus
Nord). L’existència de diferència entre el Sud i l’Oest queda sense contrastar.
Models ANCOVA

Regressió amb una variable quantitativa i més d’una variable dummy

Yi= b1+b2Di+b3Hi+b4Xi+ui Yi= despesa mèdica


Xi= edat
Di= gènere (Di=0 dona/ Di=1 home)
Hi= fumar (Hi=0 no fuma/ Hi=1 fuma)

D’aquí es pot obtenir la funció de la despesa mèdica (yi) com:

ü Home no fumador: E[ Yi| Di=1, Hi=0]=b1+b2+b4Xi

ü Home fumador: E[ Yi| Di=1, Hi=1]=b1+b2+b3+b4Xi

ü Dona fumadora: E[ Yi| Di=0, Hi=1]=b1+b3+b4Xi

ü Dona no fumadora (CR): E[ Yi| Di=0, Hi=0]=b1+b4Xi


Models ANCOVA

Regressió amb una variable quantitativa i més d’una variable dummy

Yi= b1+b2Di+b3Hi+b4Xi+ui Yi= despesa mèdica


Xi= edat
Di= gènere (Di=0 dona/ Di=1 home)
Hi= fumar (Hi=0 no fuma/ Hi=1 fuma)
Com s’interpreten els resultats? (sempre i quan el paràmetre sigui significatiu)

1.- Mantenint constants les variables edat i fumar, la despesa mèdica esperada dels
homes és b2 unitats diferent a la de les dones.

2.- Mantenint constants les variables edat i sexe, la despesa mèdica esperada dels
fumadors és b3 unitats diferent a la dels no fumadors.

3.- Mantenint constant la variable edat, la despesa mèdica esperada per un pacient home
fumador és b2+ b3 unitats diferent a la d’un pacient dona no fumadora

4.- Mantenint constants les variables sexe i fumar, la despesa mèdica mitjana augmenta o
disminueix b4 quan l’edat del pacient augmenta en un any.
Models ANCOVA

Interacció entre dues variables qualitatives.


Yi= b1+b2Di+b3Hi+b4Xi+ui

En el model anterior està implícit que l’efecte diferencial de la variable sexe és


constant en les dues categories de ser fumador i que l’efecte diferencial de la
variable fumador és constant en les dues categories de sexe.

Però.......

No podria passar que el fet de fumar modifiqués la despesa esperada en diferent


mesura en homes i dones, o que el fet de ser home modifiqués la despesa
esperada en diferent mesura en fumadors i no fumadors?

Cal afegir una interacció!!!

Yi= b1 + b2Di + b3Hi + b4Xi + b5Di x Hi + ui


Models ANCOVA

Interacció entre dues variables qualitatives.

Yi= b1 + b2Di + b3Hi + b4Xi + b5Di x Hi + ui

D’aquí es pot obtenir la funció de la despesa mèdica (yi) com:

ü Home no fumador: E[ Yi| Di=1, Hi=0]=b1+b2+b4Xi

ü Home fumador: E[ Yi| Di=1, Hi=1]=b1+b2+b3+ b5 +b4Xi

ü Dona fumadora: E[ Yi| Di=0, Hi=1]=b1+b3+b4Xi

ü Dona no fumadora (CR): E[ Yi| Di=0, Hi=0]=b1+b4Xi

§ La diferència esperada entre homes i dones és b2 en el cas de no fumar i b2+


b5 en el cas de fumar.

§ La diferència esperada entre fumadors i no fumadors és b3 en el cas de les


dones i b3+ b5 en el cas dels homes.
Models ANCOVA

Interacció entre dues variables qualitatives.

Yi= b1 + b2Di + b3Hi + b4Xi + b5Di x Hi + ui

Aquesta especificació permet determinar si:

ü L’efecte del sexe en la despesa mèdica depèn, o no, del fet de fumar o no.
ü La influència del tabac sobre la despesa mèdica depèn, o no del sexe.

H0: b5 =0
Nota: Si les dues variables fossin politòmiques amb m1 i m2 categories,
caldria introduir (m1-1)x(m2-1) productes. En aquest cas, caldria fer un
contrast de models ennierats.
Models ANCOVA

Interacció entre una variable quantitativa i una qualitativa.

Yi= sou
Yi= b1+ b2Xi + b3Di + b4DiXi+ ui Xi= anys d’experiència
Di= gènere (Di=0 dona/ Di=1 home)

ü En el cas d’una dona: E[ Yi | Xi, Di=0]=b1+b2Xi


ü En el cas d’un home: E[ Yi | Xi, Di=1]= b1+b2Xi +b3(1)Xi=(b1+ b3)+(b2+b4)Xi

En aquest model, el sou és major per


homes que per dones (suposem b3 positiu Homes
i estadísticament significatiu) i, a més a
més, el sou dels homes incrementa més Dones
amb els anys d’experiència que el de les
dones (suposem b4 positiu i que sigui b1 + b 3
estadísticament significatiu).

b1+b3 és el terme constant en la categoria b1


home, i b2+b4 n’és el pendent.
Models ANCOVA

Interacció entre una variable quantitativa i una qualitativa.

ü b2 i b3 són els efectes principals i b4 és la interacció

ü b3 s’interpreta com el canvi en el valor esperat de la variable dependent quan


l’individu passa a pertànyer a la categoria 1.

ü b4 s’interpreta com el canvi en el pendent quan l’individu passa a pertànyer a la


categoria 1.

ü Per contrastar la significació de la diferencia de pendents entre homes i dones,


cal plantejar el contrast

H0: b4=0

ü Si la variable fos politòmica amb m categories caldria introduir m-1 productes i


llavors caldria fer un contrast de models ennierats.
Models ANCOVA

Interacció entre una variable quantitativa i una qualitativa.

Alguns consells són:

ü Les variables politòmiques cal tractar-les com un tot.

ü La presència de la interacció pressuposa que també ha d’haver-hi els


efectes principals de les variables que interactuen.

ü Cal ser molt curós en la interpretació de l’efecte principal quan hi ha


una interacció

ü Una interacció no significativa es suprimeix del model en primer lloc.


En un segon pas es planteja si convé treure també algun efecte
principal.
Aplicacions

Variables fictícies i efectes estacionals

Per tractar el component estacional en una sèrie es poden usar


variables fictícies que indiquen el període.

El paràmetre d’aquesta variable fictícia s’interpreta com l’impacte de


l’època estacional designada en el valor esperat de la variable
dependent, comparat amb l’estació que hem agafat com a referència.

Sigui:

yi = vendes de gelats x2i = preu x3i = despesa en publicitat

ì0 = resta ì0 = resta ì0 = resta


d1i = í d 2i = í d 3i = í
î 1 = primavera î 1 = tardor î1 = hivern
Aplicacions

Variables fictícies i efectes estacionals

ü L’estacionalitat es sol tractar additivament.

yi = b1 + b 2 x2i + b 3 x3i + b 4 d1i + b 5 d 2i + b 6 d 3i + ui

ü Per tal de contrastar la presència d’estacionalitat es pot plantejar el


següent contrast:

Ho: b4=b5=b6=0; no existeix estacionalitat.

El rebuig de la H0 porta a concloure que les vendes de gelats tenen un


comportament estacional.
Aplicacions

Variables fictícies i canvis estructurals.

ü CANVI ESTRUCTURAL en la relació entre la variable dependent i les


independents. Això vol dir que els paràmetres del model no són constants al
llarg del període degut a algun succés extraordinari (guerra, canvi legal,
atemptat, etc.).

Yi=b1+b2Xi+ui i=1,2,....,n.

on Yi= consum de gas-oil,


Xi=volum de facturació per un període de 1960 fins a 1990.

Suposem que al 1973 s’ha produït una crisis en els preu del petroli. Dividim
el model en dos subperíodes:

Període 1. Yi=b1 + b2X2i + ui i=1,2,3,....,T


Període 2. Yi=a1 + a2X2i + ui i=T+1,T+2,...,n.
Aplicacions

Variables fictícies i canvis estructurals.

ü Introduïm la variable fictícia D1 de manera que D1=0 per a períodes anteriors


al canvi, i D1=1 per a períodes posteriors.

Yi=b1+b2X2i+b3D1i+b4D1iX2i+ui i=1,2,...,n.

E éë Yi | X2i ,D1i = 0 ùû = b1 + b2 X2i


E éë Yi | X2i ,D1i = 1ùû = ( b1 + b3 ) + ( b2 + b4 ) X2i

ü Si volem contrastar la hipòtesi de que hi ha hagut un canvi estructural, cal


plantejar el següent contrast:
H0 : b3 = b4 = 0, no hi ha hagut cap canvi estructural.
H1 : algun b j ¹ 0, hi ha hagut canvi estructural.
Observació final

Les variables fictícies són útils i molt adaptables però hem de tenir en
compte dues qüestions:

1) Cal interpretar els coeficients sempre respecte al grup base o


categoria de referència, que cal escollir adequadament.

2) La introducció de variables fictícies “gasta” els graus de llibertat.


Per tant, hem de ser prudents a l’hora d’introduir-les, sempre en funció
de la mida de la mostra i tenint molt present el principi de parsimònia.
Maria A Barceló

Despatx: 204
Correu: antonia.barcelo@udg.edu
Tutories: a convenir prèviament per correu electrònic
Moltes gràcies!!!

You might also like