Jorge Salgado Sistema de Ecuaciones STATA

P
á
g
i
n
a
1









Práctica Empírica: Sistema de Ecuaciones de
Demanda y Precios en el Mercado Español de
Transporte Aéreo


Jorge Salgado

15 de diciembre de 2011


1.- Elementos iníciales: Preparación del paquete informático y de la base de
datos:

Se parte por actualizar a Stata 10 instalado en Ubuntu 11.10 (distribución Oneric):

update query Busca las actualizaciones más recientes y las compara con la actual.
update all  Actualiza todas las librerías disponibles .
update swap  Se completa la actualización y se reinicia el software.

Una vez reiniciado Stata, se importa la base de datos, inicialmente en .xls a un archivo .csv
utilizando Excel. Posteriormente, se abre y se carga en STATA.

cd /home/jorge/Desktop/prac  Se define al directorio de trabajo.
insheet using pracsv.csv  El documento convertido a un archivo con extensión .csv es
importado a STATA
xtset index year Se indica al software que ordene la base de datos de acuerdo al tipo
de rutas y de acuerdo al periodo de tiempo.

Se visualiza la información, se elabora un resumen estadístico general y posteriormente se
hace una síntesis descriptiva en consideración de la naturaleza discreta o continua de las
variables.

list dist pibc pop pax turc pr  Crea una lista de observaciones de las variables
seleccionadas.

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
2

Tabla No. 1
Ejecución del comando list


summarize  Resume todas las variables de la muestra (alternativamente sum).


Tabla No. 2
Ejecución del comando summarize




sum pr pax pop pibc dist turc hha  Presenta un resumen estadístico de las variables
continuas

sum modal if modal>0  Resume a la variable de competencia intermodal,
imponiendo una condición que permite recoger su naturaleza binaria

sum hub if hub>0  Resume a la variable de rutas que tienen como origen al
aeropuerto de Madrid (hub primario de Iberia) identificadas como una dummy.

sum compet if compet>0  Resume a la variable de rutas que tienen más de un
competidor.







Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
3

Tabla No. 3
Ejecución del comando sum para variables continuas y discretas



Las tablas dos y tres muestran que el precio medio de las rutas incluidas en la muestra es de
188.90 euros, la ruta de menor valor tiene un precio promedio de 49.85 euros mientras la de
mayor 756.19. Es relevante la magnitud de la desviación estándar del total de número de
pasajeros transportados por ruta, que muestra un valor de 329757.7 mayor al de la media de
248892.7 podría constituir un indicativo sobre la heterogeneidad en la demanda rutas. Los
resultados del valor medio del índice de Hirchman-Herfindalh, sobre la concentración de
cuotas de las aerolíneas en términos del total de salidas en el aeropuerto, se orientan en una
dirección cercana, la diferencia entre el índice más alto es de 0.5 con un valor máximo de
0.755.

La variable de turistas per cápita da pautas sobre el comportamiento asimétrico del sector
turístico entre las ciudades de la muestra, la desviación estándar muestra un valor de 3.43
mayor a la media de 2.57, la diferencia entre la ciudad de mayor turismo per cápita y la de
menor es de 11.23. Los momentos estadísticos de la población en las ciudades de origen y
destino podría reflejar las asimetrías en la concentración de población en las ciudades de la
muestra, la desviación estándar tiene un valor de 831171.1 mientras la media de 2´999308
individuos, en cada ciudad. El producto per cápita medio de la muestra es de 21971.35 euros
y la desviación de 3162.145, no obstante, existe una amplia brecha entre la ciudad de menor
producto per cápita y la de mayor, alrededor de 15.000 euros, lo cual brinda señales sobre la
polarización de las actividades productivas.

Las variables discretas sobre la competencia intermodal, la que representa a las rutas que
parten del Hub de Madrid y el de las rutas que no son un monopolio, representan en su
conjunto cerca del 50% de las observaciones para los tres casos.


La construcción de la matriz de varianzas y covarianzas parte del comando:

corre pax pr pop pibc dist turc hha modal hub compet <-El comando corre presenta a
la matriz de varianzas y covarianzas E(XX´).


Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
4


Tabla No. 4
Matriz de varianzas y covarianzas: Aplicación del comando corre




En la Tabla No.4 se muestra como el número total de pasajeros transportados conserva con
las variables restantes una relación esperada en la mayoría de los casos. El precio influye de
forma negativa en el número total de pasajeros, la población en las ciudades de forma positiva,
el producto per cápita positivamente, la distancia de forma positiva lo cual sugiere que en
trayectos más extensos los usuarios prefieren utilizar una ruta aérea. El turismo de forma
similar posee una relación positiva, la media del índice de Hirchman-Herfindalh se relaciona
de forma negativa, por lo que la mayor concentración de cuotas de las aerolíneas afectaría
negativamente al número de pasajeros. La relación entre aeropuertos con mayor competencia
y el número de pasajeros tendrían un impacto positivo. La variable de competencia intermodal
que se esperaría tenga una relación negativa con el número de pasajeros tiene una covarianza
positiva, la variable de hub también refleja un resultado positivo.

Por otra parte, la variable de precios conserva covarianzas negativas con la población de las
ciudades, con la actividad económica, con la competencia intermodal, con la de hub y con la
de competencia intramodal todas esperadas. Mientras, presenta relaciones positivas con la
distancia el turismo per cápita y la media del índice de Hirchman-Herfindalh, es decir
mientras más cuotas tendría una aerolínea la posibilidad de subir el precio es mayor.

Adicionalmente, son de interés las covarianzas negativas entre la variable de Hub,
competencia intermodal, y la media del índice de Hirchman-Herfindalh. Mientras existe una
covarianza positiva con la variable de competencia entre las aerolíneas. Podría entregar una
intuición sobre la relación positiva entre aeropuertos no monopólicos o de competencia con la
actividad turística.

Una vez examinada brevemente la matriz de varianzas y covarianzas, se emplea una
representación gráfica de las variables de: distancia, producto interno bruto per cápita y
población:

histogram dist, frequency saving(h1distancia)  Grafica un histograma de frecuencias
con el nombre h1ditancia de la variable distancia(dist) y con la extensión “.gph”


gr export h1distancia.ps  Exporta el gráfico con extensión “.gph” a una “.ps”, es de
utilidad en la versión estática(o de consola) de Stata, que no posee la interfaz gráfica
que permite visualizar al gráfico de manera instantánea

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
5


Gráfico No. 1
Histograma de la variable de distancia




twoway (mspline pax dist if dist<3000, bands(5) n(5)), saving(twoway)  Estima de
forma no paramétrica la relación entre el volumen de tráfico de pasajeros y la distancia
gr export twoway.ps  Exporta al gráfico twoway.pgh a una extensión .ps

Gráfico No. 2
Estimación no paramétrica de la relación entre el de tráfico de pasajeros y la distancia



histogram pibc, frequency saving(h2pibc)  Grafica un histograma de frecuencias de la
variable PIB per cápita
gr export h2pibc.ps  Exporta al gráfico h2pibc.ghp a una extensión .ps








Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
6


Gráfico No. 3
Histograma de la variable del PIB per cápita


histogram pop, frequency saving(h2pop)  Grafica un histograma de frecuencias de la
variable de población
gr export pop.ps  Exporta al gráfico h2pop.pgh a una extensión .ps


Gráfico No. 4
Histograma del número de turistas per cápita de las ciudades de origen y destino

El Gráfico No. 1, muestra como la mayor parte de rutas tienen entre 0 hasta 900km de
distancia, en particular hay una alta frecuencia de rutas con cerca de 500 km, mientras un
grupo pequeño más de 2000 km. El Gráfico No. 2 representa como a medida que la distancia
se incrementa el tráfico de pasajeros inicialmente aumenta hasta un punto en donde la

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
7

distancia es tan amplia que ya no existe una relación directa con el tráfico aéreo. En el Gráfico
No. 3 se muestra al histograma de frecuencias para el PIB per cápita medio de cada ciudad de
destino y origen incorporada en la muestra, la mayoría de ciudades se encuentra en un
intervalo de rente madia entre 20000 a 25000 euros. En el Gráfico No. 4, se presenta a la
distribución de frecuencias para la variable de turismo per cápita, la cual permite visualizar
que la mayoría de ciudades que son destino tienen entre 0 hasta 3 turistas per cápita en los
periodos de observación.

Para complementar el ejercicio descriptivo se elaboran contrastes de medias para las
variables de pasajeros totales y precios considerando: i) las rutas de monopolio y las rutas de
competencia, ii) las rutas durante verano y durante invierno.

ttest pax,by(compet)  ttest elabora el contraste de medias para la variable de
pasajeros distinguiendo por el tipo de competencia de la ruta, como es habitual la E
0

plantea que no hay diferencias entre los dos grupos, y la alternativa que las hay.
ttest pr,by(compet)  ttest elabora el contraste de medias para la variable de precios
distinguiendo por el tipo de competencia de la ruta

Tabla No. 5
Contraste de medias de acuerdo al tipo de competencia



En el primer caso el contraste de medias nos indica que se rechaza la hipótesis nula al 5% de
significación, es decir existen diferencias en los dos grupos de rutas, monopólicas y las de
mayor competencia para el número de pasajeros. En el segundo caso, también se rechaza la
hipótesis nula, existen diferencias en el nivel de precios entre los dos tipos de rutas.


Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
8

ttest pax,by(ver)  ttest elabora el contraste de medias para la variable de pasajeros
distinguiendo por el tipo de temporada: invierno verano.
ttest pr,by(ver)  ttest elabora el contraste de medias para la variable de precios
distinguiendo por el tipo de temporada: invierno verano.

Tabla No. 6
Contraste de medias de acuerdo a la temporada (verano-invierno)



En el primer caso para el tráfico de pasajeros se rechaza la hipótesis nula al 10% de significación y
en el segundo caso se rechaza la hipótesis nula al 5% de significación. Es decir, se tienen
intuiciones sobre las diferencias de pasajeros y precios en las dos estaciones climáticas.

Para completar esta primera sección descriptiva se comprueba si existen problemas de
heterocedasticidad, antes de continuar se hacen transformaciones logarítmicas de las variables.

generate lpax = log(pax)  Hace una transformación logarítmica de la variable pax.
generate lpop = log(pop)  Hace una transformación logarítmica de la variable pop.
generate lpibc = log(pibc)  Hace una transformación logarítmica de la variable pbc.
generate lturc = log(turc)  Hace una transformación logarítmica de la variable turc.


Ahora se prueba si existen indicios de heterocedasticidad.


regress lpax lpop lpibc lturc hub modal time ver pr Estimación de la ecuación de
demanda.
estat hettest  Comando que prueba la existencia de heterocedasticidad de la ecuación
anterior. Es la prueba Breusch-Pagan / Cook-Weisberg, que tiene como hipótesis nula
que la varianza de los errores son iguales, mientras la hipótesis alternativa indica que

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
9

es una función de una o más variables.


regress pr dist pax compet cap_barcelona cap_madrid ver Estimación de la ecuación
de precios.
estat hettest  Comando que prueba la existencia de heterocedasticidad de la ecuación
anterior.

Tabla No. 7
Prueba de heterocedasticidad de la ecuación de demanda




Tabla No. 8
Prueba de heterocedasticidad de la ecuación de precios



Los resultados de la ecuación de demanda muestran un valor cercano a cero del estadístico de
cℎi
2
, por lo tanto, para esta prueba no existen indicios de heterocedasticidad. Por otra parte,
la ecuación de precios presentaría problemas de heterocedasticidad. Se rechaza a la hipótesis
nula para el segundo caso.


Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
1
0


2. Estimación de la ecuación de demanda (se supone que o
ì
= u).

Las ecuaciones de demanda está dada por:

lpox
ìt
= o
ì
+ o
t
Iimc + p + [
1
lpop
ìt
+ [
2
lpibc +[
3
lturc
ìt
+[
4
ℎub
ì
+ [
5
moJol
ì
+
[
6
:cr
ì
+[
7
pr
ìt
+e
ìt
(1)

, mientras la ecuación de pecios por:

pr
ìt
= o
ì
,
+o
t
,
Cop_Borcclono + o
t
,,
Cop_HoJriJ + p
,
+[
1
,
Ðist +[
2
,
Pox + [
3
,
Compct +
[
4
,
:cr +e
ìt
´
(2)


, con i = 1,2, …,S6 y t = 1,2, …,16

, donde [
3
,
= [
7
(-1)
(1 −0
oIìgopoIìo
), 0
oIìgopoIìo
es el parámetro de conducta en rutas en
oligopolio.

Si se supone que todas las variables explicativas de la ecuación de demanda son exógenas la
estimación por Mínimos Cuadrados Ordinarios sería la más adecuada:

regress lpax lpop lpibc lturc hub modal time ver pr, robust  Estimación de la ecuación
de demanda por Mínimos Cuadrados Ordinarios, controlando la existencia de
heterocedasticidad con el comando Robust.

mfx, dyex  Obtiene las elasticidades de la regresión anterior.











Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
1
1


Tabla No. 9
Estimación de la ecuación de demanda por Mínimos Cuadrados Ordinarios controlando la
heterocedasticidad - elasticidades





Además, se puede controlar por auto correlación espacial:
regress lpax lpop lpibc lturc hub modal time ver pr, robust cluster(index)  Se corrige
a la ecuación de autocorrelación espacial incorporando al comando cluster(index)
mfx, dyex  Obtiene las elasticidades de la regresión anterior.











.

pr -.5669864 .05379 -10.54 0.000 -.672416 -.461557 189.13
ver .1647387 .03088 5.34 0.000 .104222 .225256 .50056
time .0060042 .07948 0.08 0.940 -.14978 .161789 4.48712
modal -.0813587 .0305 -2.67 0.008 -.141141 -.021576 .447928
hub .1482052 .03178 4.66 0.000 .085924 .210486 .444569
lturc .0442904 .00268 16.55 0.000 .039046 .049535 .103752
lpibc 6.224227 2.91506 2.14 0.033 .510809 11.9376 9.9865
lpop 20.24516 1.18283 17.12 0.000 17.9269 22.5635 14.8606

variable dy/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 11.776655
y = Fitted values (predict)
Elasticities after regress
. mfx, dyex
.

_cons -14.40763 2.9306 -4.92 0.000 -20.15937 -8.655881
pr -.0029979 .0002844 -10.54 0.000 -.0035561 -.0024397
ver .3291088 .0616841 5.34 0.000 .2080444 .4501732
time .0013381 .0177136 0.08 0.940 -.0334276 .0361038
modal -.1816334 .0680955 -2.67 0.008 -.3152811 -.0479857
hub .3333684 .0714771 4.66 0.000 .1930839 .473653
lturc .4268872 .0257921 16.55 0.000 .3762664 .477508
lpibc .6232639 .2919003 2.14 0.033 .0503655 1.196162
lpop 1.36234 .0795949 17.12 0.000 1.206123 1.518557

lpax Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

Root MSE = .89049
R-squared = 0.4634
Prob > F = 0.0000
F( 8, 884) = 147.94
Linear regression Number of obs = 893
. regress lpax lpop lpibc lturc hub modal time ver pr, robust

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
1
2


Tabla No. 10
Estimación de la ecuación de demanda controlando la heterocedasticidad y por
autocorrelación espacial- elasticidades



Y por auto correlación temporal:
regress lpax lpop lpibc lturc hub modal time ver pr, robust cluster(year)  Se corrige a
la ecuación de autocorrelación temporal incorporando al comando cluster(year)
mfx, dyex  Obtiene las elasticidades de la regresión anterior.













pr -.5669864 .11549 -4.91 0.000 -.793336 -.340637 189.13
ver .1647387 .01999 8.24 0.000 .125558 .203919 .50056
time .0060042 .19463 0.03 0.975 -.375461 .387469 4.48712
modal -.0813587 .10987 -0.74 0.459 -.296699 .133982 .447928
hub .1482052 .1173 1.26 0.206 -.081696 .378106 .444569
lturc .0442904 .00975 4.54 0.000 .025186 .063395 .103752
lpibc 6.224227 9.70826 0.64 0.521 -12.8036 25.2521 9.9865
lpop 20.24516 4.43039 4.57 0.000 11.5618 28.9286 14.8606

variable dy/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 11.776655
y = Fitted values (predict)
Elasticities after regress
. mfx, dyex
.

_cons -14.40763 9.832324 -1.47 0.149 -34.11204 5.29679
pr -.0029979 .0006106 -4.91 0.000 -.0042216 -.0017742
ver .3291088 .0399359 8.24 0.000 .2490754 .4091422
time .0013381 .0433749 0.03 0.976 -.0855872 .0882634
modal -.1816334 .2452839 -0.74 0.462 -.6731932 .3099265
hub .3333684 .2638478 1.26 0.212 -.1953944 .8621313
lturc .4268872 .0939501 4.54 0.000 .238607 .6151674
lpibc .6232639 .9721379 0.64 0.524 -1.324944 2.571472
lpop 1.36234 .2981303 4.57 0.000 .7648739 1.959807

lpax Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

(Std. Err. adjusted for 56 clusters in index)
Root MSE = .89049
R-squared = 0.4634
Prob > F = 0.0000
F( 8, 55) = 37.52
Linear regression Number of obs = 893
. regress lpax lpop lpibc lturc hub modal time ver pr, robust cluster(index)

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
1
3


Tabla No. 11
Estimación de la ecuación de demanda controlando la heterocedasticidad y por
autocorrelación temporal - elasticidades


Como algunas de las variables son endógenas entonces se lleva a cabo una estimación por
variables instrumentales, que trate de eliminar el sesgo de la estimación.

ssc install ivreg2, replace  Se instala al paquete ivreg2, una actualización de ivreg(
instrumental variable regression)

ssc install ranktest  Se instala al paquete ranktest elaborado por Kleibergen-Paap
(2006). Es una del rango de una matriz necesaria para alguno de los estadísticos de
ivreg2.

ivreg2 lpax lpop lpibc lturc hub modal time ver (pr = dist), ffirst robust  ivreg2
estima mediante variables instrumentales, el comando ffirst añade la estimación de la
primera etapa del proceso de Mínimos Cuadrados de Variables Instrumentales. La
regresión en primera fase puede ser un soporte para decidir si un instrumento es débil
o no. Las variables entre paréntesis señalan a la variable explicativa que adolece de
endogeneidad en este caso pr y al intrumento dist.

mfx,dyex se obtienen las elasticidades

pr -.5669864 .0443 -12.80 0.000 -.653805 -.480168 189.13
ver .1647387 .01977 8.33 0.000 .125993 .203485 .50056
time .0060042 .06594 0.09 0.927 -.123243 .135252 4.48712
modal -.0813587 .01912 -4.26 0.000 -.118829 -.043889 .447928
hub .1482052 .01143 12.96 0.000 .125797 .170614 .444569
lturc .0442904 .00164 26.96 0.000 .041071 .04751 .103752
lpibc 6.224227 1.97804 3.15 0.002 2.34734 10.1011 9.9865
lpop 20.24516 .64636 31.32 0.000 18.9783 21.512 14.8606

variable dy/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 11.776655
y = Fitted values (predict)
Elasticities after regress
. mfx, dyex
.

_cons -14.40763 2.057017 -7.00 0.000 -18.79205 -10.0232
pr -.0029979 .0002342 -12.80 0.000 -.0034971 -.0024987
ver .3291088 .0394933 8.33 0.000 .2449309 .4132867
time .0013381 .0146962 0.09 0.929 -.0299862 .0326624
modal -.1816334 .04268 -4.26 0.001 -.2726036 -.0906631
hub .3333684 .0257171 12.96 0.000 .2785538 .3881831
lturc .4268872 .0158338 26.96 0.000 .3931383 .4606361
lpibc .6232639 .1980714 3.15 0.007 .2010847 1.045443
lpop 1.36234 .043495 31.32 0.000 1.269633 1.455048

lpax Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

(Std. Err. adjusted for 16 clusters in year)
Root MSE = .89049
R-squared = 0.4634
Prob > F = 0.0000
F( 8, 15) = 596.66
Linear regression Number of obs = 893
. regress lpax lpop lpibc lturc hub modal time ver pr, robust cluster(year)

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
1
4




Tabla No. 12
Estimación de la ecuación de demanda mediante variables instrumentales (primera etapa)








Number of excluded instruments L1 = 1
Number of instruments L = 9
Number of endogenous regressors K1 = 1
Number of regressors K = 9
Number of observations N = 893
test statistics heteroskedasticity-robust
NB: Underidentification, weak identification and weak-identification-robust
Stock-Wright LM S statistic Chi-sq(1)= 6.30 P-val=0.0121
Anderson-Rubin Wald test Chi-sq(1)= 6.65 P-val=0.0099
Anderson-Rubin Wald test F(1,884)= 6.59 P-val=0.0104
Ho: B1=0 and orthogonality conditions are valid
Tests of joint significance of endogenous regressors B1 in main equation
Weak-instrument-robust inference
NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors.
Source: Stock-Yogo (2005). Reproduced by permission.
25% maximal IV size 5.53
20% maximal IV size 6.66
15% maximal IV size 8.96
10% maximal IV size 16.38
Stock-Yogo weak ID test critical values for K1=1 and L1=1:
Kleibergen-Paap Wald rk F statistic 259.42
Cragg-Donald Wald F statistic 319.60
Ho: equation is weakly identified
Weak identification test
Kleibergen-Paap rk LM statistic Chi-sq(1)=110.71 P-val=0.0000
Ha: matrix has rank=K1 (identified)
Ho: matrix of reduced form coefficients has rank=K1-1 (underidentified)
Underidentification test
NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors.
Source: Stock-Yogo (2005). Reproduced by permission.
25% maximal IV size 5.53
20% maximal IV size 6.66
15% maximal IV size 8.96
10% maximal IV size 16.38
Stock-Yogo weak ID test critical values for single endogenous regressor:
NB: first-stage test statistics heteroskedasticity-robust
pr | 259.42 0.0000 | 262.06 0.0000 | 259.42
Variable | F( 1, 884) P-val | AP Chi-sq( 1) P-val | AP F( 1, 884)
(Underid) (Weak id)

Summary results for first-stage regressions
. ivreg2 lpax lpop lpibc lturc hub modal time ver (pr = dist), ffirst robust

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
1
5


Tabla No. 13
Estimación de la ecuación de demanda mediante variables instrumentales (segunda etapa)






ver .113007 .03236 3.49 0.000 .049591 .176423 .50056
time .0241192 .08079 0.30 0.765 -.134219 .182458 4.48712
modal -.0319681 .03505 -0.91 0.362 -.100657 .036721 .447928
hub .1434381 .03286 4.37 0.000 .079037 .207839 .444569
lturc .0448335 .00276 16.24 0.000 .039422 .050245 .103752
lpibc 7.375222 3.03878 2.43 0.015 1.41932 13.3311 9.9865
lpop 20.10379 1.21726 16.52 0.000 17.718 22.4896 14.8606
pr -.227728 .08578 -2.65 0.008 -.395858 -.059598 189.13

variable dy/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 11.776655
y = Linear prediction (predict)
Elasticities after ivreg2
. mfx,dyex
.

Excluded instruments: dist
Included instruments: lpop lpibc lturc hub modal time ver
Instrumented: pr

(equation exactly identified)
Hansen J statistic (overidentification test of all instruments): 0.000

NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors.
Source: Stock-Yogo (2005). Reproduced by permission.
25% maximal IV size 5.53
20% maximal IV size 6.66
15% maximal IV size 8.96
Stock-Yogo weak ID test critical values: 10% maximal IV size 16.38
(Kleibergen-Paap rk Wald F statistic): 259.419
Weak identification test (Cragg-Donald Wald F statistic): 319.604

Chi-sq(1) P-val = 0.0000
Underidentification test (Kleibergen-Paap rk LM statistic): 110.713

_cons -15.76805 3.048208 -5.17 0.000 -21.74243 -9.793676
ver .2257611 .0646387 3.49 0.000 .0990716 .3524506
time .0053752 .0180041 0.30 0.765 -.0299121 .0406626
modal -.0713689 .0782404 -0.91 0.362 -.2247172 .0819795
hub .3226453 .0739099 4.37 0.000 .1777846 .4675061
lturc .4321223 .0266112 16.24 0.000 .3799653 .4842793
lpibc .738519 .3042889 2.43 0.015 .1421237 1.334914
lpop 1.352827 .0819122 16.52 0.000 1.192282 1.513372
pr -.0012041 .0004536 -2.65 0.008 -.002093 -.0003151

lpax Coef. Std. Err. z P>|z| [95% Conf. Interval]
Robust

Residual SS = 723.8024896 Root MSE = .9003
Total (uncentered) SS = 125156.2234 Uncentered R2 = 0.9942
Total (centered) SS = 1306.417958 Centered R2 = 0.4460
Prob > F = 0.0000
F( 8, 884) = 135.88
Number of obs = 893
Statistics robust to heteroskedasticity
Estimates efficient for homoskedasticity only

IV (2SLS) estimation

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
1
6


En la Tabla No. 12 se reportan los resultados de la primera estimación del proceso en dos
etapas. Se parte por recordar que la variable de precios (pr) adolece de endogeneidad como se
distingue en las ecuaciones (1) y (2). Los instrumentos se obtienen de la ecuación de precios
(2). Se emplea a la variable de distancia entre las ciudades de origen y de destino (dist).

La prueba F indica que el instrumento es significativo al 1% de significación, de acuerdo a
Bound, Jaeger y Baker (1995), cuando solo se tiene una variable explicativa con endogeneidad
y en consideración de que esta prueba F, es no estándar, el resultado puede ser altamente
informativo.

No obstante, siguiendo a Staiger y Stock (1997) quienes mostraron, que los instrumentos
pueden ser débiles incluso si las pruebas t y F de la primera etapa son representativos. Se
consideran a los estadísticos de Cragg y Donald fundamentado en los valores críticos de Stock
y Yogo, y a la prueba de Anderson ambos en el marco de ivreg2.

Stock y Yogo (2005), concentran su preocupación en comprender si el sesgo del estimador de
variables instrumentales, que resulta por el uso de instrumentos débiles puede ser grande e
incluso mayor que el de MCO. Si el valor del estadístico que sigue una distribución F(en este
caso el de Cragg y Donald wald o el estadístico de Kleinbergen-Paap) es mayor que el de los
valores críticos, se rechaza la hipótesis nula de debilidad de los instrumentos, que es el
escenario de la estimación de la Tabla No. 12. A pesar de ello, para Cameron y Trivedi(2009),
en el caso de un regresor con endogeneidad los valores críticos solo son válidos si se tiene al
menos tres instrumentos.

Los estadísticos de las pruebas de Anderson-Rubin de parámetros estructurales y el de Stock-
Wright LM rechazan la hipótesis nula, por lo tanto los regresores endógenos son relevantes.
Por otra parte, las pruebas de sobreidentifación no son de interés ya que existe un
instrumento para un regresor endógeno, el sistema está perfectamente identificado como se
intuye del estadístico de Hansen.

En cuanto a los coeficientes de las explicativas, en las dos estimaciones por MCO y mediante IV
los resultados cualitativos son los mismos, no obstante, la significación de las regresores varía.
El coeficiente de la variable de precios, que es instrumentalizada en la estimación de dos
etapas, muestra una relación negativa con el logaritmo del número de pasajeros, que es un
resultado esperado, un mayor precio reduciría la demanda de viajes. Sin embargo, en la
primera estimación el coeficiente muestra un valor mucho más elevado que en la segunda,
como resultado de la incorporación de una variable explicativa endógena.

La variable de población muestra una relación positiva con el número de pasajeros en ambos
casos MCO y VI. Un espacio poblacional más denso implica mayor tráfico aéreo. La del ingreso
per cápita en la estimación por mínimos cuadrados ordinarios presenta una relación positiva
y estadísticamente significativa de forma similar en la de variables instrumentales, además es
consecuente con los resultados esperados, espacios con mayor actividad económica tendrán
más tránsito de pasajeros. De la misma forma, la variable de turismo por habitante implicaría
un mayor flujo de pasajeros, en ambas estimaciones.

La variable de hub, parecería tener una relación positiva con el logaritmo del número de
pasajeros en la estimación por MCO y en la de VI. La variable de modal, que pretende capturar
el efecto de la competencia de otros modos de transporte tiene una relación negativa y
significativa en la estimación por MCO, mientras en la estimación en dos etapas es no

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
1
7

significativa incluyo al 10% del valor crítico. La variable de tendencia temporal parece no ser
significativa por MCO y IV. La variable de identificación de cambio climático para incidir de
forma positiva en el número de pasajeros, es decir que el tráfico se incrementa en verano en
las dos estimaciones. Este resultado es consistente con el contraste de medias presentado en
la Tabla No. 5.

3.- Estimación de la ecuación de precios (se supone que o
ì
= u).

Si se supone que todas las variables explicativas de la ecuación de precios son exógenas:

regress pr dist pax compet cap_barcelona cap_madrid ver, robust Estimación de la
ecuación de precios por Mínimos Cuadrados Ordinarios, controlando la existencia de
heterocedasticidad con el comando Robust.

mfx, eyex  Obtiene las elasticidades de la regresión anterior.

Tabla No. 14
Estimación de la ecuación de precios por Mínimos Cuadrados Ordinarios controlando la
heterocedasticidad – elasticidades




ver .1483415 .01342 11.05 0.000 .122037 .174646 .5
cap_ma~d .0107576 .01508 0.71 0.476 -.018799 .040314 .375
cap_ba~a -.0619012 .02233 -2.77 0.006 -.105674 -.018129 .5625
compet -.1471032 .01773 -8.30 0.000 -.181845 -.112362 .58817
pax -.0233423 .00759 -3.08 0.002 -.038211 -.008474 248893
dist .3935115 .01925 20.44 0.000 .355785 .431238 642.929

variable ey/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 188.89095
y = Fitted values (predict)
Elasticities after regress
. mfx, eyex
.

_cons 128.396 5.961887 21.54 0.000 116.695 140.097
ver 56.04074 5.244611 10.69 0.000 45.74748 66.33401
cap_madrid 5.418685 7.596215 0.71 0.476 -9.48992 20.32729
cap_barcelona -20.7868 7.442551 -2.79 0.005 -35.39382 -6.179781
compet -47.24226 5.893934 -8.02 0.000 -58.80991 -35.67461
pax -.0000177 5.78e-06 -3.06 0.002 -.0000291 -6.36e-06
dist .1156128 .0059981 19.27 0.000 .1038407 .1273849

pr Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

Root MSE = 73.735
R-squared = 0.4503
Prob > F = 0.0000
F( 6, 889) = 101.64
Linear regression Number of obs = 896
. regress pr dist pax compet cap_barcelona cap_madrid ver, robust

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
1
8



Además, la ecuación de precios se puede controlar por auto correlación espacial:
regress pr dist pax compet cap_barcelona cap_madrid ver, robust cluster(index)  Se
corrige a la ecuación de autocorrelación espacial incorporando al comando
cluster(index)
mfx, dyex  Se obtiene las elasticidades de la regresión anterior.


Tabla No. 15
Estimación de la ecuación de precios por Mínimos Cuadrados Ordinarios controlando la
heterocedasticidad y por la autocorrelación espacial - elasticidades





También puede controlarse por auto correlación temporal:

regress pr dist pax compet cap_barcelona cap_madrid ver, robust cluster(year)  Se
corrige a la ecuación de autocorrelación temporal incorporando al comando
cluster(index)

ver 28.02037 3.8799 7.22 0.000 20.4159 35.6248 .5
cap_ma~d 2.032007 3.34277 0.61 0.543 -4.51971 8.58372 .375
cap_ba~a -11.69257 5.91537 -1.98 0.048 -23.2865 -.09866 .5625
compet -27.78646 5.04822 -5.50 0.000 -37.6808 -17.8921 .58817
pax -4.409148 1.64202 -2.69 0.007 -7.62745 -1.19085 248893
dist 74.33075 8.20896 9.05 0.000 58.2415 90.42 642.929

variable dy/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 188.89095
y = Fitted values (predict)
Elasticities after regress
. mfx, dyex
.

_cons 128.396 11.02889 11.64 0.000 104.8885 151.9035
ver 56.04074 7.759806 7.22 0.000 39.50111 72.58038
cap_madrid 5.418685 8.914063 0.61 0.552 -13.58119 24.41856
cap_barcelona -20.7868 10.51622 -1.98 0.067 -43.20158 1.627984
compet -47.24226 8.58294 -5.50 0.000 -65.53636 -28.94816
pax -.0000177 6.60e-06 -2.69 0.017 -.0000318 -3.65e-06
dist .1156128 .0127681 9.05 0.000 .0883983 .1428273

pr Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

(Std. Err. adjusted for 16 clusters in year)
Root MSE = 73.735
R-squared = 0.4503
Prob > F = 0.0000
F( 6, 15) = 70.38
Linear regression Number of obs = 896
. regress pr dist pax compet cap_barcelona cap_madrid ver, robust cluster(year)

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
1
9


mfx, dyex  Obtiene las elasticidades de la regresión anterior.


Tabla No. 16
Estimación de la ecuación de precios por Mínimos Cuadrados Ordinarios controlando la
heterocedasticidad y por la autocorrelación temporal - elasticidades



Como algunas de las variables son endógenas entonces se lleva a cabo una estimación por variables
instrumentales.


ivreg2 pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid
ver, ffirst robust  ivreg2 estima mediante variables instrumentales, el comando ffirst
añade la estimación de la primera etapa del proceso de Mínimos Cuadrados de
Variables Instrumentales. La regresión en primera fase puede ser un soporte para
decidir si un instrumento es débil o no. Las variables entre paréntesis señalan en el
lado izquierdo a la variables explicativas que adolecen de endogeneidad en este pax y
compent los instrumentos al lado derecho son pop pibc turc hub modal hha.

mfx,dyex Obtiene las elasticidades de la regresión anterior.



ver 28.02037 3.8799 7.22 0.000 20.4159 35.6248 .5
cap_ma~d 2.032007 3.34277 0.61 0.543 -4.51971 8.58372 .375
cap_ba~a -11.69257 5.91537 -1.98 0.048 -23.2865 -.09866 .5625
compet -27.78646 5.04822 -5.50 0.000 -37.6808 -17.8921 .58817
pax -4.409148 1.64202 -2.69 0.007 -7.62745 -1.19085 248893
dist 74.33075 8.20896 9.05 0.000 58.2415 90.42 642.929

variable dy/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 188.89095
y = Fitted values (predict)
Elasticities after regress
. mfx, dyex
.

_cons 128.396 11.02889 11.64 0.000 104.8885 151.9035
ver 56.04074 7.759806 7.22 0.000 39.50111 72.58038
cap_madrid 5.418685 8.914063 0.61 0.552 -13.58119 24.41856
cap_barcelona -20.7868 10.51622 -1.98 0.067 -43.20158 1.627984
compet -47.24226 8.58294 -5.50 0.000 -65.53636 -28.94816
pax -.0000177 6.60e-06 -2.69 0.017 -.0000318 -3.65e-06
dist .1156128 .0127681 9.05 0.000 .0883983 .1428273

pr Coef. Std. Err. t P>|t| [95% Conf. Interval]
Robust

(Std. Err. adjusted for 16 clusters in year)
Root MSE = 73.735
R-squared = 0.4503
Prob > F = 0.0000
F( 6, 15) = 70.38
Linear regression Number of obs = 896
. regress pr dist pax compet cap_barcelona cap_madrid ver, robust cluster(year)

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
2
0



Tabla No. 17
Estimación de la ecuación de precios mediante variables instrumentales (primera fase).












Number of excluded instruments L1 = 6
Number of instruments L = 11
Number of endogenous regressors K1 = 2
Number of regressors K = 7
Number of observations N = 893
test statistics heteroskedasticity-robust
NB: Underidentification, weak identification and weak-identification-robust
Stock-Wright LM S statistic Chi-sq(6)= 87.88 P-val=0.0000
Anderson-Rubin Wald test Chi-sq(6)= 117.65 P-val=0.0000
Anderson-Rubin Wald test F(6,882)= 19.37 P-val=0.0000
Ho: B1=0 and orthogonality conditions are valid
Tests of joint significance of endogenous regressors B1 in main equation
Weak-instrument-robust inference
NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors.
Source: Stock-Yogo (2005). Reproduced by permission.
25% maximal IV size 7.42
20% maximal IV size 9.10
15% maximal IV size 12.33
10% maximal IV size 21.68
30% maximal IV relative bias 4.78
20% maximal IV relative bias 6.08
10% maximal IV relative bias 9.48
5% maximal IV relative bias 15.72
Stock-Yogo weak ID test critical values for K1=2 and L1=6:
Kleibergen-Paap Wald rk F statistic 11.13
Cragg-Donald Wald F statistic 12.07
Ho: equation is weakly identified
Weak identification test
Kleibergen-Paap rk LM statistic Chi-sq(5)=47.57 P-val=0.0000
Ha: matrix has rank=K1 (identified)
Ho: matrix of reduced form coefficients has rank=K1-1 (underidentified)
Underidentification test
NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors.
Source: Stock-Yogo (2005). Reproduced by permission.
25% maximal IV size 8.84
20% maximal IV size 10.98
15% maximal IV size 15.09
10% maximal IV size 26.87
30% maximal IV relative bias 5.25
20% maximal IV relative bias 6.77
10% maximal IV relative bias 10.83
5% maximal IV relative bias 19.28
Stock-Yogo weak ID test critical values for single endogenous regressor:
NB: first-stage test statistics heteroskedasticity-robust
compet | 85.18 0.0000 | 627.70 0.0000 | 123.99
pax | 57.24 0.0000 | 251.80 0.0000 | 49.74
Variable | F( 6, 882) P-val | AP Chi-sq( 5) P-val | AP F( 5, 882)
(Underid) (Weak id)

Summary results for first-stage regressions
. ivreg2 pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
2
1



Tabla No. 18
Estimación de la ecuación de precios mediante variables instrumentales (segunda fase).






.

ver .149537 .01323 11.30 0.000 .123603 .175471 .50056
cap_ma~d .0135241 .01476 0.92 0.360 -.015411 .042459 .3729
cap_ba~a -.0577184 .02267 -2.55 0.011 -.102143 -.013293 .56103
dist .4002972 .01992 20.10 0.000 .361262 .439333 643.382
compet -.1732301 .03985 -4.35 0.000 -.251326 -.095134 .586786
pax -.0328448 .02293 -1.43 0.152 -.077784 .012094 248553

variable ey/ex Std. Err. z P>|z| [ 95% C.I. ] X

= 189.13028
y = Linear prediction (predict)
Elasticities after ivreg2
. mfx, eyex
.

Excluded instruments: pop pibc turc hub modal hha
Included instruments: dist cap_barcelona cap_madrid ver
Instrumented: pax compet

Chi-sq(4) P-val = 0.0000
Hansen J statistic (overidentification test of all instruments): 45.117

NB: Critical values are for Cragg-Donald F statistic and i.i.d. errors.
Source: Stock-Yogo (2005). Reproduced by permission.
25% maximal IV size 7.42
20% maximal IV size 9.10
15% maximal IV size 12.33
10% maximal IV size 21.68
30% maximal IV relative bias 4.78
20% maximal IV relative bias 6.08
10% maximal IV relative bias 9.48
Stock-Yogo weak ID test critical values: 5% maximal IV relative bias 15.72
(Kleibergen-Paap rk Wald F statistic): 11.129
Weak identification test (Cragg-Donald Wald F statistic): 12.073

Chi-sq(5) P-val = 0.0000
Underidentification test (Kleibergen-Paap rk LM statistic): 47.573

_cons 132.4735 6.365917 20.81 0.000 119.9965 144.9504
ver 56.50067 5.169861 10.93 0.000 46.36792 66.63341
cap_madrid 6.859253 7.488238 0.92 0.360 -7.817424 21.53593
cap_barcelona -19.45758 7.590536 -2.56 0.010 -34.33476 -4.580407
dist .1176725 .0062029 18.97 0.000 .1055151 .1298298
compet -55.83475 12.96561 -4.31 0.000 -81.24688 -30.42262
pax -.000025 .0000174 -1.43 0.152 -.0000592 9.19e-06

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]
Robust

Residual SS = 4858915.932 Root MSE = 73.76
Total (uncentered) SS = 40720620.03 Uncentered R2 = 0.8807
Total (centered) SS = 8777775.386 Centered R2 = 0.4465
Prob > F = 0.0000
F( 6, 886) = 96.46
Number of obs = 893
Statistics robust to heteroskedasticity
Estimates efficient for homoskedasticity only

IV (2SLS) estimation

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
2
2


Se obtienen las elasticidades de las variables de la ecuación de precios y la elasticidad precio de la
demanda, evaluadas con respecto a la media muestral.

p
1
= [
1
,
∗ _
Ðtst

pr
_ = _
opr
oÐtst

] ∗ _
Ðtst

pr
_ = (u.117672S) ∗ _
642.9286
188.89u9
] = u.4uu2972

p
2
= [
2
,
∗ _
Pox

pr
_ = _
opr
oPox
] ∗ _
Pox

pr
_ = −(u.uuuu2S) ∗ _
248892.7
188.89u9
] = −u.uS28448

p
3
= [
3
,
∗ _
Compct

pr
_ = _
opr
oCompct
] ∗ _
Compct

pr
_ = −(SS.8S47S) ∗ _
u.S881696
188.89u9
] = −u.17S2Su1

p
4
= [
4
,
∗ _
:cr
pr
] = _
opr
o:cr
] ∗ _
:cr
pr
] = (S6.Suu67) ∗ _
u.S
188.89u9
] = u.149SS7

p
5
= o
t
,
∗ _
Cop_Borcclono

pr
_ = _
opr
oCop_Borcclono
] ∗ _
Cop_Borcclono

pr
_ = −(19.4S7S8) ∗ _
u.S62S
188.89u9
] = −u.uS77184

p
6
= o
t
,,
∗ _
Cop_HoJrtJ

pr
_ = _
opr
oCop_HoJriJ
] ∗ _
Cop_HoJrtJ

pr
_ = −(6.8S92SS) ∗ _
u.S7S
188.89u9
] = u.u1SS241


Las anteriores coinciden con las expuestas en la Tabla No.18 y que se pueden obtener a partir
del comando mfx, dyex. La elasticidad precio de la demanda por otra parte iguala:


ç
1
= [
7
= −u.u12u41 ∗ 188.89u9 = −2.2744SS


En la Tabla No. 17 se reportan los resultados de la primera estimación del proceso en dos
etapas para la ecuación de precios. Se parte por recordar que las variables de número total de
pasajeros transportados por las aerolíneas (pax) y la variable sobre las características de la
competencia (compet) son endógenas como se distingue de las ecuaciones (1) y (2). Los
instrumentos empleados son la población de las ciudades que son origen y destino (pop) la
renta per cápita (pibc), el turismo per cápita (turc), la variable que tienen como origen Madrid
el hub de Iberia (hub), la posibilidad de competencia intermodal (modal) y el promedio del
Índice de Hirschman-Herfindalh(hha).

La prueba F indica que los instrumentos son significativos, no obstante, Bound, Jaeger y Baker
(1995), señalan que en el marco de incluir más de una variable endógena en la estimación de
dos etapas la prueba F es poco fiable, debido a que es una distribución no estándar.

Se opta entonces por analizar los resultados de las pruebas de instrumentos débiles
explorados en la estimación de la ecuación de demanda y que están incorporados en el
paquete de ivreg2. Se considera inicialmente a los valores críticos propuestos por Stock y Yogo
(2005), contrastados con los estadísticos de Kleibergen-Paap wald y de Cragg-Donald wald.
Para el primer caso, el estadístico de Kleinbergen-Paap wald, que es una generalización de la
prueba de correlación de rango de Anderson, sugiere que los instrumentos pueden no ser los
mejores para la estimación. No obstante, la prueba de Kleinbergen-Paap LM de
sobreidentificación rechaza la hipótesis nula al 95% de nivel confianza. La prueba de Cragg-
Donald no rechaza la hipótesis nula de debilidad de los instrumentos al estándar del 5%. Cabe
mencionar que Baum, Schaffer y Stillman(2007) han advertido sobre la pérdida de confianza
de este estadístico en los escenarios en donde los errores son heterocedásticos.

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
2
3



Los estadísticos de las pruebas de Anderson-Rubin de parámetros estructurales y el de Stock-
Wright LM rechazan la hipótesis nula, por lo tanto los regresores endógenos son relevantes.
Por otra parte, la prueba de Hansen de sobreidentifación rechaza la hipótesis nula de
sobreidentificación.

En cuanto a los coeficientes de las explicativas de la ecuación de precios, en las dos
estimaciones los resultados cualitativos son los mismos, no obstante, la significación de los
regresores varía de forma relevante. El coeficiente de la variable de pasajeros, que es
instrumentalizada en la estimación de dos etapas, muestra una relación negativa con el nivel
de precios, que es un resultado esperado. Sin embargo, es no significativa por VI. En la primera
estimación por MCO el coeficiente muestra de forma similar una relación negativa aunque con
una t negativa.

La variable de competencia en las rutas muestra una relación negativa con el número de
pasajeros en ambos casos MCO y V, podría intuirse que rutas con más competencia intramodal
tienes precios menores. La variable de distancia presenta una relación positiva y
estadísticamente significativa de forma similar en la de variables instrumentales, además es
consecuente con los resultados esperados mayores distancias implican mayores costos y
consecuentemente mayores precios. Asimismo, la variable de identificación entre verano e
invierno incide de forma positiva en los precios en las dos estimaciones.

Finalmente, la variable que captura los efectos de la ampliación en el aeropuerto de Barcelona
se relaciona de forma negativa y significativa con el nivel precios de las rutas, mientras la
ampliación del aeropuerto de Madrid es no significativa en ambas relaciones aunque conserva
una relación positiva.

4. Estimación mediante la técnica de datos de panel (se supone que o
ì
= u).

Inicialmente se comprueba si las variables dependientes siguen un proceso no-estacionario
(raíz unitaria). El contraste de Dickey-Fuller para un panel de datos es una alternativa. Para el
contraste en Stata se emplea al paquete levinlin, que debe ser previamente instalado.

ssc install levinlin  Se instala al paquete levinlin

levinlin pax,lag(1)  El comando levinlin prueba la existencia de raíces unitarias de
orden 1 para la variable pax

levinlin pr,lag(1)  El comando levinlin prueba la existencia de raíces unitarias de
orden 1 para la variable pr









Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
2
4

Tabla No. 19
Pruebas de raíces unitarias para pax y pr





La hipótesis nula del test de Levin y Lin plantea la no existencia de raíces unitarias, en el
primer caso la hipótesis nula no se rechaza mientras en el segundo se rechaza por lo tanto
existiría evidencia de autocorrelación en la variable de precios.

Además se comprueba si los términos de error no están auto correlacionados, mediante el
contraste propuesto por Wooldridge. Antes de hacer la prueba debe instalarse al paquete
st0039.pkg

net install st0039 o alternativamente

findit xtserial

package installation
--------------------------------------------------------------------------------------------------------

package name: st0039.pkg
from: http://www.stata-journal.com/software/sj3-2/

xtserial lpax lpop lpibc lturc hub modal time ver pr  El comando xtserial elabora la
prueba de Wooldridge para la ecuación de demanda

xtserial pr dist pax compet cap_barcelona cap_madrid ver  El comando xtserial
elabora la prueba de Wooldridge para la ecuación de precios.









-0.31991 -9.888 2.31712 0.9898
coefficient t-value t-star P > t
Augmented by 1 lags (average) Truncation: 7 lags
Pooled ADF test, N,T = (56,16) Obs = 784
Levin-Lin-Chu test for pax Deterministics chosen: constant
. levinlin pax,lag(1)
-0.87111 -17.568 -4.87203 0.0000
coefficient t-value t-star P > t
Augmented by 1 lags (average) Truncation: 7 lags
Pooled ADF test, N,T = (56,16) Obs = 784
Levin-Lin-Chu test for pr Deterministics chosen: constant
. levinlin pr,lag(1)

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
2
5

Tabla No. 20
Pruebas de errores correlacionados






La hipótesis nula del test de Wooldridge plantea la no existencia de autocorrelación de primer
orden para la variable de pasajeros los resultados sugieren que no se rechaza la hipótesis nula
mientas en el segundo caso para la variable de precios se rechaza la hipótesis nula, por lo
tanto existiría autocorrelación, que debería ser considerada en la modelización del panel de
datos.

Se elabora el contraste de Hausman en relación a la condición E[Xit’αi] = 0. Con el comando
para el caso de la demanda:


xtreg lpax lpop lpibc lturc hub modal time ver pr,fe  El comando xtreg estima datos
de panel o longitudinales, al final de la especificación se añade los efectos individuales
incorporados en este caso fijos (Fixed Effects, FE).


est store fixed Guarda los resultados de los efectos fijos


xtreg lpax lpop lpibc lturc hub modal time ver pr,re El comando xtreg estima datos de
panel o longitudinales, al final de la especificación se añade los efectos individuales
incorporados en este caso aleatorios (Random Effects, RE).


hausman fixed  Elabora la prueba de Hausman.













Prob > F = 0.9628
F( 1, 55) = 0.002
H0: no first-order autocorrelation
Wooldridge test for autocorrelation in panel data
. xtserial lpax lpop lpibc lturc hub modal time ver pr
Prob > F = 0.0155
F( 1, 55) = 6.239
H0: no first-order autocorrelation
Wooldridge test for autocorrelation in panel data
. xtserial pr dist pax compet cap_barcelona cap_madrid ver

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
2
6

Tabla No. 20
Estimación de la ecuación de demanda por efectos fijos, aleatorios y test de Hausman


Para el caso de los precios se elabora un ejercicio similar:

xtreg pr dist pax compet cap_barcelona cap_madrid ver, fe  xtreg estima datos de
panel o longitudinales, acompañado de fe, desarrolla una estimación de efectos fijos,

est store fixed  Guarda los resultados de los efectos fijos

xtreg pr dist pax compet cap_barcelona cap_madrid ver, re  Estimación por efectos
aletorios.

hausman fixed Elabora la prueba de Hausman.
(V_b-V_B is not positive definite)
Prob>chi2 = 0.0006
= 23.51
chi2(6) = (b-B)'[(V_b-V_B)^(-1)](b-B)
Test: Ho: difference in coefficients not systematic
B = inconsistent under Ha, efficient under Ho; obtained from xtreg
b = consistent under Ho and Ha; obtained from xtreg

pr -.0005012 -.0005373 .0000361 .
ver .1898421 .1901518 -.0003098 .
time .0064141 .0033995 .0030146 .006221
lturc -.1059834 .0994031 -.2053864 .0546033
lpibc 1.631179 1.394162 .2370177 .1104773
lpop -.3330704 .2968109 -.6298813 .199422

fixed . Difference S.E.
(b) (B) (b-B) sqrt(diag(V_b-V_B))
Coefficients
. hausman fixed
.
.
.

rho .90243718 (fraction of variance due to u_i)
sigma_e .28291241
sigma_u .8604355

_cons -6.700523 5.210845 -1.29 0.198 -16.91359 3.512547
pr -.0005373 .000145 -3.71 0.000 -.0008215 -.0002531
ver .1901518 .0211056 9.01 0.000 .1487856 .2315181
time .0033995 .0189329 0.18 0.858 -.0337083 .0405074
modal -.4722376 .2768291 -1.71 0.088 -1.014813 .0703374
hub .7570021 .2769343 2.73 0.006 .2142208 1.299783
lturc .0994031 .068599 1.45 0.147 -.0350486 .2338547
lpibc 1.394162 .3923389 3.55 0.000 .6251915 2.163132
lpop .2968109 .2511979 1.18 0.237 -.1955279 .7891497

lpax Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
Wald chi2(8) = 459.01
overall = 0.3112 max = 16
between = 0.3120 avg = 15.9
R-sq: within = 0.3456 Obs per group: min = 13
Group variable: index Number of groups = 56
Random-effects GLS regression Number of obs = 893
. xtreg lpax lpop lpibc lturc hub modal time ver pr,re
.
.
.
. est store fixed
.
.
.
F test that all u_i=0: F(55, 831) = 147.57 Prob > F = 0.0000

rho .95016172 (fraction of variance due to u_i)
sigma_e .28291241
sigma_u 1.2352909

_cons .4184767 6.223458 0.07 0.946 -11.79707 12.63402
pr -.0005012 .0001435 -3.49 0.001 -.0007828 -.0002196
ver .1898421 .0208268 9.12 0.000 .1489628 .2307214
time .0064141 .0199288 0.32 0.748 -.0327026 .0455308
modal 0 (omitted)
hub 0 (omitted)
lturc -.1059834 .0876775 -1.21 0.227 -.2780788 .0661121
lpibc 1.631179 .4075967 4.00 0.000 .8311392 2.431219
lpop -.3330704 .3207328 -1.04 0.299 -.962612 .2964712

lpax Coef. Std. Err. t P>|t| [95% Conf. Interval]

corr(u_i, Xb) = -0.2793 Prob > F = 0.0000
F(6,831) = 75.44
overall = 0.0024 max = 16
between = 0.0610 avg = 15.9
R-sq: within = 0.3526 Obs per group: min = 13
Group variable: index Number of groups = 56
Fixed-effects (within) regression Number of obs = 893
note: modal omitted because of collinearity
note: hub omitted because of collinearity
. xtreg lpax lpop lpibc lturc hub modal time ver pr,fe

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
2
7


Tabla No. 21
Estimación de la ecuación de precios por efectos fijos, aleatorios y test te Hausman






El test de Hausman prueba la hipótesis nula que las coeficientes estimados por el estimador
eficiente de efectos aleatorios son los mismos que los obtenidos por el estimador consistente
. est store fixed
.
F test that all u_i=0: F(55, 835) = 15.09 Prob > F = 0.0000

rho .49089168 (fraction of variance due to u_i)
sigma_e 67.820209
sigma_u 66.595802

_cons 199.5156 9.469172 21.07 0.000 180.9295 218.1018
ver 56.26341 4.835929 11.63 0.000 46.77141 65.75542
cap_madrid 4.195499 6.601476 0.64 0.525 -8.761938 17.15293
cap_barcelona -21.74991 6.579232 -3.31 0.001 -34.66368 -8.836133
compet -36.20357 8.471779 -4.27 0.000 -52.83206 -19.57509
pax -.0000273 .0000396 -0.69 0.490 -.000105 .0000503
dist 0 (omitted)

pr Coef. Std. Err. t P>|t| [95% Conf. Interval]

corr(u_i, Xb) = -0.0740 Prob > F = 0.0000
F(5,835) = 44.26
overall = 0.1218 max = 16
between = 0.0282 avg = 16.0
R-sq: within = 0.2095 Obs per group: min = 16
Group variable: index Number of groups = 56
Fixed-effects (within) regression Number of obs = 896
note: dist omitted because of collinearity
. xtreg pr dist pax compet cap_barcelona cap_madrid ver, fe
Prob>chi2 = 0.8653
= 1.28
chi2(4) = (b-B)'[(V_b-V_B)^(-1)](b-B)
Test: Ho: difference in coefficients not systematic
B = inconsistent under Ha, efficient under Ho; obtained from xtreg
b = consistent under Ho and Ha; obtained from xtreg

ver 56.26341 56.1245 .1389144 1.405934
cap_madrid 4.195499 4.702178 -.5066794 1.063014
cap_barcel~a -21.74991 -21.37205 -.3778613 1.501617
compet -36.20357 -41.01625 4.812676 4.285739
pax -.0000273 -.000022 -5.29e-06 .0000369

fixed . Difference S.E.
(b) (B) (b-B) sqrt(diag(V_b-V_B))
Coefficients
unexpected and possibly consider scaling your variables so that the coefficients are on a similar scale.
what you expect, or there may be problems computing the test. Examine the output of your estimators for anything
Note: the rank of the differenced variance matrix (4) does not equal the number of coefficients being tested (5); be sure this is
. hausman fixed
.
.
.

rho .16204036 (fraction of variance due to u_i)
sigma_e 67.820209
sigma_u 29.823538

_cons 127.1852 8.794905 14.46 0.000 109.9475 144.4229
ver 56.1245 4.627047 12.13 0.000 47.05566 65.19335
cap_madrid 4.702178 6.515327 0.72 0.470 -8.067627 17.47198
cap_barcelona -21.37205 6.405578 -3.34 0.001 -33.92675 -8.817344
compet -41.01625 7.307769 -5.61 0.000 -55.33921 -26.69328
pax -.000022 .0000141 -1.56 0.119 -.0000498 5.70e-06
dist .1143365 .009278 12.32 0.000 .096152 .1325209

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
Wald chi2(6) = 377.29
overall = 0.4497 max = 16
between = 0.7468 avg = 16.0
R-sq: within = 0.2092 Obs per group: min = 16
Group variable: index Number of groups = 56
Random-effects GLS regression Number of obs = 896
. xtreg pr dist pax compet cap_barcelona cap_madrid ver, re

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
2
8

de efectos fijos. Si se obtiene un p-valor significativo habría evidencia que respaldaría la
utilización de efectos fijos. Para la estimación de los parámetros de los regresores de la
ecuación de demanda la prueba de Hausman sugiere la utilización de efectos fijos, mientas en
el segundo caso, en la estimación de la ecuación de precios, podría estimarse por la
incorporación de efectos individuales aleatorios en el término de error.

De acuerdo a Green (1998), los efectos fijos son adecuados cuando hay certeza de que las
diferencias entre las observaciones de corte transversal se pueden modelizar como un cambio
en el parámetro de la función de regresión de un individuo a otro. Este contexto es común en
el caso de los modelos que contemplan a todos los individuos de la población, o cuando el
tamaño de la muestra es suficientemente extenso. Alternativamente puede suceder que los
términos constantes específicos de cada unidad muestral, en lugar de fijos, vengan
distribuidos aleatoriamente entre las unidades de corte transversal. Por ejemplo en una
muestra de 500 individuos que pretenden representar a una población de un millón de
agentes.

Por otra parte, una restricción adicional para la utilización de efectos fijos radica en que los
supuestos de partida del estimador eficiente son altamente restrictivos. Recordando los
supuestos para los términos aleatorios E|c
ì]
] = E|u
ì
] = u, E|u
ì
2
] = o
u
2
, E|c
ì
2
] = o
c
2
, E|c
ì]
u
ì
] =
u para cado i ≠ ], E(c
ìt
, c
]s
) = u si i ≠ ] o t ≠ s y finalmente E(u
ì
, u
]
) = u si i ≠ ]. Por lo tanto,
el efecto individual no podrá estar correlacionado con ninguna de las otras variables
explicativas.

En este, caso la ecuación de precios cuya mejor estimación debería emplear a los efectos
aleatorios, podría requerir la utilización de variables instrumentales de acuerdo a la
propuesta de Hausman y Taylor(1981). Po lo tanto, inicialmente se plantea un modelo de
efectos aleatorios considerado a todas las variables explicativas como exógenas.
Posteriormente, se relajan los supuestos de la estimación básica y se considera la existencia de
autocorrelación temporal y heterocedasticidad.


xtreg pr dist pax compet cap_barcelona cap_madrid ver, re  Estima la regresión con
efectos aleatorios( random effects, re) con los supuestos básicos y más restrictivos.

xtregar pr dist pax compet cap_barcelona cap_madrid ver, re lbi  Estima la regresión
con efectos aleatorios( random effects, re) considerando autocorrelación (añadiendo ar
al comando xtreg).

xtgls pr dist pax compet cap_barcelona cap_madrid ver, panels(heteroskedastic)
corr(ar1)  Estima la regresión con efectos aleatorios considerando
heterocedasticidad y autocorrelación.











Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
2
9

Tabla No. 21
Distintas estimaciones de efectos aleatorios para la ecuación de precios con explicativas exógenas.



.
.

_cons 127.4984 5.693613 22.39 0.000 116.3391 138.6577
ver 41.54536 3.272664 12.69 0.000 35.13105 47.95966
cap_madrid 8.158505 5.635425 1.45 0.148 -2.886725 19.20373
cap_barcelona -27.16754 5.556928 -4.89 0.000 -38.05892 -16.27616
compet -39.99735 5.31374 -7.53 0.000 -50.41209 -29.58261
pax -.000011 5.53e-06 -2.00 0.046 -.0000219 -2.04e-07
dist .1086578 .0059911 18.14 0.000 .0969154 .1204002

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]

Prob > chi2 = 0.0000
Wald chi2(6) = 646.95
Estimated coefficients = 7 Time periods = 16
Estimated autocorrelations = 1 Number of groups = 56
Estimated covariances = 56 Number of obs = 896
Correlation: common AR(1) coefficient for all panels (0.1406)
Panels: heteroskedastic
Coefficients: generalized least squares
Cross-sectional time-series FGLS regression
. xtgls pr dist pax compet cap_barcelona cap_madrid ver, panels(heteroskedastic) corr(ar1)
.
.
.
Baltagi-Wu LBI = 2.2316188
modified Bhargava et al. Durbin-Watson = 2.1134949

theta .45428127
rho_fov .11678449 (fraction of variance due to u_i)
sigma_e 68.261837
sigma_u 24.822024
rho_ar -.05941782 (estimated autocorrelation coefficient)

_cons 126.398 8.612567 14.68 0.000 109.5177 143.2784
ver 56.01292 4.441825 12.61 0.000 47.3071 64.71873
cap_madrid 5.497542 6.831119 0.80 0.421 -7.891204 18.88629
cap_barcelona -22.07281 6.728212 -3.28 0.001 -35.25987 -8.885757
compet -40.82922 7.459282 -5.47 0.000 -55.44915 -26.2093
pax -.0000206 .0000139 -1.49 0.137 -.0000478 6.57e-06
dist .1150628 .0089942 12.79 0.000 .0974344 .1326912

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, Xb) = 0 (assumed) Prob > chi2 = 0.0000
Wald chi2(7) = 396.67
overall = 0.4496 max = 16
between = 0.7465 avg = 16.0
R-sq: within = 0.2092 Obs per group: min = 16
Group variable: index Number of groups = 56
RE GLS regression with AR(1) disturbances Number of obs = 896
. xtregar pr dist pax compet cap_barcelona cap_madrid ver, re lbi
.
.
.

rho .16204036 (fraction of variance due to u_i)
sigma_e 67.820209
sigma_u 29.823538

_cons 127.1852 8.794905 14.46 0.000 109.9475 144.4229
ver 56.1245 4.627047 12.13 0.000 47.05566 65.19335
cap_madrid 4.702178 6.515327 0.72 0.470 -8.067627 17.47198
cap_barcelona -21.37205 6.405578 -3.34 0.001 -33.92675 -8.817344
compet -41.01625 7.307769 -5.61 0.000 -55.33921 -26.69328
pax -.000022 .0000141 -1.56 0.119 -.0000498 5.70e-06
dist .1143365 .009278 12.32 0.000 .096152 .1325209

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
Wald chi2(6) = 377.29
overall = 0.4497 max = 16
between = 0.7468 avg = 16.0
R-sq: within = 0.2092 Obs per group: min = 16
Group variable: index Number of groups = 56
Random-effects GLS regression Number of obs = 896
. xtreg pr dist pax compet cap_barcelona cap_madrid ver, re

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
3
0

Ahora se supone un modelo de efectos aleatorios (α
i
es un término de error aleatorio) con variables
explicativas endógenas en la ecuación de precios:

xtivreg pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid
ver, re  Se instrumentaliza a las variables pax compet que potencialmente están
correlacionadas con el término de error. Los instrumentos son: pop pibc turc hub
modal hha.


Tabla No. 21
Distintas estimaciones de efectos aleatorios para la ecuación de precios con variables explicativas
endógenas


Ahora se pueden corregir los problemas de autocorrelación, incorporando el retardo de la endógena
como variable explicativa, con el comando:

by index: gen lag1 = pr[_n-1]

by index: gen lag2 = pr[_n-2]

xtivreg pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid
ver lag2, re






Instruments: dist cap_barcelona cap_madrid ver pop pibc turc hub modal hha
Instrumented: pax compet

rho .14027334 (fraction of variance due to u_i)
sigma_e 73.627506
sigma_u 29.740445

_cons 134.074 9.070743 14.78 0.000 116.2956 151.8523
ver 56.02831 4.777263 11.73 0.000 46.66505 65.39157
cap_madrid 8.225267 6.847352 1.20 0.230 -5.195296 21.64583
cap_barcelona -18.15336 6.647768 -2.73 0.006 -31.18274 -5.123971
dist .1210661 .0094564 12.80 0.000 .102532 .1396003
compet -73.09293 18.5542 -3.94 0.000 -109.4585 -36.72736
pax -4.05e-06 .0000295 -0.14 0.891 -.0000619 .0000538

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
Wald chi2(6) = 373.91
overall = 0.4402 max = 16
between = 0.7412 avg = 15.9
R-sq: within = 0.1973 Obs per group: min = 13
Group variable: index Number of groups = 56
G2SLS random-effects IV regression Number of obs = 893
. xtivreg pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid ver, re

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
3
1

Tabla No. 21
Estimación de la ecuación de precios con efectos aleatorios variables instrumentales y correcciones de
autocorrelación.



De acuerdo a las pruebas de Levin y Lin, Wooldridge y Hausman. Para la ecuación de demanda
es conveniente una modelización por efectos fijos. Además, se recuerda que la muestra
contiene un amplio número de cortes, las 56 rutas aéreas al interior de España, por lo que una
estimación por efectos fijos podría ser adecuada. En el caso de la ecuación de precios con
efectos aleatorios variables instrumentales y correcciones de autocorrelación, cuyos
resultados se presentan en la Tabla No. 21, podría resultar la mejor estimación. En
consideración de los resultados de las pruebas de autocorrelación, heterocedasticidad y de
Hausman, las cuales sugirieron la existencia de autocorrelación, endogenidad y consideraron a
los efectos aleatorios preferibles ante efectos individuales fijos. Asimismo, los estadísticos de
bondad del ajuste y minimización de los errores se comportan mejor en este último modelo
frente a los anteriores. Cabe considerar además la naturaleza de los cortes y las series de la
ecuación de precios que se fundamente ampliamente en promedios de la población total de
viajes al interior de España.





hha
Instruments: dist cap_barcelona cap_madrid ver lag2 pop pibc turc hub modal
Instrumented: pax compet

rho 0 (fraction of variance due to u_i)
sigma_e 99.33363
sigma_u 0

_cons 95.57695 8.737974 10.94 0.000 78.45084 112.7031
lag2 .2863245 .038641 7.41 0.000 .2105896 .3620594
ver 40.77706 5.73865 7.11 0.000 29.52951 52.02461
cap_madrid 11.01696 7.090676 1.55 0.120 -2.880514 24.91442
cap_barcelona -18.58112 7.380812 -2.52 0.012 -33.04724 -4.114991
dist .0811723 .0079511 10.21 0.000 .0655883 .0967562
compet -37.95219 14.90916 -2.55 0.011 -67.1736 -8.730774
pax -.0000214 .000019 -1.13 0.260 -.0000588 .0000159

pr Coef. Std. Err. z P>|z| [95% Conf. Interval]

corr(u_i, X) = 0 (assumed) Prob > chi2 = 0.0000
Wald chi2(7) = 692.89
overall = 0.4792 max = 14
between = 0.8423 avg = 13.9
R-sq: within = 0.2005 Obs per group: min = 11
Group variable: index Number of groups = 56
G2SLS random-effects IV regression Number of obs = 781
. xtivreg pr dist (pax compet = pop pibc turc hub modal hha) cap_barcelona cap_madrid ver lag2, re
.
.
.
r(110);
lag2 already defined
. by index: gen lag2 = pr[_n-2]
.
r(110);
lag1 already defined
. by index: gen lag1 = pr[_n-1]

Jorge Salgado Sistema de Ecuaciones STATA
P
á
g
i
n
a
3
2

Bibliografía:

Baum, C. (2006), An Introduction to Modern Econometrics Using Stata, Stata Press.

Baum, C., Schaffer, M., Stillman, S. (2007), Enhanced routines for instrumental
variables/generalized method of moments estimation and testing, The Stata Journal, 7,
Number 4, pp. 465–506.

Cameron, C. y Trivedi, P. (2005), Microeconometrics Methods and Applications, Cambridge
University Press.

Cameron C., Trivedi P. (2009), Microeconometrics Using Stata, A Stata Press Publication

Greene W. (2003), Econometric Analysis, Prentice Hal.

Sign up to vote on this title
UsefulNot useful