You are on page 1of 338

Entrenamiento Especializado en Estimación y

Análisis de Cortes Transversales y Series de


Tiempo en EViews.

Miguel Angel Bello


Instructor
Entrenamiento Especializado en Estimación y
Análisis de Corte Transversal y Series de Tiempo
con EViews.

Miguel Angel Bello


Instructor
Etapas del Análisis Econométrico

Teoría Económica

Modelo Econométrico Data

Estimación

Evaluación del Modelo/


Diagnóstico

¿El modelo es adecuado?

NO SI

Utilizar el modelo: pronóstico


y análisis de política
Temario
1. ¿Qué es EViews?
2. Novedades de EViews 10
3. Manejo de Interfaz
4. Importación de datos
5. Análisis Estadístico Descriptivo
6. Gráficos
7. Análisis Inferencial
8. Regresión Simple y Múltiple
9. Modelos ARIMA
10. Modelos Logit y Probit
EViews

• Provee métodos sofisticados de análisis de datos y cálculos estadísticos y econométricos, todo en


ambiente Windows. Alguna de las utilidades de EViews incluyen análisis y evaluación científica de
datos, análisis financiero, predicción macroeconómica, simulación y análisis de costos, entre otros
procedimientos

• Pese a que EViews fue desarrollado por economistas, y sus usos más importantes son para áreas
relacionadas con la economía, EViews no se limita tan solo al análisis de series económicas ya que es
posible su aplicación en diferentes áreas como las ciencias sociales, ciencias políticas, biología y
ciencias puras.
EViews
¿Qué podemos encontrar?

1. Manipulación de bases de datos


2. Estadística descriptiva
3. Análisis de regresión
4. Herramientas de Pronóstico
5. Pruebas de evaluación de supuestos
6. Análisis de series de tiempo univariadas y multivariadas
7. Simulaciones
8. Programación
9. Análisis de herramientas avanzadas (componentes principales, estado espacio, etc.)
Novedades en EViews 10
• Contiene un amplio rango de mejoras y cambios. El siguiente es un breve resumen de las novedosas
características de la versión 9:

• INTERFAZ

–Captura de comandos desde la interfaz interactiva.


–Interfaz de comandos acoplables y ventana de captura.
–Vista previa de bases de datos y archivos de trabajo (F9)
Novedades en EViews 10
• GESTIÓN DE DATOS
–Mejoras en el vinculo e importación de datos.
–Nueva y poderosa interfaz para datos FRED (Federal Reserve Economic Data)
–Lectura directa y acceso de escritura a datos almacenados en servicios de nube.
–Formatos de tabla para salvar e importar datos con ajustes personalizados.
–Nuevos métodos de conversión de frecuencias.

• TABLAS Y GRAFICOS
–Nuevos tipos de gráficos mixtos
–Panorámica y aumento (Zoom) de gráficos
–Visualización en slides de gráficos múltiples
–Dibujo de rectángulos y elipses
–Tablas y gráficos pueden ser salvados en formato LaTeX
Novedades en EViews 10
• ECONOMETRIA Y ESTADSITICA
–Pronóstico
•ARIMA Automático
•Evaluación de Pronósticos y pruebas de combinación
•Promedio de Pronósticos
•Pronóstico VAR

• ESTIMACIÓN
–Modelos Autorregresivos con Rezados Distribuidos (ARDL) con selección automática de rezagos
–Máxima Verosimilitud y Mínimos Cuadrados Generalizados para estimaciones ARMA
–Estimación de medias grupadas para estimación de modelos de datos panel ARDL
–Regresión por Umbrales
–Nuevo motor de Optimización
Novedades en EViews 10
• PRUEBA Y DIAGNOSTICOS

–Raíz Unitaria con quiebres estructurales


–Pruebas de dependencia en cortes transversales
–Pruebas para efectos de panel.
Interfaz del Usuario

• Historial de archivos de trabajo automático y controlado por el usuario y copia de seguridad (“Workfile
Backup Snapshots").

• Mejora de las ventanas de registro y mensajes ("Enhanced Logging Abilities").

• Visualización de estadísticas en vivo para los datos en la vista de hoja de cálculo ("Live Statistics Display").

• Compatibilidad con nombres de objeto de 300 caracteres ("Long Object Names").

• Conectividad R mejorada ("Improved R Connectivity”").


Workfile Backup Snapshots

 EViews 10 ofrece una nueva función de copia


de seguridad de archivos de trabajo, que
denominamos “Snapshots". El sistema de
Snapshots se puede utilizar para guardar el
estado actual del archivo de trabajo, restaurar
un archivo de trabajo en un estado anterior o
investigar los cambios realizados en su archivo
de trabajo entre diferentes sesiones.
 Puede configurar EViews para tomar
automáticamente Snapshots a intervalos
periódicos, también se pueden tomar
manualmente cada vez que desee guardar el
estado actual del archivo de trabajo.
 Puede usar el sistema de Snapshots para
mostrar las propiedades de sus copias de
seguridad y para volver a una versión
particular de sus datos
Live Statistics Display
 Las vistas de hojas de cálculo tanto de series como
de grupos muestran ahora estadísticas interactivas.
Cuando se abre una hoja de cálculo, las estadísticas
se calculan utilizando todos los datos de la hoja de
cálculo.

 Haciendo doble clic en la barra inferior se abre un


menú donde se pueden cambiar las estadísticas
mostradas. Se pueden mostrar al mismo tiempo un
máximo de seis estadísticas.

 Las estadísticas se vuelven a calcular cada vez que se


resalta un grupo de celdas.
Long Object Names
EViews 10 aumenta la longitud máxima de nombre de objeto de 24 a 300
caracteres.
Improved R Connectivity
Versiones anteriores de EViews conectadas a R a través
de un programa de terceros. Encontramos que algunos
usuarios tuvieron dificultades para configurar este
software para trabajar en su entorno informático.
EViews ahora admite la integración de R directamente,
eliminando la necesidad de software de terceros.
Simplemente instale EViews 10 y R en el mismo equipo
(EViews fue desarrollado y probado con la versión 3.2.3
de R. Debe tener la versión 3.2.3 o más reciente
instalada en la máquina que ejecuta EViews).
EViews fue desarrollado y probado con R versión 3.2.3.
Debe tener la versión 3.2.3 o posterior instalada en la
máquina que ejecuta EViews.
Si actualmente no tiene instalado R, simplemente vaya al
siguiente sitio y descargue la última versión:
https://cran.r-project.org
Verifique que los nuevos componentes de la interfaz de
conector EViews R estén registrados correctamente
ejecutando el comando EViews REGCOMPONENTS
Manipulación de Datos
EViews ahora admite la integración de R directamente, eliminando la necesidad de software de terceros.
Simplemente instale EViews 10 y R en el mismo equipo
Una vez que instale R, puede usar comandos de EViews existentes, como XRUN y XGET para mover datos entre
EViews y R. Más importante aún, EViews 10 ahora ofrece soporte de archivos de área de trabajo RDATA. Esta ayuda
significa que puede guardar un archivo de trabajo de EViews (una página a la vez) directamente en un nuevo
archivo de área de trabajo RDATA utilizando la base de datos EViews estándar y la interfaz de archivo.
Puede utilizar la interfaz interactiva Proc / Save As estándar para guardar un espacio de trabajo RDATA o puede
utilizar los comandos wfsave o pagesave para realizar la operación: wfsave (type = rdata) c: \ archivos \ tq.rdata
Cada objeto simple (serie, alfa, matriz, vector y escalar) de la página actual del archivo de trabajo se convertirá en
una estructura de datos R apropiada y se guardará en el nuevo archivo RDATA.
También puede abrir un archivo RDATA como archivo de trabajo EViews o como una base de datos EViews. Al igual
que con el almacenamiento de datos, puede utilizar la interfaz interactiva seleccionando File/Open/Foreign Data as
Workfile... or File/Open/Database. ... o puede emitir comandos.
Por ejemplo, el comando dbopen (tipo = rdata) c: \ files \ data.rdata
abrirá el archivo RDATA en su propia ventana de base de datos EViews. Puede ver todos los objetos R que se
encuentran en esta base de datos y FETCH individualmente los objetos que desea en su archivo de trabajo
Attribute Import and Export
Los datos suelen ir acompañados de diversos tipos de
metadatos. EViews ahora admite la lectura en atributos
de serie personalizados (junto con los datos de serie)
durante una importación desde Excel y archivos de
texto.
El asistente de importación EViews 10 se ha modificado
para admitir la lectura en atributos de serie
personalizados que se especifican como filas de
encabezado. Por ejemplo, la hoja de cálculo Excel
siguiente tiene atributos personalizados para
Descripción, SKU y Estado especificados en las filas de
encabezado
Al arrastrar y soltar este archivo en EViews 10, aparece
el nuevo cuadro de diálogo Asistente de importación. En
la segunda página (Paso 2), ahora le permitimos
cambiar la forma en que se usa cada fila de encabezado

De forma predeterminada, EViews tratará cada fila de


encabezado como un campo Nombre, pero puede
cambiar el tipo de fila para cada encabezado
seleccionando (o especificando un valor personalizado
para) el nombre del atributo
Eurostat, ECB, And UN Data
SDMX Bases de datos proporcionan acceso a una
lista de conjuntos de datos que ofrecen una amplia
gama de datos disponibles públicamente.
Tanto las versiones Standard como Enterprise de
EViews ofrecen acceso a datos de Eurostat, BCE
(Banco Central Europeo) y Naciones Unidas
(Naciones Unidas) utilizando SDMX Web Services.
Tenga en cuenta que se necesitará una conexión a
Internet para obtener datos online de SDMX. Para
obtener más información sobre los conjuntos de
datos, consulte:

http://ec.europa.eu/eurostat/data/database

https://ec.sdw-wsrest.ecb.europa.eu

http://data.un.org/WS/
World Bank Data
EViews 10 ofrece una interfaz personalizada a los datos del
Banco Mundial. World Bank Open Data proporciona acceso a
una lista de conjuntos de datos que ofrecen acceso a datos de
desarrollo global. Estas bases de datos ofrecen una amplia
variedad de indicadores disponibles libremente sobre el
desarrollo en países de todo el mundo.
Para más información sobre los conjuntos de datos del Banco
Mundial,
http://data.worldbank.org.
Tanto las versiones Standard como Enterprise de EViews
ofrecen acceso al Banco Mundial. Tenga en cuenta que se
requiere una conexión a Internet para obtener los datos del
Banco Mundial.
EViews ofrece una interfaz personalizada para el Banco Mundial.
La interfaz incluye un navegador personalizado para navegar y
recuperar datos del Banco Mundial.
Gráficos y Tablas
1. Bubble Plots
El gráfico de burbujas requiere un mínimo de
tres series (un triplete en serie). Al crear un
diagrama de burbujas de un objeto de grupo,
tiene dos formas de definir el triple: First vs All o
XYZ triplets.
1. Updating Series in Graph Objects
2. Graph View Text Annotation
3. Interactive Observation Annotation
4. New Templates
5. Element Colors
6. Table Row Sorting
Econometría y Estadística
EViews 10 ofrece soporte para varias covariancias de
coeficientes robustos de heteroscedasticidad nuevas en la
regresión de mínimos cuadrados. Estas alternativas
proporcionan diferentes enfoques para explicar el sesgo en
muestras finitas, ajustando los pesos dados a los residuos
sobre la base del apalancamiento (Long y Ervin, 2000;
Cribari-Neto y da Silva, 2011).
Esta clase general de heteroscedasticidad coherente
covarianza sándwich estimadores se puede escribir como:

donde d son los pesos específicos de la observación que se


eligen para mejorar el rendimiento finito de la muestra.
CAPACIDAD

Observaciones máximas por serie: (Versión de 4 millones (por defecto). Puede incrementarse
32 bits) hasta 15 millones si se desea, sujeto a
restricciones de memoria.
Observaciones máximas por serie: (Versión de 120 millones.
64 bits)
Observaciones totales (series Limitado únicamente por la RAM disponible.

Máximo número de objetos por archivos de Limitado únicamente por la RAM disponible.
trabajo:
Máximo número de objetos por base de datos: Limitado a 10 millones de objetos, 64 Gb o
espacio disponible en el disco.
MANEJO DE LA INTERFAZ
Ventana
Menú Principal
Ventana de Comandos

Captura de Comandos

Ventana de Dialogo

Área de Trabajo

Línea de Estado
Tipos de Objeto

Los objetos más comunes en


EViews son: Ecuación, Grupo y
Serie
Análisis de la Información
Importación de Datos:

• Excel incluyendo la versión 2013


• Texto
• Bases de Datos (Access & SQL)
• SAS, SPSS STATA, GAUSS, GiveWin, Rats, TSP, entre otros.
• Ingreso Manual de Bases de Datos
Creando un Nuevo Archivo de Trabajo: Workfile
Eviews Workfile

Barra de titulo

Barra de Herramientas

Ventana de trabajo

Workfile:
 Contiene al menos una
página de trabajo
 Cada página contiene
una lista de objetos
Eviews Workfile
Nombre del Workfile
RESULTS
Estructura del Workfile
 Los datos en este ejemplo
son de tipo serie de tiempo,
los cuales tienen como
frecuencia horizontes
trimestrales desde 1980
hasta 2012.

 Range: muestra el rango


completo de la información
en el workfile de esta  Sample: Es una parte de la información
manera s tiene un rango que se esta trabajando actualmente. En
desde Q1 1980 hasta Q4 este ejemplo, la muestra es desde Q3 1990
2012 hasta Q1 2012.
Eviews Workfile y sus Objetos

• Esta ventana muestra una lista de


Objetos en el workfile.
• Existe un color diferente para cada
tipo de Objeto:
 Icono Amarillo es un objeto de
información.
 Icono Azul es un objeto de
estimación.
 Icono Verde es un objeto de
visualización (tablas, gráficos, etc…)
• Cada Objeto tiene su propio menú.
Comandos
• El panel de comandos proporciona un
registro de desplazamiento de los comandos
escritos.
• Puede desplazarse hacia arriba para ver los
comandos ejecutados anteriormente.
• Si presiona Enter en las líneas anteriores,
EViews copiará la línea donde está el cursor
y ejecutar ese comando de nuevo.
• Para recuperar los comandos anteriores en
el orden en el que fueron usados oprima
"CTRL + ARRIBA". El último comando usado
se mostrará en la ventana de comandos.
• Para un registro de los últimos 30 comandos,
pulse "CTRL + J".
Crear un Workfile
Principios de funcionamiento en EViews:
• Para cualquier trabajo en EViews se deberá crear un Workfile- que son lugar de los objetos de EViews.
• A diferencia de otros tipos de programas, se debe crear un Workfile en EVIews.
• Cada Worfile contiene una o más páginas de trabajo, cada uno con sus propios objetos.
• Para configurar un archivo de trabajo, puede:
–Crear un archivo de trabajo "en blanco" (esto requiere estructuración).
–Crear un archivo de trabajo mediante la lectura de una fuente extranjera.
Crear un Workfile
Para crear un nuevo Workfile se debe describir la estructura de los datos (por ejemplo, trimestral,
mensual, fechas de inicio / final, etc.)
La estructura determina el número de observaciones (por ejemplo, las filas) que cada serie contiene en
la página Workfile
Hay tres tipos generales de estructura de archivo de trabajo:
–Fechado - frecuencia regular (datos de Series de Tiempo)
–Sin fecha/ Sin Estructura (principalmente Corte Transversal)
–Panel Balanceados (Datos de Panel)
Un Workfile simple con una sola página tiene un tipo de estructura. Sin embargo, en varias páginas de
un Workfile, se pueden tener diferentes estructuras.
Crear un Workfile
Para crear un Workfile:
1. Click File > New >Workfile

2. Se abrirá una ventana en el menú principal. Hay


tres cuadros que se deben utilizar para
Estructurar un Workfile

3. Área 1: Se debe especificar el tipo de estructura


de la información.

4. Área 2: Se debe especificar la frecuencia de la


información.

5. Área 3: Opcional, se debe ingresar el nombre del


Workfile como también el nombre de la página.
Crear Workfile: Fuentes Externas
EViews puede crear un nuevo archivo de la palabra mediante la apertura de los datos de una variedad de formatos
(Excel ®, HTML, CSV, ASCII, RATAS, Stata, SPSS, SAS, etc ...).

EViews reconoce automáticamente el formato y la estructura de archivos

Basta con abrir el archivo en EViews y dejar que la aplicación haga el resto.

Hay un número de maneras de abrir un archivo en EViews:


• Arrastrar / soltar un archivo en la ventana principal de EViews (este es el método más fácil).
• Haga clic en File → Open → Foreign Data as Workfile.
• Copiar / Pegar como Nuevo Workfile en EViews.
Páginas en el Workfile
• Un Workfile es una colección de páginas.
• Todos los datos en una página de EViews comparten un identificador común:
–Por ejemplo, todos los datos del archivo Time_Series.xls están con fechas y tienen la misma frecuencia (en
este caso trimestral).
–Del mismo modo, todos los datos del archivo cross-section.xls no están con fechas y comparten “State" como
un identificador común.
–Estos datos pueden ser recogidos y organizados en páginas separadas.
• EViews permite crear muchas páginas de datos con diferentes identificadores dentro del mismo Workfile.
• Varias páginas de Workfile son útiles porque permiten:
–Juntar datos no relacionados entre sí para facilitar la accesibilidad.
–Mantener múltiples datos de frecuencia (por ejemplo, tanto trimestral y anual en el mismo Workfile)
–Enlazar datos con diferentes identificadores.
Crear una Nueva Página en el Workfile
• Existen muchas maneras para crear nuevas
páginas.

Para añadir una página:


 Click en la pestaña New Page que
se encuentra en la parte inferior de la
ventana de EViews. Aparecerá un
menú desplegable, el cual indica una
variedad de maneras para crear
nuevas páginas.
Ejemplo 1: Crear una Nueva Página
Una forma de crear una nueva página es mediante la descripción de su estructura. Usted se dará cuenta de que esto crea una
nueva página desde cero.
Creación de una nueva página con la descripción de su estructura:
•En la pestaña New Page haga clic en Specify by Frequency/Range.
•El Workfile abre un cuadro de diálogo.
•Utilice el cuadro de diálogo para especificar el Workfile que desea crear (es decir, de fecha, mensual, etc.).
Ejemplo 2: Crear una Nueva Página
Otra forma de crear una nueva página es mediante la carga
de los datos existentes.

Crear una página con los datos de carga:

• En la pestaña New Page dar Click en Load/Import Workfile


Page

• El cuadro de diálogo abre, esto permite navegar y localizar


el archivo de datos. A pesar de que el nombre indica que
está cargando una página de archivo de trabajo, este
comando puede cargar con la misma facilidad datos de
Excel, archivos de texto o cualquier otro formato.

• Para cargar cualquier otro formato, tiene que cambiar la


extensión del archivo de EViews.
Muestras
• Las muestras son conjuntos (generalmente subconjuntos)
de observaciones en un archivo de trabajo.
(4)
• Las muestras pueden ser especificadas en rangos de las
observaciones como también utilizando condicionales “if“
(1)
• Hay diferentes maneras para cambiar la muestra en el (2)
Workfile:

(3)
 Click en el botón Sample en la barra de herramientas (1).
 Doble click sobre Sample en la ventana del Workfile(2).
 Seleccionar Proc/Set Sample desde el menú Workfile(3).
 Escribir “smpl” en la ventana de comandos(4).
Cambio de Muetra en Series de Tiempo
Al utilizar cualquiera de los métodos anteriores para
Change/ Set la muestra, EViews abre el cuadro de diálogo
Se debe especificar la muestra en parejas (es decir, como
la fecha u observación en pares).
Cambiar la muestra de enero 1990 a diciembre 2011:

1. Seleccione cualquiera de los métodos anteriores (1-3).


2. El cuadro de diálogo de la muestra se abre. En la parte
superior del cuadro escriba la nueva fecha de la
muestra en pares con espacios entre los pares.
1990m1 2011m12
3. Haga clic en OK.
4. El rango es el mismo que antes (enero 1950 hasta
mayo 2012), pero la muestra ha cambiado como
especificamos.
5. Tenga en cuenta que después del cambio de la
muestra, todos los análisis (gráficos, estadísticas,
regresiones) se llevan a cabo sobre la nueva muestra.
Comandos Claves en la Selección de la Muestra

Función Descripción
@all Se refiere al rango del Workfile (incluye todas las observaciones)

@first @last También se refiere al rango del Workfile (todas las observaciones)

@first @first Solo incluye la primer observaciones

@last @last Solo incluye la última observación


Cambio de Muestra con Condicionales
La parte inferior del cuadro de diálogo de la muestra permite añadir condiciones
para probar las especificaciones.
Supongamos que desea restringir la muestra sólo a aquellas observaciones
cuando “payroll" aumenta en comparación con el mes anterior en el período
1990m1-2011m12.

Definir muestra usando “if" :


1. Seleccione cualquiera de los métodos (1-3) que le permiten cambiar la
muestra.
2. El cuadro de diálogo de la muestra se abre. En la parte superior del cuadro,
escriba primero las fechas de muestra (en pares).
1990m1 2011m12
3. En la parte inferior del cuadro de la muestra, escriba:
payroll-payroll(-1)> 0
Nota: payroll(-1) denota el primer
Esta especificación le ordena a EViews que solo incluya aquellas observaciones cuando payroll rezago de la serie payroll.
aumenta con respecto al mes anterior.
4. Haga clic en OK.
Cambio de Muestra con Condicionales
•Supongamos que se quiere restringir la muestra cuando
“unemployment” esta entre 3% y 6% o cuando “payroll” no
muestra cambios con respecto al anterior mes.

Definir muestra usando “if" :

1. Seleccione cualquiera de los métodos (1-3) que le


permiten cambiar la muestra.
2. El cuadro de diálogo de la muestra se abre. En la
parte superior del cuadro, escriba primero las fechas
de muestra (en pares).
1990m1 2011m12
3. En la parte inferior del cuadro de la muestra,
escriba:
(unemployment>=3 and unemployment<=6) or
payroll=payroll(-1)
Esta especificación le ordena a EViews que solo incluya aquellas
observaciones cuando payroll no cambia con respecto al mes
anterior o cuando unemployment se encuentra entre 3% y 6%.
4. Haga clic en OK.
Rangos de Muestra y Expresiones Matemáticas
Los rangos de muestra se pueden definir mediante el uso de expresiones matemáticas.
Esto se utiliza normalmente para definir una ventana de ancho fijo de observaciones.

Función Descripción
@first+12 @last Excluye las primeras 12 observaciones.

@first @first+11 Mantiene solo las primeras 12 observaciones.

@first @last-15 Excluye las últimas 15 observaciones.

@last-15 @last Mantiene solo las últimas 15 observaciones.

1960m3 1960m3+11 Define una muestra con 12 observaciones comenzando en marzo


de 1960-febero 1961.
Objeto: Muestra
Si se necesita trabajar con un número de diferentes
muestras, esto puede ser útil para definir las muestras
como Objetos.
Para crear un objeto Muestra
1. Seleccionar Object → New Object desde el menú.
2. Click en la opción Sample, Nombrarla (en este caso
Muestra1), click OK.
3. El cuadro de dialogo Sample se abre; se debe especificar la
muestra.
• Vamos a crear dos objetos muestra:
 Muestra1: incluye todas las observaciones menos las últimas
100.
 Muestra2: incluye solo las últimas 100 observaciones.
Nota: antes de proceder con estos dos objetos, se debe contemplar todas las
observaciones en el Workfile, para esto escriba en la ventana de comandos:

smpl @all
Objeto: Muestra
Series y Grupos

Las Series y los Grupos son los objetos más importantes en EViews.

• El valor actual numérico de las observaciones se mantienen en un objeto Series.

• Una colección se series (múltiples observaciones en columnas) abarca un objeto Grupo.


Series y Grupos
Hay un número de maneras para crear una nueva (vacía) serie en
Eviews.

Crear una Serie: Ejemplo 1


1. Hacer un click en la página Timeseries.
2. Seleccionar Object → New Object desde el menú.
3. Click en la opción Series, nombrarla (en este caso Series1).
4. Click OK.
Colocar los datos en un Workfile existente
Para pequeñas series de datos, es posible que desee
introducir los datos.
Al escribir datos en una serie:
1. Haga click en la página “timeseries” y abrá una de
la nuevas series con valores vacíos (NA) que
hemos creado anteriormente. Para este ejemplo,
vamos a dar click en “Serie1".
2. Haga clic en el botón para activar el modo de
edición (nota: con Edit +/- depende de la
configuración de opciones,).
3. Comience a escribir los datos.
Crear Nuevas Series a partir de una Existente
También puede crear una serie mediante la transformación de una serie
existente.
Por ejemplo, supongamos que se desea crear una serie LnInv = log (inv).

La creación de una serie mediante la transformación de una serie existente:


Ejemplo 1

1. Haga clic en la página “timeseries”.


2. En la ventana de comandos, escriba:
serie LnInv = log (inv)
genr LnInv=log(inv)
3. Pulse la tecla Enter.
Crear Nuevas Series a partir de una Existente
• Otra manera de crear una serie a partir de una existente es desde el menú Quick:

La creación de una serie mediante la transformación de una serie existente: Ejemplo 2


1. Sobre la página Timeseries , click Quick → Generate Series desde la barra de herramientas.
2. La ventana Generate Series by Equation se abrirá. Escriba la transformación de las observaciones (en este
caso, lninv3=log(inv)).
3. Click OK.
Crear Nuevas Series a partir de una Existente
Supongamos que se quiere generar una serie que
contenga solo el valor de inv para Q1 2012.

La creación de una serie mediante la transformación de


una serie existente: Ejemplo 2
1. Click Quick → Generate Series desde la barra de
herramientas.
2. La ventana “Generate Series by Equation” se abrirá. Escribir
la siguiente transformacuión:
inv2012q1 = @elem(inv,“2012Q1”)
3. La nueva series es igual al valor de inv para el periodo
2010q1.
Crear Nuevas Series a partir de una Existente
• Se puede utilizar muestras para generar nuevas
series a partir de existentes.
• Supongamos que se quiere generar una serie
w1= log(gdp) si gdp se incremente en comparación al
anterior periodo.

La creación de una serie mediante la


transformación de una serie existente: Ejemplo 3
1. Click en la página Timeseries , y luego click en
Quick → Generate Series desde la barra de
herramientas.
Para reemplazar valores NA en ceros:
2. La ventana “Generate Series by Equation” se
abrirá. Sobre la ventana “Enter Equation”, escribir 1. Crear una nueva serie escribiendo en la venta de comandos los siguiente:
la siguiente transformación:
series w2=@nan(w1,0)
w1=log(gdp)
3. Sobre la ventana “Sample”, escribir el siguiente 2. Presionar Enter.
condicional “if”:
if gdp>gdp(-1) • Note que @nan(w1,0) crea una nueva serie, w2, igual a w1 si w1≠NA, y 0 en
caso contrario.
Edición de Series: Interpolar Valores Perdidos
Editar Series:
1. Generar una serie como se muestra a continuación.
2. Seleccionar el rango de la serie incluyendo los valores perdidos
que se desea interpolar(en este caso el rango es 1980Q1-1984-
Q4).
3. Escribir “_” en la ventana de edición.
4. Presionar Enter.
Edición de Series: Interpolar Valores Perdidos

Operador Descripción
_ Repite el anterior valor no perdido

^ Interpolación lineal.

~ Interpolación Spline Cúbica.

& Interpolación Spline Catmull-Rom.

^* Interpolación Log-lineal (multiplicativa).

~* Interpolación Spline Cúbica Multiplicativa.

&* Interpolación Spline Multiplicativa Catmull-Rom


Grupos

•Los Grupos ayudan a trabajar con múltiples series.


•Un Grupo es una lista de nombres de series (y potencialmente expresiones matemáticas) que proporcionan
acceso a todas los datos en esta lista.
•Una vez creado el Objeto Group, se puede utilizar el nombre del grupo en muchos lugares para referirse a todas
las series que están contenidas en este grupo.

•Algunas características de los grupos:


Un grupo no es una copia de cada serie individual, un grupo es una vista en vivo de las series agrupadas. Esto
significa que si se realizan cambios sobre las series, automáticamente se actualiza en el objeto Grupo.
Si una serie se elimina de un Workfile, se mantendrá el Identificador de la serie. En la hoja de cálculo del grupo
la serie que ha sido borrada contendrá los valores dNA.
Cambiar el nombre de una serie cambia la referencia en cada grupo que contiene la serie.
Funciones
Generación de Variables Aleatorias
• Se puede generar una serie de (pseudo) número
aleatorios a partir de una variedad de distribuciones
de probabilidad.

Generar una serie aleatoria: Example 1


1. Abrir un Workfile.
2. Seleccionar Quick → Generate Series del menú
principal.
3. Escriba y1 = nrnd en la ventana de Dialogo.
4. Se genera una serie que se distribuye normalmente
con media 0 y desviación estándar 1.
Funciones
Suponga que se quiere simular un proceso de caminata
aleatoria con las propiedades de una distribución
simular a una distribución observada de una serie ya
creada:

Generar una serie aleatoria: Example 2


1. Escriba en la ventana de comandos:
smpl @all
series newdata = 0
smpl 1980q2 @last
newdata=newdata(-1)+@mean(d(gdp))+@stdev(d(gdp))*nrnd

2. Presionar Enter después de cada línea de comando.


Funciones Comunes para Generar Variables Aleatorias

Función/Comando Descripción
series y=nrnd o (y=@rnorm) Distribución Normal(media 0, st. dev. 1)

series y=3+@sqr(4)*nrnd Distribución (media 3, varianza 4)

series y=@rlognorm(1,4) Distribución Lognormal (media 1, st. dev 4)

series y=@runif(1,3) Distribución Uniforme (1,3)

series y=rnd Distribución Uniforme (0,1)

series y=1+(3-1)* rnd Distribución Uniforme (1,3) (como también @runif(1,3))

series y=rndint(0,100) Crea una serie y con valores enteros aleatorios desde 0
hasta 100.
Funciones: Números Aleatorios PDF y CDF
Generar una serie aleatoria junto con su función de densidad
y la función de distribución acumulada:
1. Escriba en la ventana de comandos:
smpl @all
series d1=@runif(0,2)
show d1 @dunif(d1,0,2) @cunif(d1,0,2)

2. Presiones Enter después de cada comando.


Funciones: Estadística Descriptiva
Función Descripción
series y=@gmean(x) Calcula la media geometrica de X

series y=@mean(x) Crea una serie donde cada observación es igual a la media de
X.

series y=@mean(x,“1980m01 Crea una serie donde cada observación es igual a la media de
1990m12”) X para la muestra (1980m01 to 1990m12)

series y=@median(x) Crea una serie donde cada observación es igual a la mediana
de X.
series y=@vars(x) Calcula la varianza muestral de X (adj. por n-1)

series y=@varp(x) o y=@var(x) Calcula la varianza poblacional de X (adj. por n)

series y=@stdev(x) o Calcula la desviación muestral de X (adj. por n-1)


y=@stdevs(x)

series y=@stdevp(x) Calcula la desviación poblacional de X (adj. por n)


Funciones: Estadística Descriptiva
Si se quiere crear una variable la cual contenga el promedio (o
suma) de múltiple series.

1a. Una manera para hacer esto es escribir el siguiente comando:


series new=(gdp+pce+inv)/3
1b. Otra manera seria escribir una función de fila de grupos:
group grupo gdp pce inv

Esto crea un nuevo grupo (llamada “grupo”) que contienen tres series.
2b. Ahora escriba el siguiente comando:
series new=@rmean(grupo)

Esto crea una serie la cual calcula la media de las tres series por cada fila
3. Presionar Enter después de cada línea de comando.
Funciones: Estadística Descriptiva
Si se quiere juntar en un vector (o matriz) estadísticas
descriptivas.

1. Definir primero la muestra a la cual se le va a calcular


las estadísticas. Escriba en la ventana de comandos:
smpl 1980m01 1990m12
2. Ahora debe crear un vector v:
vector(3) v
3. Definir los elementos vectoriales para recopilar las
estadísticas deseadas, escriba lo siguiente:
v(1)=@mean(gdp)
v(2)= @varp(gdp) Tenga en cuenta que el argumento de la muestra opcional sólo se
v(3)= @covs(gdp,pce) puede utilizar si los resultados son asignados a una serie. Por ejemplo:
la serie y = @ media (x [, s]) - donde s es la muestra, le permite definir
3. Presionar Enter después de cada línea de comando. la muestra como el último argumento de la función estadística.

Si los resultados son asignados en un objeto de matriz, vector o escalar


(como en el ejemplo anterior), la muestra debe ser definida de forma
explícita antes de utilizar las funciones estadísticas.
Funciones: Series de Tiempo
Lag/Lead, Rezagos/Adelantos

• No es necesario generar la serie de rezagos/adelantos en muchos lugares de EViews; simplemente escriba el


comando cuando sea necesario (es decir, cuando se estima una regresión).

Función Descripción
gdp(-4) Indica el 4° rezago de la serie
gdp(2) Indica el 2° adelanto de la serie
gdp (-1 to -4) Especifica desde el rezago 1 hasta el 4
gdp(to -5) o gdp (0 to -5) Especifica desde el rezago 0 hasta el 5
series y = @lag(gdp,3) Genera una serie y, como el 3 rezago de la serie
series y =@lag((gdp-inv)/gdp,4) Genera una serie y, como el 4 rezago de la transformación
(gdp-inv)/gdp
Funciones: Series de Tiempo

Para seguir los seis ejemplos escriba los siguientes


comandos:

show gdp(2 to -2)


series newseries=@lag((gdp-inv)/gdp,4)
Funciones: Series de Tiempo
Diferencias regulares y estacionales en Eviews (niveles y logaritmos)

Función Descripción
d(gdp) = gdp - gdp(-1) Toma la primera diferencia de la
serie
dlog(gdp) = log(gdp) – log(gdp(-1)) Toma la primera diferencia
logarítmica se la serie
Funciones: Series de Tiempo

Función Descripción
d(gdp,3) Se diferencia tres veces la serie ((1-L)3X) (Nota: Esto NO
es lo mismo que X-X(-3); esto es X-3X(-1)+3X(-2)-X(-3))
dlog(gdp,4) Se diferencia cuatro veces la serie log(GDP) (1-L)4log(X).
Funciones: Series de Tiempo
Diferencias Estacionales Función Descripción
d(gdp,1,4) Diferencia en la parte regular con una
diferencia estacional de orden 4.
d(gdp,0,4) o gdp-gdp(-4) Calcula solo la diferencia estacional de
orden 4.

Diferencia Regular y Estacional

(1)5782.4-5903.4=-121
5771.7-5782.4=-10.7
5878.4-5771.7=106.7
6000.6-5878.4=122.2
5952.7-6000.6=-47.9
(2)-47.9 –(-121)=73.1

Diferencia Estacional

(1)6000.6-5903.4=97.2
Funciones: Series de Tiempo
Cambios Porcentuales

Función Descripción
@pc(gdp) Calcula el cambio porcentual de un periodo (en
porcentaje)
@pch(gdp) Calcula el cambio porcentual de un periodo (en
decimales)
@pca(gdp) Calcula el cambio porcentual de un periodo
anualizado (en porcentaje) (1+@pch(x))n-1 (donde
n=4 para datos trimestrales, n=12 para datos
mensuales, etc)
@pcha(gdp) Calcula el cambio porcentual de un periodo
anualizado (en decimales)
@pcy(gdp) Calcula el cambio porcentual anual (en porcentajes)

@pchy(gdp) Calcula el cambio porcentual anual (en decimales)


Funciones: Estadísticas Acumulativas

Función Descripción
@cumsum(x,s) Suma Acumulativa de los valores de X para la muestra s
@cumprod(x,s) Multiplicación Acumulada de los valores de X para la muestra s

@cummean(x,s) Media de los valores de X sobre la muestra s incluyendo la


observación actual.
@cumobs(x,s) Acumula el número de observaciones no missing en X de la
muestra s
@cumbsum(x,s) Suma acumulativa hacia atrás de los valores de X sobre la
muestra s que inicia con el final de la muestra
@cumbmean(x,s) Media acumulativa hacia atrás de los valores de X sobre la
muestra s, empezando con el final de la muestra incluyendo la
observación actual.
@cumbstdev Desviación estándar acumulativa hacia atrás de los valores de X
sobre la muestra s, empezando con el final de la muestra
incluyendo la observación actual.
Funciones: Estadísticas Acumulativas
• La suma acumulativa es calculada agregando los valores desde el inicio de la muestra hasta el valor
actual.
• La suma acumulativa hacia atrás es calculada agregando valores desde el final de la muestras hatas el
valor actual. Note que a diferencia del anterior ejemplo la suma comienza al final de la muestra (1981q4 y
termina al comienzo de 1980q3).
Funciones: Estadísticas Móviles
Función Descripción
@movav(x,n) Media móvil de n periodos hacia atrás (si n=3, X+X(-1)+X(-2)/3). Los valores
perdidos se generan.
@movav(x(-1),n) Media móvil de n periodos hacia atrás (si n=3, X+X(-1)+X(-2)/3) y se rezaga
por un periodo. Los valores perdidos se generan.
@movsum(x,n) Suma móvil de n periodos hacia atrás (si n=3, X+X(-1)+X(-2)). Los valores
perdidos se generan.
@movvar(x,n) Varianza móvil de n periodos hacia atrás: Varianza poblacional para las
actuales y anteriores n-1 observaciones. Los valores perdidos se generan
@mav(x,n) Media móvil de n periodos hacia atrás (si n=3, X+X(-1)+X(-2)/3). Los valores
perdidos no se generan.
@msum(x,n) Suma móvil de n periodos hacia atrás (si n=3, X+X(-1)+X(-2)). Los valores
perdidos no se generan.
@mvars(x,n) Varianza móvil de n periodos hacia atrás: Varianza muestral para las actuales
y anteriores n-1 observaciones. Los valores perdidos se no generan
Funciones: Estadísticas Móviles
– Note que la media móvil es calculada como: (X+X(-1)+X(-2))/3.
– Note que la suma móvil de 5 periodos es generada agregando: (X+X(-1)+X(-2)+X(-3)+X(-4)).
Funciones: Generar una Serie Tendencia

Función Descripción
@trend Genera una serie de tendencia que se incrementa con cada observación.
@trend^2 Genera una serie de tendencia cuadrática que se incrementa con cada observación.
Funciones Fecha

Función Descripción
@year Devuelve el año en el cual cada observación comienza.

@quarter Devuelve el trimestre del año en el cual cada observación comienza.

@month Devuelve el mes del año en el cual cada observación comienza.

@day Devuelve el día del mes en el cual cada observación comienza.

@weekday Devuelve el día de la semana

@hour Devuelve la hora de cada observación como un entero.

@minute Devuelve el minuto de cada observación como un entero.

@second Devuelve el segundo de cada observación como un entero.

@seas(x) Devuelve una variable dummy estacional.


Funciones Fecha

Función Descripción
@daycount Devuelve el número de días entre cada observación.

@before(“date”) Devuelve una variable dummy con el valor igual a 1 antes de la fecha
especificada.
@after(“date”) Devuelve una variable dummy con el valor igual a 1 con y después de
la fecha especificada.
@during(“date1 Devuelve una variable dummy con el valor igual a 1 para cada
date2”) observación entre date1 y date2.
@holiday Devuelve la proporción de un evento anual (ejemplo, festivos) que se
encuentra en cada observación.
Funciones Fecha
La funciones de fecha son muy útiles para
relacionar variables dummy.
Supongamos que queremos crear una variable
dummy que toma el valor de uno después de
1980 y cero en caso contrario.

1. Generar una Workfile anual desde 1960


hasta 2010.
2. Escribir en la ventana de comandos:
series y=@year>1980
3. Presionar Enter
4. También se puede utilizar la siguiente
función:
series y_Ev8=@after("1981")
Funciones Fecha
Supongamos ahora que se quiere generar una dummy que
tenga el valor de 1 antes de 1979 y 0 en caso contrario.

1. Escribir el siguiente comando:


series x_ev8=@before("1979")
2. Presione Enter

Supongamos que se desea generar una variable dummy que


toma el valor de 1 para la fecha entre 1988 y 1999, y 0 en
caso contrario.

1. Escribir el siguiente comando:


series z_ev8=@during("1988 1999")
2. Presione Enter
Funciones Fecha
Crear una variable dummy que toma el valor de 1 para
cada enero en la muestra y 0 en caso contrario.

1. Generar una serie mensual desde 1960 hasta 2010.


2. Escriba el siguiente comando:
series y=@month=1
3. Presione Enter.

Crear una variable dummy que toma el valor de 1 para


cada Viernes en la muestra y cero en caso contrario.

1. Generar una serie diaria desde 1960 hasta 2010.


2. Escriba el siguiente comando:
series y=@weekday=5
3. Presione Enter.
Funciones Fecha
Suponga que quiere crear una dummy estacional que
toma el valor de 1 para cada tercer trimestre

1. Genera una serie trimestral desde 1960 hasta 2010


2. Escriba en los siguiente en la ventana de comandos:
genr qs=@seas(3)
o
genr qq=@quarter=3
3. Presione Enter
Funciones Fecha: Avanzadas
• EViews provee muchas funciones para manipular fechas de manera más general.
• EViews primero convierte la fecha que esta codificada como cadena en un número para poder ser trabajada.
• Por ejemplo, EViews primero convierte (1/1/1999) en un valor númerico (729754) el cual permite manipular fechas
de manera general.

Función Descripción
@date Devuelve el ‘Número días’ para el comienzo de estas observaciones.

@dateadd Desplaza una fecha adelante o hacia atrás por una unidad de tiempo

@datediff Calcula la diferencia entre dos fechas en una unidad de tiempo.

@datefloor Redondea hacia abajo una fecha para el comienzo de una unidad de tiempo

@dateval Convierte una fecha de texto en un valor numérico.


Funciones Fecha: Avanzadas
Se puede utilizar @date y @dateval para crear fechas
relacionadas a variable dummy.
Suponga que se desea crear una variable dummy en un
Workfile mensual el cual toma el valor de 1 para todas las
fechas antes de marzo de 1980.

1. En el Workfile previamente creado (Mensual)


2. Escriba el siguiente comando:
series z=@date<@dateval("1980m03")
3. Presione Enter
Funciones Fecha: Avanzadas
Se puede usar @datediff para llevar a cabo una serie
de cálculos de fecha.
Por ejemplo, se desea encontrar el número de días
(días laborables o años) entre 3/1/2010 y 3/1/1988.

1. En el Workfile previamente creado (Mensual)


2. Escriba el siguiente comando:
series
x=@datediff(@dateval("3/1/2010"),@dateval("3/1
/1988"),"d")
3. Presione Enter

“d” días
“b” días laborables
“a” o “y” anual
“q” trimestres
Funciones Fecha: Avanzadas
En un Workfile mensual, se puede encontrar el
número de días por mes.

1. Escriba el siguiente comando:


series w=@datediff(@date(+1),@date,"d")
2. Presione Enter

De otra manera, más sencilla, se podría utilizar el


comando @daycount

1. Escriba el siguiente comando:


series dayEV8=@daycount
2. Presione Enter
Variable Dummy: Creación de Dummies
La manera más sencilla para crear variables
dummy en EViews es usando muestras.

Suponga que se quiere generar una variable


que toma el valor de 1 si el retorno es mayor
que 0.2, y 0 en caso contrario.

1. Abrir el Workfile Data.wf1. Click sobre la página


Dated.
2. Escriba en la ventana de comandos:

smpl if return>0.2
series dummy1=1
smpl if return<=0.2
series dummy1=0

3. Presionar Enter después de cada línea de


comando.
Variable Dummy: Creación de Dummies
Ahora suponga que se quiere generar una
variable dummy que toma el valor de 1 si,
return>0.3, oreturn<=-0.3, y 0 en otro caso.

Suponga que se quiere generar una variable


que toma el valor de 1 si el retorno es mayor
que 0.2, y 0 en caso contrario.

1. Abrir el Workfile Data.wf1. Click sobre la página


Dated.
2. Escriba en la ventana de comandos:

smpl if return>0.3 or return<=-0.3


series dummy2=1
smpl if return>-0.3 and return<0.3
series dummy2=0
3. Presionar Enter después de cada línea de
comando.
Variable Dummy: Creación de Dummies
Otra manera de generar variables dummy en
Eviews es utilizando la función @recode.
Básicamente, este comando es la misma función
condicional de Ms.Excel.

1. Click en la barra de menú y seleccionar Quick


→ Generate Series.
2. La ventana de diálogo se abrirá, deberá
escribir la siguiente expresión:
dummy4=@recode(return<=0.2,1,0)
3. Click Ok
Variable Dummy: Creación de Dummies
Uso de expresiones lógicas

1. Click en la barra de menú y seleccionar Quick → Generate


Series.
2. La ventana de diálogo se abrirá, deberá escribir la siguiente
expresión:
series dummy5=@recode(return>-0.2 and
return<1,1,0)
3. Click Ok

1. Click en la barra de menú y seleccionar Quick → Generate


Series.
2. La ventana de diálogo se abrirá, deberá escribir la siguiente
expresión:
series dummy6=@recode(return<=-1.2 or
return>=1,1,0)
3. Click Ok
Variable Dummy: Creación de Dummies
Supongamos que se quieren eliminar outliers de una serie.

Específicamente, supongamos que la nueva serie excluye el


2.5% más alto y más bajo de los valores de la serie.

1. Escribir en la ventana de comandos:


series
no_outlier=@recode(return>@quantile(return,0.025)
and
return<@quantile(return,0.975), return, na)

3. Presionar Enter
Variable Dummy: Creación de Dummies
Cuando el tipo de información no tiene ningún tipo de
estructura, es decir, corte transversal, se puede seguir la
misma metodología cuando es una serie de tiempo. Sin
embargo, se debe reemplazar @date por @obsnum.

1. Crear un Workfile con 526 observaciones, luego escribir lo


siguiente en la venta de comandos:
series dum1=@recode(@obsnum>5,1,0)
o
series dum1=@obsnum>5

2. Presionar Enter.

3. De igual manera, para un intervalo de individuos:


series dum2=@recode((@obsnum>=7 and
@obsnum<=12),1,0)

series dum2=@obsnum>=7 and @ obsnum<=12


Variable Dummy: Creación de Dummies Categóricas
La creación de variables categóricas es muy sencilla
con el comando @expand. Este comando permite crear
un grupo de variables ficticias mediante la ampliación
de una o más series en categorías individuales.

Vamos a crear un grupo de series de la siguiente


manera:

Una serie con 1 para Mujer y 0 para Hombre


Una serie con 1 para Hombre y 0 para Mujer

1. Escribir en la ventana de comandos: El grupo se muestra aquí con


group g1 @expand(female) las dos series separadas: los
2. Presionar Enter hombres y las mujeres.
Variable Dummy: Creación de Dummies Categóricas
Vamos a crear un grupo de series de la siguiente manera:
Una serie contiene 1 si es Hombre y Soltero
Una serie contiene 1 si es Hombre y Casado 1. Escribir en la ventana de comandos:
Una serie contiene 1 si es Mujer y Soltera group g2 @expand(female, married)
Una serie contiene 1 si es Mujer y Casada 2. Presionar Enter
Variable Dummy: Creación de Dummies Categóricas
Vamos a crear un grupo de series de la siguiente
manera:

Una serie igual a educación si es hombre


Una serie igual a educación si es mujer.

1. Escribir en la ventana de comandos:


group g3 educ*@expand(female)
2. Presionar Enter

El grupo se muestra aquí con las dos


series que muestran los años de
educación de los hombres por separado
de años de educación para las mujeres.
Variable Dummy: Creación de Dummies Categóricas
• Las variables dummies también pueden ser
creadas usando @expand en conjunto con
otras funciones de (@year, @month, @day,
etc.).
• Suponga que se quiere crear una variable
dummy para cada día de la semana.

1. Escriba en la ventana de comandos:


group g1 @expand(@weekday)

2. Presione Enter.

Suponga que se quiere crear una variable


dummy para cada año.
1. Escriba en la ventana de comandos:
group g2 @expand(@year)

2. Presione Enter.
Variable Dummy: Creación de Dummies
Categóricas en Regresión
Una de las características convenientes de EViews
es que se puede utilizar expresiones ficticias en
regresiones sin tener que crear primero y guardar la
variable dummy.
Suponga que desea estimar una regresión de return
sobre el volume1 y una variable ficticia igual a 1 para
todas las fechas después de 02/12/1994.
1. Puede escribir el siguiente comando o generar
una ecuación a partir de Quick →Estimate
Equation:
equation eq1.ls return c volume1
@date>@dateval("1994/12/2")
2. Como se puede ver, EViews estima el
coeficiente de la variable ficticia directamente sin
tener que crear y guardar la fecha ficticia
primero.
Variable Dummy: Creación de Dummies
Categóricas en Regresión
Suponga que se quiere realizar una regresión de wage en
función de exper y educ, además incluir cuatro variables
dummy creadas a partir de @expand(female,married).

En el ejemplo, la constante no se incluyó.

Si se incluye una constante, entonces EViews


será incapaz de estimar la regresión, devuelve
un mensaje de error debido a la colinealidad
perfecta (la trampa de la variable binaria).
Variable Dummy: Creación de Dummies
Categóricas en Regresión
Para evaluar el modelo con intercepto y evitar la trampa
de la variable binaria, vamos a excluir uno de las
dummy.
Puede utilizar uno de los siguientes comandos:
• dropfirst (elimina la primer categoría).
• droplast (elimina la última categoría).

1. Escriba los siguientes comandos:


equation eq2.ls wage c exper educ
@expand(female, married,@dropfirst)
equation eq3.ls wage c exper educ
@expand(female, married,@droplast)
Conversión de Frecuencias
Cada serie en EViews tiene una frecuencia asociada la cual es la frecuencia de Workfile (o para ser
más precisos de la página del Workfile).

La conversión de frecuencia permite convertir una serie de datos desde una frecuencia de Workfile a
otra.

La forma más fácil de EViews para llevar a cabo la conversión de frecuencia, es copiar una serie de una
página de Workfile a otra página con una frecuencia diferente. *

* A pesar de que EViews también permite copiar de un Workfile a otro Workfile, a menudo tiene sentido realizar la copia entre las
páginas de un mismo Workfile.
Conversión de Frecuencias: De Frecuencia Baja hacia Alta
Es realmente fácil en EViews convertir los datos de menor
frecuencia (por ejemplo, de frecuencia trimestral) en datos
de frecuencia más alta (por ejemplo, frecuencia mensual).
Suponga que tiene datos trimestrales del PIB y desea
convertir estos a datos mensuales.

1. Abrir el Workfile Data.wf1. Haga click sobre la página


Quarterly page.

2. Haga click derecho sobre la serie GDP y seleccione Copy.

3. Haga click sobre la hoja Monthly (en cualquier parte del


Workfile), haga clic derecho y seleccione Paste Special...
Conversión de Frecuencias: De Frecuencia Baja hacia Alta
4. La ventana de dialogo de Paste Special se abrirá, estos
son los principales elementos:

“Pattern” le permite cambiar el nombre de la serie. Si desea


mantener el mismo nombre, deje esta área como es (con un
"*" en ella).

“Paste as” le permite pegar como "Series(by value)" o como


un “Link".

Si pega como una serie, entonces, la copia será un evento


de una sola vez.

Si pega como un enlace, los datos en la página Mensual


serán vinculadas de forma permanente a los datos en la
página Trimestral, por lo que si los datos en la página de
origen (trimestral) cambia también cambiarán en la página
de destino (Mensual).
Conversión de Frecuencias: De Frecuencia Baja hacia Alta
En la parte derecha se encuentra la sección de opciones de conversión de
frecuencias
Hay dos opciones principales: "Alto al método de baja frecuencia" y "De menor a
mayor."
Como queremos convertir los trimestrales a mensuales, debemos seleccionar la
opción “el método de menor a mayor frecuencia" y se debe elegir el tipo de
método de conversión que se realiza desde el menú desplegable.

Low to high frequency method:

Constant-match average Cubic-match first


Constant-match sum Cubic-match last
Quadratic-match average. Point
Quadratic-match sum Denton (Indicador)
Linear-match first Chow-Lin
Linear-match last Litterman
De Frecuencia Baja hacia Alta: Constant-match average
Repite el valor de los datos de baja frecuencia para cada
una de las observaciones de alta frecuencia asociados
con un período de baja frecuencia particular.
1. Click sobre la página Quarterly del Workfile Data.wf1.
2. Click derecho sobre GDP y luego Copy.
3. Click sobre la página Monthly, click derecho y Paste
Special.
4. Sobre la ventana de dialogo de Paste Special,
seleccionar Link en la sección de Paste as .
5. Seleccionar Date with frequency conversion en la
secciónr Merge by.
6. Seleccionar Constant-match average “Low to high
frequency method.”
7. Click OK.
De Frecuencia Baja hacia Alta: Constant-match sum
Divide el valor de baja frecuencia por el número de
observaciones en la página de alta frecuencia
asociado con un período de baja frecuencia en
particular.

1. Siga los pasos1-5 del anterior ejemplo.


2. En Pattern, coloque el nombre gdp1.
3. Sobre la venta de dialogo de Paste Special,
seleccionar Constant-match sum sobre “Low to
high frequency method.”
4. Click OK.

• Como se puede ver, todas las observaciones en la


frecuencia alta son calculadas como la frecuencia
de baja frecuencia dividido por el número de
periodos que se encuentran en la página de alta
frecuencia.
De Frecuencia Baja hacia Alta: Quadratic-match average
Realiza una interpolación cuadrática propia de los
datos de baja frecuencia para rellenar los de alta
frecuencia.
Como otro ejemplo, vamos a convertir los datos de
la deuda anual que se encuentran en la página
Annual en datos trimestrales (en la página Quarterly)
con este método de conversión.
1. Click sobre la página Annual del Workfile Data.wf1.
Click derecho sobre la serie debt y seleccionar Copy.
2. Click sobre la página Quarterly, click derecho y
seleccionar Paste Special.
3. Sobre la ventana de dialogo Paste Special,
seleccionar Link en la sección Paste as.
4. Seleccionar Date with frequency conversion en la
sección Merge by.
Como puede ver, este método ajusta un polinomio de segundo grado,
5. Seleccionar Quadratic-match average en “Low to mediante la adopción de un sistema de tres puntos adyacentes partir
high frequency method”. de los datos de baja frecuencia (datos anuales en este ejemplo) y el
ajuste cuadrático, por lo que el promedio de los puntos de alta
6. Click OK.
frecuencia coincide con los datos de baja frecuencia.
De Frecuencia Baja hacia Alta: Linear-Match Last
Inserta la observación de baja frecuencia en el último
período de los datos de alta frecuencia, a continuación,
realiza una interpolación lineal de los otros valores.
Considere el caso de la conversión de los datos
mensuales de Payroll a los datos semanales utilizando
el método de conversión " Linear-Match Last “
1. Clic sobre la página Monthly del Workfile Data.wf1. Clic
derecho sobre la serie payroll y seleccionar Copy.
2. Clic sobre la página Weekly, clic derecho y seleccionar
Paste Special.
3. Sobre la ventana de dialogo Paste Special, seleccionar
Link en la sección Paste as.
4. Seleccionar Date with frequency conversion en la
sección Merge by.
5. Seleccionar Linear-Match last en “Low to high
frequency method.”
6. Clic OK.
Conversión de Frecuencias: De Frecuencia Alta hacia Baja
Es igual de fácil en EViews para convertir datos de
alta frecuencia (por ejemplo, de frecuencia mensual)
a los datos de menor frecuencia (por ejemplo, la
frecuencia trimestral).

Suponga que tiene los datos mensuales Payroll y


desea convertirlos a datos trimestrales.

Se deben realizar los mismos pasos que el anterior


tipo de conversión, estos son: copiar la serie de la
pagina de frecuencia alta y pegarla en la página de
frecuencia baja como pegado especial.
Conversión de Frecuencias: De Frecuencia Alta hacia Baja
Bajo “Frequency Conversion Options” seleccione High
to Low. Hay unos pocos métodos de conversión:

Average Observations: Establece los datos de baja


frecuencia igual al promedio de las observaciones
correspondientes a los de alta frecuencia.
Sum Observations: Establece los datos de baja
frecuencia igual a la suma de las observaciones en los
datos de alta frecuencia.
First Observation: Establece los datos de baja
frecuencia igual al valor de la primera observación de los
datos de alta frecuencia.
Last Observation: Establece los datos de baja
frecuencia igual al valor de la última observación de los
datos de alta frecuencia.
Max observation: Establece los datos de baja
frecuencia igual al máximo valor de los datos de alta
frecuencia.
Min Observation: Establece los datos de baja
frecuencia igual al mínimo valor de los datos de alta
frecuencia.
De Frecuencia Alta hacia Baja: Average Observations

1. Clic sobre la página Monthly del Workfile Data.wf1


2. Clic derecho sobre la serie payroll y seleccionar
Copy.
3. Clic sobre la página Quarterly, clic derecho y
seleccionar Paste Special.
4. Sobre la ventana de dialogo Paste Special,
seleccionar Link sobre la sección Paste as.
5. Seleccionar Date with frequency conversion sobre
la sección Merge by.
6. Seleccionar Average observations sobre “High to
low frequency method.”
7. Clic OK.
 Este método completa las observaciones de los datos de baja
frecuencia con la media de las observaciones de la página de alta.
De Frecuencia Alta hacia Baja: Sum Observations

1. Clic sobre la página Monthly del Workfile Data.wf1


2. Clic derecho sobre la serie payroll y seleccionar
Copy.
3. Clic sobre la página Quarterly, clic derecho y
seleccionar Paste Special.
4. Sobre Pattern colocar como nombre de la serie
Payroll1.
5. Sobre la ventana de dialogo Paste Special,
seleccionar Link sobre la .sección Paste as.
6. Seleccionar Date with frequency conversion sobre
la sección Merge by.
7. Seleccionar Sum observations sobre “High to low
frequency method.”
Observe que Q1 1980 consiste en la suma de las
8. Clic OK.
observaciones de enero, febrero y marzo de 1980.
De Frecuencia Alta hacia Baja: Last Observations
En algunos casos, es posible que desee convertir frecuencias de
alto-bajo preservando la última observación (o la primera
observación). Esta es una característica particularmente útil para los
datos financieros.

Suponga que desea convertir los datos trimestrales del PIB en


datos anuales estableciendo el valor de todo el año igual a la del
último trimestre:

1. Clic sobre la página Quarterly del Workfile Data.wf1


2. Clic derecho sobre la serie GDP y seleccionar Copy.
3. Clic sobre la página Annual, clic derecho y seleccionar Paste
Special.
4. Sobre la ventana de dialogo Paste Special, seleccionar Link
sobre la sección Paste as.
5. Seleccione Date with frequency conversion sobre la sección
Merge by.
6. Seleccionar Last Observations sobre “High to low frequency
method.”
7. Clic OK.
Conversión de Frecuencias: Datos Panel
Hay tres tipos principales de las conversiones de frecuencia para datos de panel:
1. Panel a Panel
De baja frecuencia a alta frecuencia
De alta frecuencia de baja frecuencia
2. Panel a No Panel(series de tiempo y la corte transversal)
Conversión con la misma frecuencia (Anual a Anual, Trimestral aTrimestral, etc.)
Panel de baja frecuencia a alta frecuencia de series de tiempo
Panel de alta frecuencia de baja frecuencia series de tiempo
Panel a corte transversal
3. No Panel a Panel (series de tiempo y la corte transversal)
Conversión con la misma frecuencia (Anual a Anual, Trimestral a Trimestral, etc.)
Baja Frecuencia de series de tiempo a Panel de alta frecuencia
De alta frecuencia de series de tiempo a Panel de baja frecuencia
Corte transversal a Panel
Conversión de Frecuencias: Datos Panel
Se puede ver que los identificadores (llaves) de país son
los mismos en ambas páginas (CAN, CANADA, etc.).

La página del Panel Trimestral tiene más observaciones


que la página Anual Panel (un país más (US) y 1 año
más de datos (94)).

Un par de cosas para recordar:


Una simple conversión de frecuencia de panel requiere
que los nombres de los identificadores de corte
transversal de las dos páginas sean idénticas.
En nuestro caso estamos usando PAÍS como
identificador en ambas páginas.
Una página puede tener menos (o más) identificadores
(como en este ejemplo en el que Estados Unidos se
excluye del archivo anual).
Lo importante es que hay una cierto corte transversal
que sobrepone un ID.
Datos de Panel a Datos de Panel: Baja a Alta Frecuencia
Suponga que desea convertir la serie pop desde la página
Annual_Panel hacia una que tenga datos trimestrales en la
página Quarterly_Panel.
1. Abrir el Worfile Data_panel.wf1. Clic sobre la página
Annual_Panel.
2. Clic derecho sobre la serie pop y seleccionarCopy.
3. Clic sobre la página Quarterly_Panel, click derecho y
seleccionar Paste Special.
4. La ventana de dialogo Paste Special se abrirá. Bajo la
sección Paste as, seleccionar Series (by value).
5. Bajo la sección Merge by, escoger General match
general criteria.
6. Presionar Ok
Datos de Panel a Datos de Panel: Baja a Alta Frecuencia
Esto cambia las opciones de la parte derecha del cuadro Paste
special. Ahora puede ver una nueva sección Match merge
options. Revisemos:

Bajo " Match merge options ", el ID de origen y el ID de


Destino se fijan (por defecto) en @date y @country, lo cual
le dice a EViews que la conversión se hará por fecha y por
país.

Bajo Contraction method, hay un número de opciones. Sin


embargo, el único método de conversión de frecuencia para
datos de panel de baja frecuencia a alta es Constant-Match
Average (repitiendo valores de baja frecuencia). Así que
aquí, no hay necesidad de elegir cualquier opción ya que
todas estas tienen el mismo resultados.
Datos de Panel a Datos de Panel: Baja a Alta Frecuencia
¿Qué pasa si en lugar deI ID de origen y destino @date y @country, simplemente
elegimos @date?
Esto le indica a Eviews ignorar el identificador país y realiza la conversión a través de
todos los identificadores de país.

1. Clic sobre la página Annual_Panel. Clic derecho sobre la serie pop y seleccionar
Copy.

2. Clic sobre la página Quarterly_Panel y seleccionar Paste Special.

3. La ventana se dialogo Paste Special se abrirá. Cambiar el nombre de la serie por


pop1, seleccionar Series (by value) en la sección Paste as, General match
merge criteria sobre la sección Merge by.

4. Sobre Match merge options, escriba @date en ID de origen y el ID de destino.

5. Sobre Contraction Method se puede ahora especificar el método que EViews


agregará la información a través del identificador de corte transversal. Elija Mean
como un método de contracción. Este método calcula el promedio de la población
de los seis países de la página anual. EViews entonces usa Constant-Match
Average para convertir la información anual a una trimestral.
6. Clic OK.
Datos de Panel a Datos de Panel: Alta a Baja Frecuencia
Ahora supongamos que queremos convertir los datos GDP de
Quarterly_Panel a la página de Annual_panel.
1. Click sobre la página Quarterly_Panel. Clic derecho sobre la serie GDP y
seleccionar Copy.
2. Clic sobre la página Annual_Panel y seleccionar Paste Special.
3. La ventana de dialogo Paste Special se abrirá. Como en el anterior
ejemplo, seleccionar Series (by value) en la sección Paste as, y General
match merge criteria en la sección Merge by.
4. Establecer @date country en las dos opciones de emparejamiento.
5. Bajo Contraction method, se puede elegir cualquier de las opciones del
menú.

 De hecho, EViews solo utilizaba Constant-Match Average


cuando la conversión va desde baja a alta frecuencia, TODOS
los métodos de contracción estas disponibles para el caso
contrario (de alta a baja frecuencia).

6. Seleccionamos Sum bajo Contraction Method. Esto significa que el PIB


anual se creará como la suma del PIB trimestral para cada país.
7. Clic OK
Datos de Panel a Datos de Panel: Alta a Baja Frecuencia
¿Qué pasa si elegimos nuevamente @date como el ID de origen y destino en lugar
de @date country?
Al igual que en el ejemplo mostrado anteriormente, esto instruye a EViews a ignorar
el ID país y realiza la conversión a través de todos los identificadores de corte
transversal.

1. Clic sobre la página Quarterly_Panel . Clic derecho sobre la serie GDP y


seleccionar Copy.
2. Clic sobre la página Annual_Panel y seleccionar Paste Special.
3. La ventana de dialogo Paste Special se abrirá. Cambiar el nombre de la serie a
gdp1, seleccionar Series (by value) en la sección Paste as, y General match
merge criteria en la sección Merge by.
4. En Match merge options, escribir @date en los campos Source ID y Destination
ID.
5. Escoja Sum como un método de contracción. Esto calcula:

La suma de GDP sobre los cuatro trimestres por cada país (contracción por
fecha)
La suma de GDP para cualquier año sobre todo el corte de paises
(contracción por país)

6. Clic OK.
Datos de Panel a Datos de Panel: Alta a Baja Frecuencia
• Hay un problema en el anterior ejemplo. La página Annual_Panel (página destino) tiene 6 países (excluye US),
mientras que la página Quarterly_Panel (página origen) tiene siete países (incluyendo US).
• La contracción (suma) se llevó a cabo en base a la muestra de la página de origen (los 7 países). No hay ninguna
razón para sumar más de los 7 países, si la página de destino (Annual_Panel) tiene sólo 6
• Para solucionar este problema, tenemos que excluir “US" de la muestra. Podemos hacerlo cambiando Source
Sample en el cuadro de diálogo de la siguiente manera:
Datos de Panel a No Panel

Aquí hay una lista (exhaustiva) de tipo de conversión desde Datos de Panel o No Panel:
Datos panel a Series de Tiempo: Misma Frecuencia
Datos Panel a Series de Tiempo: Frecuencia baja de Datos Panel a Frecuencias Altas de
Series de Tiempo.
Datos Panel a Series de Tiempo: Frecuencia alta de Datos Panel a Frecuencias bajas de
Series de Tiempo.
Datos Panel a Corte Transversal
Datos de Panel a No Panel: Misma Frecuencia
Suponga que se quiere copiar la información GDP desde la
página Quarterly_Panel hacia la página TimeSeries_Quarterly).
1. Clic sobre la página Quarterly_Panel, clic derecho sobre la
serie GDP y seleccionar Copy.
2. Clic sobre la página TimeSeries_Quarterly, clic derecho y
seleccionar Paste Special.
3. Como es usual, la ventana de dialogo Paste Special se abrirá.
Seleccionar Series (by value) sobre la sección Paste as. Bajo la
sección Merge by, elegir General match merge criteria .
Bajo Match merge Options, el ID de origen y el de Destino son establecidos
en @date (por defecto). Esto indica a EViews que la conversión se hará por
fecha (es decir, utiliza la estructura de la fecha en la página del panel para
alinear las observaciones con la estructura de la fecha en la página no
Panel). 5. Escoger Mean como contraction method. Esto calcula el
promedio GDP para los siete países en la página
4. Establezca Contraction method. Esto indica a EViews sobre cómo contraer (agregar) Quarterly_Panel y colocar este valor en el correspondiente
los datos de cortes transversales con el fin de calcular una sola serie de tiempo. Hay trimestre en la página TimeSeries_Quarterly.
un menú desplegable de opciones, pero las conversiones más utilizados son : 6. Clic OK.
Sum (suma de los cortes transversales para cada periodo).
Mean (promedio de los cortes transversales para cada periodo)
Datos de Panel a No Panel: Panel Baja
Frecuencia a No Panel Alta Frecuencia
Supongamos que se quiere convertir la información population desde la página Annual_Panel a la página
TimeSeries_Quarterly.

1. Clic sobre la página Annual_Panel , clic derecho sobre la serie pop y seleccionar Copy.
2. Clic sobre la página TimeSeries_Quarterly y seleccionar Paste Special.
3. La ventana de dialogo Paste Special se abrirá. Seleccionar Series (by value) bajo la sección Paste as y
General match merge criteria bajo la sección Merge by.
4. Bajo Match merge Options, establecer Source ID y Destination ID con @date.
5. Recordar que EViews necesita saber:
Como se va agregar la información entre países
Como se va a realizar la conversión de frecuencias bajo-alto.
• Para decirle a Eviews el método de contracción que se utilizara, seleccione una de las opciones en
Contraction method. Escoga Sum.
Esto le dice a EViews que debe sumar la población entre países por cada año(agregación
país/contracción).
La conversión de baja a alta frecuencia se consigue mediante el uso de Constant-match
average (esta es la única opción), lo que significa que el valor se repite para cada período de alta
frecuencia.
• NOTA: Si seleccionamos otro método de conversión (es decir, Mean), los datos se promedian en todos los
países (para calcular una sola serie de tiempo) y luego se repite para cada trimestre correspondiente en el
archivo de alta frecuencia..

6. Clic OK.
Datos de Panel a No Panel: Panel Alta
Frecuencia a No Panel Baja Frecuencia
Suponga que quiere copiar la información GDP desde la página Quarterly_Panel hasta la página
TimeSeries_Annual.
1. Clic sobre la página Quarterly_Panel, clic derecho sobre la serie gdp y seleccionar Copy.
2. Clic sobre la página TimeSeries_Annual, clic derecho y seleccionar Paste Special.
3. La ventana de dialogo Paste Special se abrirá. Seleccionar Series (by value) en la sección Paste
as y General match merge criteria en la sección Merge by.
4. Bajo Match merge Options, establecer Source ID y Destination ID con @date.
5. Recordar que EViews necesita saber :
Como se va agregar la información entre países
Como se va a realizar la conversión de frecuencias alto-bajo.
• Para decirle a Eviews el método de contracción que se utilizara, seleccione una de las opciones en
Contraction method. Escoga Sum.
Esto le dice a EViews que debe sumar el GDP entre países por cada trimestre (agregación
país/contracción).
También EViews suma el GDP de cada trimestre del año (conversión de frecuencia).

• NOTA: El método utilizado para la contracción del corte transversal también se aplicara a la
conversión de frecuencia. Por ejemplo, si usted elige Sum, los datos se resumen con los cuatro
trimestres del año y luego suma todos los países.
• Si seleccionamos otro método de conversión (es decir, Mean), los datos se promedian en todos los
países (para calcular una sola serie de tiempo) y luego promedia en los cuatro trimestres (para
obtener el valor anual).
6. Clic OK.
Datos de Panel a No Panel: Datos Panel a Corte Transversal
Suponga que se quiere copiar los datos trimestrales de GDP
desde la página Quarterly_Panel hacia la página Cross_Section
(la cual tiene los mismos identificadores de corte transversal (o al
menos alguna sobre posición).
1. Clic sobre la página Quarterly_Panel, clic derecho sobre la serie
GDP y seleccionar Copy.
2. Clic sobre la página Cross_Section, clic derecho y seleccionar
Paste Special.
3. La venta de dialogo Paste Special se abrirá. Bajo la sección
Paste as seleccionar Link.
4. Bajo la sección Merge by, selecciones General match merge
criteria.
5. Bajo Match merge Options se puede ver que Source ID y
Destination ID están establecidos en @country. Esto le dice a
EViews que la conversión se realizará por país (es decir, utiliza
la estructura del corte transversal de la página del panel para
alinear las observaciones con la estructura del corte transversal
de la página no Panel).
6. Establezca Contraction method. Esto le dice a EViews como se
va a contraer la información de series de tiempo en una serie de
corte transversal. Hay muchas opciones, pero las más usadas
son Mean y Sum. Seleccionar Mean.
7. Clic OK.
No Panel a Panel

Aquí hay una lista (exhaustiva) de tipo de conversión desde Datos de Panel o No Panel:

 Series de Tiempo a Panel: Misma Frecuencia


 Series de Tiempo a Panel: Series de Tiempo con Baja Frecuencia a Datos Panel con Alta Frecuencia.
 Series de Tiempo a Panel: Series de Tiempo con Alta Frecuencia a Datos Panel con Baja Frecuencia
 Corte Transversal a Panel
No Panel a Panel : Misma Frecuencia
Ssuponga que se quiere copiar los datos consumption de la
página TimeSeries_Annual hacia la página Annual_Panel .
1. Clic sobre la página TimeSeries_Annual, clic derecho
sobre la serie consumption y seleccionar Copy.
2. Clic sobre la página Annual_Panel, clic derecho y
seleccionar Paste Special.
3. La ventana de dialogo Paste Special se abrirá. Bajo la seeción
Paste as seleccionar Series (by value). Bajo la sección Merge by,
escoger General match merge criteria.
 Bajo Match merge Options, el Source ID y Destination ID se establecen en
@date por defecto). Esto le indica a EViews que la conversión se hará por fecha
(es decir, utiliza la estructura de la fecha en la página de la serie de tiempo para
alinear las observaciones con la estructura de la fecha en la página del panel).
• Como se puede ver, EViews repite el mismo valor anual de
4. Contraction method. No hay necesidad de escoger cualquier consumption para todos los países (identificador de corte
opción aquí. EViews repetirá el mismo valor de series de tiempo para transversal).
cada corte transversal en la página del panel (para cada país). • Tenga en cuenta que EViews coincide con las fechas del
calendario (en este caso los años) en la página no panel para
5. Clic OK.
página de panel anual y coloca las observaciones respectivamente.
No Panel a Panel: Frecuencia Baja a Alta Frecuencia
Supongamos que se quiere convertir la información consumption de la
página TimeSeries_Annual en la página Quarterly_panel.

1. Clic sobre la página TimeSeries_Annual, clic derecho sobre la serie


consumption y seleccionar Copy.
2. Clic sobre la página Quarterly_panel y seleccionar Paste Special.
3. La ventana de dialogo Paste Special se abrirá. Seleccionar Series
(by value) bajo la sección Paste as y General match merge criteria
bajo la sección Merge by.
4. Bajo Match merge options, establecer Source ID y Destination ID
como @date.
5. Contraction method. Una vez más, no hay necesidad de elegir una
opción aquí:
 EViews repetirá el mismo valor de la página no panel para cada
identificador de corte transversal (país) en la página panel.
La conversión de baja a alta frecuencia se consigue mediante el uso
Constant-match average (esta es la única opción), lo que significa que el
valor se repite para cada período de alta frecuencia respectivamente.
6. Click OK
No Panel a Panel: Frecuencia Alta a Baja Frecuencia
Suponga que se quiere convertir las observaciones de
investment de la página TimeSeries_Quarterly en la
página Annual_panel.

1. Clic sobre la página TimeSeries_Quarterly, clic derecho sobre


la serie investment y seleccionar Copy.
2. Clic sobre la página Annual_panel y seleccionar Paste
Special.
3. La ventana de dialogo Paste Special se abrirá. Seleccionar
Series (by value) bajo la sección Paste as y General match
merge criteria bajo la sección Merge by.
4. Bajo Match merge Options, establecer Source ID y
Destination ID como @date.
5. Contraction method. Aquí es necesario indicarle a EViews •EViews resume todos los valores de los datos investment
sobre cómo realizar de la conversión de frecuencias de alto a trimestrales con el fin de crear un valor anual (una conversión de
frecuencia de alto a bajo).
bajo. Puede seleccionar cualquier método en el menú
•EViews repite estos valores para todos los identificadores de
desplegable. Escoger Sum. corte transversal (países) en la página Annual_panel.
6. Clic OK.
No Panel a Panel: Corte Transversal a Panel
Suponga que quiere copiar la información de debt desde la página
Cross_Section hacia la página Annual_panel (la cual tiene los
mismos identificadores de corte transversal (o alguna sobre posición).

1. Clic sobre la página Cross_Section page, clic derecho sobre la


serie debt y seleccionar Copy.
2. Clic sobre la página Annual_panel y seleccionar Paste Special.
3. La ventana de dialogo Paste Special se abrirá. Seleccionar Link
bajo la sección Paste as y General match merge criteria bajo la
sección Merge by.
4. Bajo Match merge Options, establezca Source ID y Destination ID
con country (country ya esta establecido por defecto).
5. Contraction method. Una vez más, no hay necesidad de elegir
cualquier opción aquí. EViews repetirá el mismo valor del corte
transversal de todos los años para cada país.
6. Clic OK.
Gráficas
• Las representación grafica es una parte importante del proceso Tipos de Gráficos:
de análisis de datos y presentación.
• EViews ofrece un potente conjunto con todas las funciones, fácil 1. Gráficos de observación - mostrar datos para cada
de usar, herramientas que ayudarán en la visualización gráfica observación en la serie o grupo.
de la información.
• El menú de EViews es extenso y está cubierto de una serie de
tutoriales (ver para más detalles Advanced Graphing and 2. Gráficos analíticos - mostrar resultados obtenidos a partir
Advanced Graph Customization).. del análisis de los datos de series o de grupo.
• Los principales temas son:
 Opciones de Gráficos y Objetos de Gráficos 3. Gráficos Auxiliares - mostrar gráficas analíticas derivadas
de una modificación de los gráficos de observación (es
 Representación Grafica Series Simples decir, la línea de regresión o línea de ajuste kernel.
Gráficos de Observaciones
Representación Grafica de Múltiples Series
4. Gráficos categóricos - observación o gráficos analíticos
Gráficos de Observaciones
creados a partir de la división de los datos en categorías
Simple Gráfica de Datos de Panel definidas por variables de factor.
Crear un Gráfico en EViews

1. Clic sobre la página Monthly y abrir la serie


SP500.
2. Clic View → Graph.
3. Se abrirá la ventana de dialogo Graph
Option. Bajo Option Pages seleccionar
Basic type.
4. Bajo la sección Graph type, seleccionar
Basic graph desde la categoría General.
5. Seleccionar Line & Symbol desde la
categoría Specific.
6. Dejar Details como aparece (por defecto).
7. Clic OK.
Crear un Gráfico en EViews
Una herramienta interesante es la barra de
desplazamiento de la muestra, que se
encuentra en la parte inferior de la ventana del
gráfico.

Esto le permite centrarse en una muestra


particular, como se muestra a continuación.

También puede utilizar las flechas a cada lado


de la barra deslizante para ajustar la muestra
en incrementos individuales.

Tenga en cuenta que los cambios de la barra


de deslizamiento son sólo temporales.
Crear un Gráfico en EViews

• Para este ejemplo establecer la muestra


(Enero 2000-Diciembre 2002)

1. Siga los pasos 1-4 del ejemplo anterior.


2. Seleccionar Bar dese la categoria Specific.
3. Dejar Details como aparece (por defecto).
4. Clic OK.
Crear un Gráfico en EViews: Detalles de Grafico

Todas las características de gráficos descritos en, se


pueden acceder seleccionando el elemento GRAPH
en el menú VIEW.
1. Clic sobre la página Monthly y abra la serie
employment_retail.
2. Seleccionar View → Graph.
3. El menú Graph Options se abrira.
• El menú Graph Options menu se descompone en
varías categorias:
 Option Pages: Este es usada para personalizar los
gráficos. En este momento se muestra Graph Type →
Basic type.
Detalles de Grafico
Graph Type: esto especifica el tipo de gráfico que desea mostrar. Se tiene dos categorías:
General
Specific
 Specific: ofrece una lista de tipos de
 General – este cuadro combinado gráficos disponibles para su uso.
tiene dos opciones: o Tenga en cuenta que hay diferentes opciones
o Basic graph: muestra un gráfico disponibles para la serie y grupos.
basico de la información.
o Categorical graph: muestra los
datos dividido en categorías
definidas por variables de factor
Detalles de Grafico
Details: esta categoría especifica detalles adicionales,
tales como:
Graph Data
Orientation
 Axis Borders
 Multiple Series
 Graph Data – Especifica los datos que se utilizarán en
los gráficos de observación
o Raw data – es la configuración predeterminada. Cada
observación se traza.
o Summary Statistics – le permite calcular las estadísticas de
resumen (medias, medianas, etc.).
 Para una sola serie, las estadísticas de resumen muestra
un solo punto de datos.
 Para única serie, es posible que desee dejar el ajuste en
Raw data.
 La opción Graph data es más útil cuando se trabajan
múltiples series (Grupos)
Detalles de Grafico
 Orientation – le permite elegir entre dos
opciones:
o Normal – observaciones son el eje horizontal.
o Rotated – observaciones son el eje vertical.
• Tenga en cuenta que para los tres tipos de
gráfico– Distribution, Quantile-Quantile or
Seasonal Graphs – aparecerán opciones
diferentes de Orientation.
oDistribution Graphs – la opción Orientation cambia
a Distribution con el menú desplegable que se
muestra aquí.
oQuantile-Quantile Graphs – la opción
Orientation cambia a graficas Q-Q con el menú
desplegable que se muestra aquí.
oSeasonal Graphs – la opcíón Orientation cambia
a Seasonal type con el menú desplegable que se
muestra aquí.
Detalles de Grafico

Axis Borders– permite seleccionar un gráfico de


distribución para mostrar a lo largo del eje de los
gráficos.
o Por defecto no hay eje que se muestre(por defecto
None).

Multiple Series– esto le permite manejar


múltiples series (datos del grupo).
o Si usted tiene una sola serie, esta opción de menú no
está disponible.
o Para varias series, muestra las opciones que se
muestran aquí, le pedirá que especifique cómo desea
mostrar su serie múltiple.
Objetos de Gráfico
• Cuando se crea un gráfico por medio de View → Graph de
una serie o un grupo, recuerde que lo que esta creando en
una simple visualización grafica.
• Estas visualizaciones son transitorias : mientras que usted
puede personalizarlos, una vez que se cierra la serie objeto
o grupo, la mayoría de estos ajustes se perderán.
• Se puede guardar la imagen congelándola. Esto crea un
objeto grafica.
• Congelación la vista (objeto gráfico) crea una visualización
instantánea del gráfico actual, lo que permite crear una
personalización permanente de la salida..
• Se puede crear un objeto gráfica con tan solo presionar el
botón en el menú del gráfico.
Objetos de Gráfico
1. Crear una gráfica de la serie.
2. Presionar Freeze sobre el menú.
3. La ventana de dialogo Auto Update Options se abrirá y le preguntará la
posibilidad de determinar la forma en que el objeto gráfico se relacionará con los
datos subyacentes.
 Selección de actualización manual o automático mantendrá el objeto gráfico
vinculado a la serie original. Cuando los datos cambia, el objeto gráfico
también se actualizará.
 Si seleccionar Off se creará una gráfica actual, totalmente divorciada de los
datos subyacentes.
 Tenga en cuenta que en todos los siguientes ejemplos, hemos seleccionado
la opción Off.
4. Clic OK.
• Una nueva ventana se abre.
 Como se puede ver, dice “graph” arriba de la ventana (en vez de “series”
cuando estábamos mirando el “graph view”).
 Si se guarda la gráfica en el Workfile, esta aparecerá con el icono:
 Si la serie está vinculada a la fuente de datos (lo que significa que será
actualizada), el icono es de color naranja.
 Si la serie esta separada de la fuente de datos, el icono es de color verde
(como se muestra aquí).
Series Simples: Line & Symbol
• El tipo más simple de gráfico es Line & Symbol.
• Los datos muestran gráficos (como símbolos, línea o ambos)
contra los identificadores de observación.
• El dox plot es una versión única de Line & Symbol.
• El gráfico utiliza círculos para representar el valor de cada
observación

1. Clic sobre la página Monthly en Data.wf1 y abrir la serie


tbill3M.
2. Clic View → Graph.
3. La ventana de dialogo Graph Option se abrirá. Bajo Option
Pages seleccionar Basic type.
4. Bajo la sección Graph type, seleccionar Basic graph desde
la categoría General.
5. Seleccionar Line & Symbol desde la categoría Specific.
6. Dejar Details como aparece (por defecto)
7. Clic OK.
Tenga en cuenta que, en la opción Details/Graph data si en
lugar de Raw Data se hubiera elegido alguna otra estadística
(medianas, por ejemplo),EViews simplemente trazar un punto que
corresponde a la mediana de la serie (no es muy útil en el caso
de un solo serie).
Series Simples: Dot Plots
• Los Gráficos de puntos se utilizan a menudo con datos de corte
transversal
• Por ejemplo, se puede trazar la deuda pública como porcentaje del PIB
nominal en el 2010 para las principales economías.

1. Clic sobre la página Panel la cual contiene la deuda


gubernamental para las 10 principales economías en 2000, 2007
y 2010..
2. Note que esto son datos de panel, donde el corte transversal es
countries y el identificador de tiempo dateid.
4. En primer lugar, vamos a cambiar la muestra de 2010. Para ello,
haga clic en el botón en el menú Workfile. Especifique la
muestra como se muestra en el cuadro de diálogo. Como se ve
aquí, se han conservado todos los identificadores entre países,
pero restringido a la fecha de 2010 (date = 2010).
5. Abra la serie total_debt. Clic sobre el botón para restringir
la muestra a 2010.
6. Seguir los pasos del 2 al 4 del primer ejemplo.
7. Seleccionar Dot Plot (desde Graph type/Specific).
8. Dejar las opciones Details como se especifican.
9. Clic OK.
Series Simples: Bar
• Los gráficos de barra utilizan barras para representar el
valor de cada observación.
• Los gráficos de barras son eficaces cuando hay pocas
observaciones: para grandes observaciones, los gráficos
de barra y la zona del gráfico son casi indistinguibles entre
sí.
1. Clic sobre la página Panel y abrir la serie total_debt.
Recuerde que la muestra se sigue estableciendo en 2010.
2. Siga los paso 2 hasta el 4 del primer ejemplo.
3. Seleccionar Bar (desde Graph type/Specific).
4. Dejar los ajustes Details por defecto (asegurese de que
Orientation esta establecida como normal y Axis borders
None).
5. Clic OK.
6. Doble clic sobre la barra del gráfico para traer la ventana de
dialogo Graph Option.
7. Bajo Options Pages, seleccionar Graph Elements → Bar-
Area-Pie.
8. Bajo Bar graph seleccione Label above bar (si desea que la
información se muestre por fuera de la barra) o Label in bar (si
se desea que la información se muestre dentro de la barra).
9. Clic OK.
Series Simples: Area Plots
• Un gráfico de área es un gráfico lineal que sombrea
desde el grafico de línea hasta una punto de referencia.

1. Clic sobre la página Panel.


2. Se debe crear una nueva serie sustrayendo la propia
media de la serie bill3m. Para esto, escriba en la
ventana de comandos:
series newseries=tbill3M-@mean(tbill3m)
3. Después de crearla, ahora abra la serie newseries.
Siga los pasos 2 hasta 4 del primer ejemplo.
4. Seleccionar Area (desde Graph type/Specific).
5. Clic OK.
Series Simples: Seasonal Graph
• Los gráficos estacionales permiten trazar gráficos de
líneas separadas para cada temporada en un
Workfile con frecuencia regular mensual o trimestral.
• En primer lugar, vamos a abrir una serie con un
patrón estacional. Para ello, haga clic en la página
Monthly y abra la serie la serie employment_retail.
Esta serie contiene datos sin desestacionalizar.
• Trace una sencilla grafica Line & Symbol siguiendo
los pasos habituales (Haga clic en View → Graph,
etc.)
• Como se observa en el gráfico, los datos de empleo
minoristas tienen un claro patrón estacional. Los
picos se producen durante la temporada de
vacaciones (noviembre y diciembre).
Series Simples: Seasonal Graph
1. Abra la serie employment_retail en la página Monthly
del Workfile.
2. Siga los paso 2-4 del primer ejemplo.
3. Seleccionar Seasonal (desde Graph type/Specific).
4. Debajo Details/Seasonal type, se pueden observa dos
opciones: (i) Paneled lines & means, and (ii) Multiple
overlayed lines. Escogemos (i) por ahora.
5. Clic OK.

• La opción (Paneled lines & means) divide el gráfico en


los paneles, cada uno contiene una serie de tiempo dado
un patrón estacional.
• Desde que escogimos un Workfile mensual, el gráfico es
dividido en 12 paneles.
El primer panel contiene toda la serie temporal (1977 a
2012) para enero.
El segundo panel contiene toda la serie temporal para
febrero, etc. Observe que los medias son más altas
en noviembre y diciembre.
• If instead we choose option (ii) Multiple overlayed lines, EViews superpone la serie
• Nótese también el descenso y posterior (pequeño) temporal para cada temporada en un solo gráfico utilizando un período común.
corrección en los niveles de empleo al final del periodo
asociado con la recesión de 2009 y (débil) de • Por ejemplo, en este gráfico se puede ver toda la serie histórica (desde 1977 hasta 2012)
recuperación. para cada mes del año.
• Se puede ver que de noviembre (en gris claro) y diciembre (en azul claro) tienen niveles
más altos de empleo en comparación con otros meses.
Múltiples Series: Gráficas Simples
• Las múltiples series tienen todas las opciones gráficas de la serie
individual junto con algunos otras adicionales.
• Todos los tipos de gráficos disponibles para una sola serie
también están disponibles para graficar la serie en un grupo.
• Vamos a demostrar algunas de los gráficos anteriores y luego
concentrarnos en tipos de gráficos que están disponibles sólo para
múltiples series.

Primero vamos a crear un grupo de la serie que vamos a utilizar.


1. Haga clic en la página Monthly del Workfile Data.wf1.
2. Haga clic derecho en las siguientes series: tbill3m, tbill6m,
tnote2y, tnote10y (en ese orden y como se muestra aquí).
3. Seleccione Open → as Group. Ahora se crea el grupo de la
serie.
4. Haga clic en Name para nombrar el grupo (en este caso vamos
a nombrarlo Group01).
MS Gráficas Simples: Line & Symbol
1. Abra group01.
2. Clic View → Graph.
3. Se abrirá la ventana de dialogo Graph
Option. Por defecto se establece la página
Basic type; mantenga la configuración por
defecto.
4. Bajo la sección Graph type, seleccionar
Basic graph desde la categoría General.
5. Seleccionar Line & Symbol desde la
categoría Specific.
6. Note ahora que bajo Details/Multiple
Series se tienen tres opciones. Seleccione
Single Graph.
7. Clic OK.
EViews ha trazado todas las tasas de interés en un
solo gráfico. Cada serie se representa con un color
diferente (de manera que es distinguible de otros) y la
leyenda se encuentran en la parte inferior.
MS Gráficas Simples: Dot Plot
• También puede graficar cada serie por separado si
así lo desea.
• Vamos a demostrar esto mediante la representación
gráfica de un gráfico de puntos.

1. Siga los pasos 1-4 en el primer ejemplo.


2. Seleccionar Dot Plot (desde Graph type/Specific).
3. Bajo Multiple Series seleccionar Multiple graphs.
4. Clic OK.

La gráfica se muestra aquí. Nótese que en contraste


con el entorno de gráfico único, donde cada serie se
representa en la misma escala, aquí cada gráfico tiene
su propia escala.
MS Gráficas Simples: Area Plot – Stack in One Graph
• También puede apilar sus series en un solo gráfico. Esto
suma los valores de cada serie verticalmente.
• Vamos a demostrar esto mediante la representación de
un Area Plot.

1. Siga los pasos 1-4 del primer ejemplo.


2. Seleccionar Area (desde Graph type/Specific).
3. Bajo Multiple Series seleccionar Stack in
single graph.
4. Clic OK.

• La gráfica se muestra aquí. Tenga en cuenta que aquí la


primera serie (tbill3m) se representa de la manera
habitual. La segunda serie (tbill6m) es la suma de la
primera y la segunda serie. La tercera serie (tnote2y) es la
suma de la primera serie de tres, etc
MS Gráficas Simples: Bar Graph- Resumen Estadístico
• Con múltiples series tiene sentido mirar las
estadísticas de resumen (media, mediana, etc.)
• Grafiquemos los medias de cada serie utilizando
un gráfico de barra.

1. Siga los pasos 1-4 del primer ejemplo.


2. Seleccionar Bar (desde Graph type/Specific).
3. Bajo Graph data seleccionar Means.
4. Clic OK.

• La gráfica se muestra aquí. Cada barra representa


la media de cada serie. Tenga en cuenta que la
media de la 3M Tbill es menor que la de 10Y note,
como era de esperar.
MS Gráficas Simples: Mixed

• La gráfica de tipo Mixed permite graficar todas las


series en 9 maneras diferentes, las principales
son: Area, Bar y Spike.

• Para realizar este tipo de gráficos, siga los


siguientes pasos:

1. Siga los pasos 1-4 del primer ejemplo.


2. Seleccionar Mixed (desde Graph
type/Specific).
3. Bajo Mixed settings seleccionar la primera
serie como Area.
4. Clic OK.
MS Gráficas Simples: Area Band
• Area Band dibuja una banda usando pares de serie
rellenando el área entre los dos conjuntos de valores.
• Estos tipos de gráficos se utilizan comúnmente para
visualizar bandas de pronóstico o bandas de error
alrededor de pronósticos.
1. Vamos a demostrar esto primero trazando solamente dos
series : tbill3m y tnote10y. Después de abrir esto como
un como grupo, se debe guardar como group02.
2. Abra group02.
3. Seguir los pasos 2-4 del primer ejemplo.
4. Seleccionar Area Band (desde Graph type/Specific).
5. Clic OK.
6. Abra group01 en la página Monthly.
7. Seguir los pasos 2-4 del primer ejemplo.
Note que el área sombreada azul es el
8. Seleccionar Area Band (desde Graph type/Specific).
espacio que se encuentra desde las
9. Clic OK. tasas 3M y 6m, mientras que el área
roja es el espacio entre los rendimientos
2Y y 10Y.
MS Gráficas Simples: Mixed, Area Band y Line
• Si quiere graficar un área sombreada con dos
observaciones y una línea por aparte, deberá
combinar los gráficos de tipo Mixed y seleccionar las
opciones que le interesen.

1. Primero vamos a crear un grupo con las siguientes:


tbill3M, tnote2Y, tnote10Y. Nómbrelo group03.
2. Abrir group03.
3. Siga los pasos 2-4 del primer ejemplo.
4. Seleccione Mixed (desde Graph type/Specific).
5. Seleccione Mixed settings y ajuste a sus
requerimientos
6. Clic OK
MS Gráficas Simples: Error Bars
• Error Bars se utilizan para graficar pares de
observaciones de las dos primeras series para marcar
valores altos y bajos.
• El gráfico dispone de un barra de error vertical que
conecta los valores de la primera y la segunda serie.

1. Clic sobre la página Daily. Recordar que se tiene


información diaria del S&P500 high, low, open, close
desde 1980 hasta 2012.
2. Seleccionar las series high y low (en este orden) y
generar un grupo con el nombre group_high_low.
3. Abrir group_high_low.
4. Las bandas de error son más eficaces cuando se limitan
a un pequeño número de observaciones, primero
vamos a restringir la muestra al inicio de la crisis
financiera : Sep 2008-Oct 2008.
5. Escriba esto en la ventana de comando:
smpl 2008m9 2008m10
Tenga en cuenta que dado que los valores de la
6. Siga los pasos 2-4 del primer ejemplo.
primera serie (High) son más grandes que la segunda
7. Seleccione Error Bar (desde Graph type/Specific). serie (Low), las barra tienen líneas horizontales en la
8. Clic OK. parte superior y la parte inferior de cada trazo.
MS Gráficas Simples: Error Bars (Continuación)
• Las barras de error normalmente se utilizan para mostrar tres
series donde se muestra los datos con bandas de error.
• Por ejemplo, puede mostrar las estimaciones puntuales, junto con
bandas de confianza después de la previsión de una serie.

1. Primero vamos a crear un grupo con las siguientes


series: high, low, close en este orden). Nombre el
grupo: high_low_close.
2. Siga los pasos 2-4 del primer ejemplo.
3. Seleccionar Error Bar (desde Graph type/Specific).
4. Clic OK.

Observe que los valores de cierre se muestran como


símbolos (puntos) en las barras de error formados la serie
high y low.
MS Gráficas Simples: Scatter Plot
• Los diagramas de dispersión se utilizan para examinar
visualmente la relación entre las variables.
• En los diagramas de dispersión simples, los valores de la
primera serie se representan frente a los valores de la
segunda serie.

1. Clic sobre la página Monthly. Crear un grupo que


consta de sp500 y employment_retail. Llamemos
al grupo sp500_retail.
2. Abrir sp500_retail. Siga los pasos 2-4 del primer
ejemplo.
3. Seleccionar Scatter (desde Graph type/Specific).
4. Clic OK.

Como se ve, hay una fuerte relación positiva entre el


desempeño del mercado de valores y el empleo en el
(aunque esto tiende a aplanarse para valores altos de
S&P 500).
MS Gráficas Simples: Scatter Plot
• Cuando sólo hay dos series no hay ambigüedad en cuanto a cómo se construye el gráfico
de dispersión: la primera serie está en el eje horizontal y el segundo en el eje vertical.
• Cuando hay más de dos series, EViews le da un número de opciones en la construcción
de gráficos de dispersión.

1. Sobre la página Monthly se va a crear un grupo que consta de: tbill3m,


tbill1y, tnote2y y tnote10y. Llamemos este grupo int_rates.
2. Abrir int_rates. Siga los pasos 2-4 del primer ejemplo.
3. Seleccionar Scatter (desde Graph type/Specific).
4. Bajo Details/Multiple Series, como se puede ver, usted tiene una serie de
opciones.
5. Seleccionamos la primera Single Graph – First vs. All.
6. Clic OK.

Como se observa en el gráfico, la opción Single Graph – First vs. All, traza la primera serie
(en nuestro caso 3m Tbill ) en el eje horizontal contra toda la serie restante que se representa
en el eje vertical.

La gráfica muestra todos los pares de gráficos en un solo gráfico.

Es un poco difícil de discernir todas las diferencias, pero es evidente que existe una relación
positiva entre el T Bill 3M y otras tasas de interés
MS Gráficas Simples: Scatter Plot
Multiple Graphs – First vs. All Single Graph– Stacked Single Graph – XY pairs

Observe que este ajuste traza la primera serie (Tbill Observe que la primera serie (tbill3m) se representa •Observe que los diagramas de dispersión se grafican en
3m) en contra de las demás series, pero cada par se frente a la segunda serie (tbill6m), a continuación, en pares: primera serie (tbill3m) se traza en contra de la
representa en gráficos separados. contra de la suma de la segunda y la tercera serie segunda serie (tbill6m), mientras que la tercera serie
Es un poco más fácil ver ahora (como es lógico), (tbill6m y tnote2y) y, finalmente, contra la suma de la (tnote2y) se representa frente al cuarto (tnote10y).
Tbill 3m está más estrechamente relacionado con las segunda, tercera y cuarta serie (tbill6m, tnote2y y •Observe también que la primera serie de cada par se
tasas d6M, en comparación a los otros tipos de tnote10y). encuentra en el eje horizontal, mientras que la segunda
interés serie se representa en el eje vertical.
•Si hay un número impar de serie, se ignora la última
serie
MS Gráficas Simples: Scatter Plot
Multiple Graphs – XY pairs Scatterplot matrix

Observe que la primera serie (tbill3m) se representa frente •Tenga en cuenta que los gráficos de dispersión se crean
a la segunda serie (tbill6m), mientras que la tercera serie para todas las posibles combinaciones de pares de las
(tnote2y) se representa gráficamente en contra de la cuatro series en el grupo.
cuarta (tnote10y). Los dos diagramas de dispersión se •Una última opción (matriz triangular inferior) es similar a
muestran en gráficas separadas. la matriz de dispersión, pero muestra sólo los elementos
triángulo inferior de la gráfica que se muestra aquí.
MS Gráficas Simples: XY Line
• XY line son gráficos muy similares a los de dispersión,
donde los puntos consecutivos se conectan con líneas.

1. Vamos a crear un grupo con dos series: tbill3m y


tnote10y. Llamemos el grupo: bill_note.
2. A veces es útil restringir la muestra a fin de obtener una
mejor visualización de la gráfica XY Line. Vamos a restringir
la muestra a partir de mayo de 2007 - mayo de 2008.
Escriba en la ventana de comandos :
smpl 2007m5 2008m5
3. Ahora abra bill_note. Clic View → Graph. La ventana de
dialogo Graph Option se abrirá.
4. Vamos agregar etiquetas a cada observación. Para esto,
debajo de Option pages, clic Graph Elements y
seleccionar Lines & Symbols..
5. Clic Symbol/Obs label y activar el comando Obs. label
(situado en la parte inferior del menú desplegable, como se
muestra aquí).
6. Bajo Options Pages, clic Graph Type/Basic Type.
7. Seleccionar XY Line (desde Graph type/Specific).
8. Clic OK
MS Gráficas Simples: XY Bar (X-X-Y triplets)
• XY Bar es algo similar a los histogramas.
• Muestran información de tres series en el uso de barras
donde la primera serie especifica el borde izquierdo de la
barra, la segunda serie el borde derecho y la tercera serie
de la altura de la barra.

1. Crear un nuevo grupo que consta de: tbill3m, tnote2y y


tnote10y. Llamemos este grupo tbill_tnote2y_tnote10y.
2. Los gráficos XY Bar son utilizados para mostrar un pequeño
número de observaciones. Vamos a restringir la muestra a partir
de agosto de 2008 - septiembre de 2008. Escriba en la ventana
de comandos :
smpl 2008m8 2008m9
3. Siga los pasos 2-4 del primer ejemplo.
4. Seleccionar XY Bar (desde Graph type/Specific).
Observe que las dos barras se trazan correspondientes a la
5. Clic OK. muestra de dos meses. El ancho de cada barra está
determinada por el valor de la primera (tbill3m) y la segunda
serie (tnote2y), mientras que la altura viene dada por la tercera
serie (tnote10y).
MS Gráficas Simples: Pie
• EViews produce Pie Charts para cada observación en una
serie.
• Los gráficos de Pie sólo están disponibles para múltiples
series.
• Los cortes del gráfico representan los valores de una serie
determinada como porcentaje del total del grupo.

1. Clic sobre la página Panel. Recordemos que aquí tenemos la


serie de la deuda total del gobierno central y de una serie de
países industrializados. También recuerde que a partir de los
ejemplos anteriores, la muestra se encuentra en el año 2010.
2. Se debe crear una nueva serie, llamada local_debt, la cual se
deriva de restar la deuda de central_gov de total_debt.
Escriba esto en el ventana de comandos:
series local_debt=total_debt-central_gov
3. Ahora se debe crear un grupo que consta de local_debt y
central_gov. Llamemos este grupo local_central.
4. Abrir el grupo. Siga los pasos 2-4 del primer ejemplo.
5. Seleccionar Pie Chart (desde Graph type/Specific).
6. Clic OK.
Gráficos de Panel
• EViews ofrece una serie de opciones al trazar
gráficos de datos de panel.
• Si desea trazar una serie con la estructura de datos
de panel, las siguientes opciones del panel aparecen:

Stack cross sections


Individual cross sections
Combined cross sections
Mean of cross sections
Median of cross sections
Gráficos de Panel: Stack Cross Sections

La opción Stack Cross Section (por defecto)


simplemente apila los datos de cada sección y representa
los datos sin tener en cuenta la estructura de panel.

El gráfico resultante es una representación de todas las


observaciones (Todas las fechas y cruces) en el archivo
de trabajo.

1. Clic sobr la página Panel.


2. Abrir la serie total_debt.
3. Clic View → Graph. Esto abrirá la venta de dialogo Graph
Option. Seleccionar Bar (desde Graph type/Specific).
4. Bajo Panel Options seleccionar Stack Cross Section.
5. Clic OK.
Gráficos de Panel: Individual Cross Sections
Si desea observar cada serie del corte transversal de
forma individual (en su propio gráfico), hay que
seleccionar la opción Individual Cross Sections.

1. Abrir la serie total_debt. Clic View → Graph y


seleccionar Bar (desde Graph type/Specific).
2. Bajo Panel Options seleccionar Individual Cross
Section.
3. Clic OK.

La gráfica se muestra aquí. Como se ve, cada


país se muestra en un gráfico independiente con
su propia escala.
También puede notar que los niveles de deuda
han aumentado de forma drástica para todas las
economías avanzadas en 2010, después de la
crisis financiera.
Gráficos de Panel: Combined Cross Sections
También puede representar gráficamente los valores del corte
transversal (por año) en un solo cuadro utilizando la opción
Combined Cross Sections.

1. Abrir la serie total_debt. Clic View → Graph y


seleccionar Bar (desde Graph type/Specific).
2. Bajo Panel Options seleccionar Combined Cross
Section.
3. Clic OK.

La gráfica se muestra aquí. Las comparaciones a


través del tiempo y de los países son un poco más
fácil ahora, porque todo se traza en la misma
escala.

Como se ve, los niveles de deuda han aumentado


en 2010 para todos los países. Japón tenía la
proporción más alta de la deuda con respecto al
PIB, mientras que España la más baja.
Gráficos de Panel: Means by cross section
EViews también le permite trazar medias o
medianas (a través de las secciones
transversales) mediante la opción Means by
cross section

1. Abirr la serie total_debt series. Clic View


→ Graph y seleccionar Bar (desde Graph
type/Specific).
2. Bajo Panel Options seleccionar Means by
Cross Section.
3. Clic OK.

La gráfica se muestra aquí. Este gráfico de


resumen muestra que los niveles de deuda de
las economías avanzadas han aumentado de
un promedio de 76% del PIB en 2000 al 110%
del PIB en 2010.
Análisis Estadístico
• El análisis de datos es una de las tareas más básicas pero
importantes cuando se trabaja con series y grupos de series.
• EViews ofrece un impresionante conjunto de herramientas
cuando se trata de análisis de datos, que incluyen estadísticas
descriptivas, gráficos estadísticos, pruebas y procedimientos.
• La mayor parte de las funciones de análisis de los datos se
pueden encontrar en View y en la opción de menú Proc.
1. Para ver las acciones disponibles para una serie, abra el
workfile Data.wf1. Clic sobre la página cross_section y abra
la serie GPA.
2. Clic sobre la opción de menú View. Aparecerá un menú
desplegable con una serie de opciones agrupadas en 4
secciones.
 La primera sección/bloque tiene opciones sobre vista de
observaciones.
El segundo bloque ofrece una suite de estadísticas generales.
El tercer bloque ofrece una suite de estadísticas para series de
tiempo
El cuarto bloque permite modificar o mostrar las etiquetas de la
serie.
Entrenamiento Especializado en Estimación y
Análisis de Cortes Transversales y Series de
Tiempo en EViews.

Violación de los supuestos de regresión


Prueba de los Supuestos del Modelo de M.C.O

1. Supuesto de linealidad
2. Supuesto del valor esperado del error
3. Supuesto de Homocedasticidad
4. Supuesto de no Autocorrelación
5. Supuesto del comportamiento del error
6. Supuesto de ortogonalidad
7. Otros problemas
1. Multicolinealidad
2. Forma funcional
3. Omisión de variables importantes
4. Variables redundantes
5. Estabilidad de los parámetros
Propiedades de los Coeficientes por M.C.O
Teorema de Gauss Markov:

 Lineal: función lineal de una variable aleatoria, como la variable dependiente Y en el modelo de regresión.

 Insesgamiento: su valor promedio o esperado, 𝐸(𝛽መ𝐼 ) es igual al valor verdadero 𝛽𝑖 .

 Eficiencia: tiene varianza mínima dentro de la clase de todos los estimadores lineales insesgados.

 Consistencia: los parámetros estimados por el modelo de M.C.O son consistentes, es decir:

lim Pr( 𝛽መ − 𝛽 > 𝛾) = 0


𝑛→∞

Donde Pr representa la probabilidad y gamma un número pequeño seleccionado arbitrariamente y que presenta la
diferencia (distancia) entre el parámetro y el coeficiente estimado. Conforme el tamaño de muestra aumente y tiene a
infinito, la probabilidad que el estimador de MCO sea diferente del verdadero valor poblacional. Esta propiedad es una
propiedad asintótica de los estimadores del modelo de M.C.O.
Propiedades de los Estimadores MCO
• Lineal->Función Lineal de una variable aleatoria, 𝐵෠ 𝑀𝐶𝑂 = (𝑋 ′ 𝑋)−1 𝑋 ′ 𝑌 → 𝑌 = 𝑋𝐵 + 𝑢

como la variable dependiente. 𝑋′𝑋 −1 ′


𝑋 𝑋𝐵 + 𝑢 = 𝑋 ′ 𝑋 −1 ′
𝑋 𝑋𝐵 + 𝑋 ′ 𝑋 −1
𝑋′𝑢 = 𝐵 + 𝑋′𝑋 −1
𝑋′𝑢

• Insesgado-> valor esperado es igual al valor


verdadero. 𝐸(𝐵෠ 𝑀𝐶𝑂 ) = 𝐸 𝑋 ′ 𝑋 −1 ′
𝑋 𝑌 = 𝐸 𝑋′𝑋 −1
𝑋 ′ (𝑋𝐵 + 𝑢)

𝐸(𝐵෠ 𝑀𝐶𝑂 ) = 𝐸 𝑋 ′ 𝑋 −1
𝑋 ′ 𝑋𝐵 + 𝐸( 𝑋 ′ 𝑋 −1 ′
𝑋 𝑢)) = 𝐵
• Eficiente-> Tiene varianza mínima dentro de la
clase de todos los estimadores lineales insesgados,
𝑉(𝐵෠ 𝑀𝐶𝑂 ) = 𝐸 𝐵෠ − 𝐵 ∗ 𝐵෠ − 𝐵 ′
un estimador insesgado con varianza mínima se
conoce como estimador eficiente. 𝑉(𝐵෠ 𝑀𝐶𝑂 ) = 𝐸 (𝐵 + 𝑋 ′ 𝑋 −1
𝑋 ′ 𝑢 −𝐸(𝐵෠ 𝑀𝐶𝑂 ) ∗ (𝐵 + 𝑋 ′ 𝑋 −1
𝑋 ′ 𝑢 −𝐸(𝐵෠ 𝑀𝐶𝑂 ))′

𝑉(𝐵෠ 𝑀𝐶𝑂 ) = 𝐸 (𝑋 ′ 𝑋 −1 ′
𝑋 𝑢𝑢′ 𝑋 𝑋 ′ 𝑋 −1
)
• Consistente->ampliando la muestra, el valor
𝑉(𝐵෠ 𝑀𝐶𝑂 ) = 𝜎 2 𝐼
estimado coincide con el real.

Dados los supuestos del modelo clásico de regresión lineal, los ෢ =𝐵 ෠ =0


estimadores de mínimos cuadrados, dentro de la clase de 𝑝 lim(𝐵) 𝑝 lim(𝑣𝑎𝑟(𝐵)
𝑛→∞ 𝑛→∞
estimadores lineales insesgados, tienen varianza mínima, es
decir, son MELI.
Violación de los supuestos de regresión

Supuesto 1: el modelo de mínimos cuadrados ordinarios, asume que la relación entre dos o más
variables puede ser adecuadamente modelada a través de una función lineal.
Supuesto 2: el valor esperado de los errores es igual a cero:
𝐸 𝑒 =0
Supuesto 3: la varianza de los errores es constante (Homocedástico) y, la autocorrelación entre
errores no contemporáneos es cero (no autocorrelación).

𝜎 2 𝑝𝑎𝑟𝑎 𝑖 = 𝑗
𝐸 𝑒2 =ቊ
0 𝑝𝑎𝑟𝑎 𝑖 ≠ 𝑗
Violación de los supuestos de regresión
Supuesto 4: la varianza de los errores se distribuye como una normal con
media igual a cero y desviación estándar a 𝜎 ∗ 𝐼𝑛 .
Supuesto 5: la covarianza de los errores con las variables independientes es
cero. Es decir, que los errores y las variables exógenas son ortogonales.
Supuesto 6: el numero de observaciones debe ser mayor que el número de
parámetros a estimar.
Supuesto 7: debe existir variabilidad en los valores de x, variable
independiente. Técnicamente la varianza de x debe ser un numero finito
positivo.
Violación de los supuestos de regresión
Supuesto 8: el modelo de regresión debe ser correctamente especificado,
esto indica que no existe ningún error en el modelo a estimar. La
especificación incorrecta o la omisión de una o más variables importantes,
hará muy cuestionable la validez del modelo.
Supuesto 9: No hay relaciones perfectamente lineales entre las variables. No
existe multicolinealidad perfecta.
Violación de los supuestos de regresión
Supuesto 1: el modelo de MCO asume que la relación entre la variable dependientes y las variables
independientes puede ser adecuadamente descrita por una ecuación lineal.
Se recuerda que se pueden tener relaciones no lineales entre las variables que pueden ser
convertida en ecuaciones lineales.

Para estudiar si los datos se ajustan a un modelo lineal se emplea la prueba de análisis de varianza
que se basa en la prueba F de Fisher. Las hipótesis que se desean probar son las siguientes:
𝐻𝑜 : 𝑁𝑜 𝑒𝑥𝑖𝑠𝑡𝑒 𝑢𝑛𝑎 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑒𝑛𝑡𝑟𝑒 𝑦 𝑦 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠
𝐻1 : 𝐸𝑥𝑖𝑠𝑡𝑒 𝑢𝑛𝑎 𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑒𝑛𝑡𝑟𝑒 𝑦 𝑦 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠

𝑅2ൗ
𝑘−1
Recordar que el estadístico de prueba es: 𝐹𝑐 = ൘1−𝑅2ൗ ,y el valor critico
𝑛−𝑘

asociado con esta prueba es una F(K-1,n-k)


Violación de los supuestos de regresión
Supuesto 2: el segundo supuesto se refiere a que la suma de los errores debe
ser cero. Siempre que se incluya el intercepto, este supuesto siempre será
satisfecho. Por lo tanto se recomienda incluir el intercepto al momento de
estimar el modelo de M.C.O y después hacer la prueba de hipótesis
correspondiente para ver si este parámetro estimado es efectivamente
estadísticamente no significativo, es decir, si se puede asumir que es igual a
cero.
Violación de los supuestos de regresión
Supuesto 3: Homocedasticidad 𝑽𝒂𝒓 𝒖 = 𝝈𝟐 . Este supuesto asume que la varianza de los errores es
constante y finita. La varianza de cada término de perturbación Ui, condicional a los valores
seleccionados de las variables independientes, es algún número constante igual a 𝝈𝟐 . De esta
manera, el supuesto de homocedasticidad hace referencia a: igual(homo) dispersión (cedasticidad).
Este supuesto asume que la varianza de los errores es constante y finita.
Violación de los supuestos de regresión
Supuesto 3: Homocedasticidad. ¿Cómo detectar?

1. Métodos Informales
a) Naturaleza del Problema
En la información de corte transversal que comprende unidades heterogéneas, la
heteroscedasticidad puede ser la regla y no la excepción. Por ejemplo, establecer relaciones
entre Ventas y Gasto Publicitario, Salarios en función de los años de escolaridad, Consumo e
Ingreso…

a) Método Gráfico
Se utiliza cuando no hay información a priori o empírica sobre la naturaleza de la
heteroscedasticidad. En la práctica se puede llevar a cabo un análisis de regresión y luego hacer
un examen de los residuos elevados al cuadrado, para ver si exhiben un patrón sistemático.
La idea es averiguar si el valor medio estimado de Y esta relacionado sistemáticamente con el
residuos al cuadrado.
Violación de los supuestos de regresión
Supuesto 3: Homocedasticidad. ¿Cómo detectar?
La Homocedasticiad en un modelo univariado, se puede apreciar mediante un
gráfico de dispersión entre la variable exógena (x) y el error estimado.

*Gráficos de los errores al cuadrado en función de la variable estimada.


Violación de los supuestos de regresión

Supuesto 3: Homocedasticidad. Razones para que el Término de Error no sea Constante


1. Modelos de Aprendizaje de los errores.
2. Comportamiento Aleatorio de los Agentes Económicos. Consumo
diferente, preferencias diferentes, ingresos diferentes.
3. Mejoramiento de las técnicas de recopilación de la información.
4. Presencia de datos atípicos. Un dato atípico es una observación
que proviene de una población distinta a la que genera las demás
observaciones de la muestra.
5. Violación del supuesto de buena especificación del modelo
(omisión de variables relevantes).
6. Asimetría en la distribución de una o más regresoras incluidas en el
modelo.
7. Incorrecta transformación de los datos y una forma funcional
incorrecta.
Violación de los supuestos de regresión
Supuesto 3: Homocedasticidad. ¿Cómo detectar?

2. Métodos Formales
a. Prueba de Park
Park formaliza el método gráfico con la sugerencia de que 𝜎𝑖2 es algún tipo de función de la
variables independiente X. La forma funcional es:

𝛽
𝜎𝑖2 = 𝜎 2 𝑋𝑖 𝑒 𝑣𝑖 o Ln 𝜎𝑖2 = 𝐿𝑛 𝜎 2 + 𝛽𝐿𝑛𝑋𝑖 + 𝑣𝑖
Como 𝜎𝑖2 por lo general no se conoce se puede utilizar la siguiente aproximación:

Ln 𝑢ො 𝑖2 = 𝐿𝑛 𝜎 2 + 𝛽𝐿𝑛𝑋𝑖 + 𝑣𝑖

Si 𝛽 resulta estadísticamente significativo, esto sugerirá heterocedasticidad en los datos.


Violación de los supuestos de regresión
Supuesto 3: Homocedasticidad. ¿Cómo detectar?

2. Métodos Formales
b. Prueba de Glejser
Similar a la de Park, después de obtener los residuos de la regresión por M.C.O, se
sugiere una regresión auxiliar sobre los valores absolutos de 𝑢ො 𝑖 sobre la variable X que se
cree muy asociada con 𝜎𝑖2 . Estas son las formas funcionales:

𝑢ො 𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑣𝑖
𝑢ො 𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝑣𝑖
1
𝑢ො 𝑖 = 𝛽0 + 𝛽1 + 𝑣𝑖
𝑋𝑖
1
𝑢ො 𝑖 = 𝛽0 + 𝛽1 + 𝑣𝑖
𝑋𝑖
Violación de los supuestos de regresión
Supuesto 3: Homocedasticidad. ¿Cómo detectar?

2. Métodos Formales
c. Prueba de Breusch-Pagan-Godfrey

𝑌𝑖 = 𝛽0 + 𝛽2 𝑋2𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝑢𝑖

La varianza del error se describe como

𝜎𝑖2 = 𝑓(𝛼0 + 𝛼1 𝑍1𝑖 + ⋯ + 𝛼𝑚 𝑍𝑚𝑖 )

La varianza del error es un función lineal de Z. Si la pendientes parciales son iguales a


cero, la varianza seria 𝛼0 , por lo tanto, una constante.
Violación de los supuestos de regresión
Supuesto 3: Homocedasticidad. ¿Cómo detectar?

Pasos de Elaboración de la Prueba:

1. Estimar una regresión por M.C.O y obtener los residuos


ෝ2
σ𝑢
2. Obtener la varianza del error, sea por estimador de máxima verosimilitud 𝜎෤ 2 = o por estimador
𝑛
ෝ2
σ𝑢
de M.C.O .
𝑛−𝑘
3. Construir las variables 𝑝𝑖 definidas como:

𝑢ො 𝑖2൘
𝑝𝑖 = Cada residuos elevado al cuadrado divido entre 𝜎෤ 2
𝜎෤ 2
4. Hacer la regresión de los 𝑝𝑖 construidos sobre las Z:

𝑝𝑖 = 𝛼0 + 𝛼1 𝑍1𝑖 + ⋯ + 𝛼𝑚 𝑍𝑚𝑖 + 𝑣𝑖

5. Obtener la suma cuadrada explicada y definir Theta. Si se supone que los errores están
normalmente distribuidos, se demuestra que hay homoscedasticidad.

1 2
𝜃= 𝑆𝐶𝐸 𝜃~𝑥𝑚−1
2
Violación de los supuestos de regresión
Supuesto 3: Homocedasticidad. ¿Cómo detectar?

2. Métodos Formales
d. Prueba general de Heteroscedasticidad de White
Propuesta que no se apoya en el supuesto de normalidad

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝑢𝑖


Pasos:
1. Estimar la regresión por M.C.O y obtener los residuos 𝑢ො 𝑖
2. Estimar la regresión auxiliar y obtener el 𝑅 2

𝑢ො 𝑖2 = 𝛼0 + 𝛼1 𝑋1𝑖 + 𝛼2 𝑋2𝑖 + 𝛼3 𝑋1𝑖


2 2
+ 𝛼4 𝑋2𝑖 + 𝛼5 𝑋1𝑖 𝑋2𝑖 + 𝑣𝑖
3. Según la hipótesis nula de que no hay heteroscedasticidad, puede demostrarse que el tamaño de
la muestra multiplicado por 𝑅2 obtenido de la regresión. Asintóticamente sigue la distribución ji
cuadrada con gl al número de regresoras.

2
𝑛 ∗ 𝑅2 ~𝑥𝑔𝑙

4. Si el valor ji cuadrada obtenido excede al valor ji cuadrada critico en el nivel de significancia


seleccionado, la conclusión es que hay heterocedasticidad.
Violación de los supuestos de regresión
Supuesto 3: Homocedasticidad. ¿Cómo detectar?
Se trata de observar su los errores estimados siguen algún patrón predeterminado de acuerdo
a los cambios de las variables explicativas, las variables explicativas al cuadrado y a los
productos cruzados de las variables explicativas.
La hipótesis a probar será la siguiente:
𝐻𝑜 : 𝛿1 = 0, 𝛿2 = 0, 𝛿3 = ⋯ , 𝛿𝑛 = 0 𝐸𝑙 𝑒𝑟𝑟𝑜𝑟 𝑒𝑠 ℎ𝑜𝑚𝑜𝑐𝑒𝑑á𝑠𝑡𝑖𝑐𝑜
𝐻𝑜 : 𝛿1 ≠ 0, 𝛿2 ≠ 0, 𝛿3 ≠ ⋯ , 𝛿𝑛 ≠ 0 𝐸𝑙 𝑒𝑟𝑟𝑜𝑟 𝑒𝑠 ℎ𝑒𝑡𝑒𝑟𝑜𝑐𝑒𝑑á𝑠𝑡𝑖𝑐𝑜
Se puede emplear el F test que seguirá una distribución 𝐹𝛿 (𝑚, 𝑛 − 𝑘) ó el LM test que seguirá una 𝑥 2 (𝑚). El estadístico de
prueba la el LM test, se basa en el 𝑅2 de la regresión auxiliar. Si las variables explicativas de esta regresión son

significativos el 𝑅2 será alto. 𝒏 ∗ 𝑹𝟐 ~𝒙𝟐 (𝒎)


Violación de los supuestos de regresión

Supuesto 3: Homocedasticidad. ¿Cuáles son las consecuencias?


La presencia de heterocedasticidad no tiene ningún efecto en los coeficientes
estimados, lo que continuarán siendo insesgados. Sin embargo ya no serán eficientes,
es decir, que no tendrán la mínima varianza entre todos los estimadores insesgados.
¿Cómo se corrige?
1. Transformar los datos utilizando logaritmos.(Cuidado con valores negativos)
2. Utilizar el método de White, quien derivo la matriz de varianzas y covarianzas
consistente con la presencia de heterocedasticidad.
Medidas Correctivas

La Heteroscedasticidad no destruye las propiedades de insesgamiento y consistencia de los


estimadores de M.C.O; sin embargo, éstos ya no son eficientes, ni siquiera asintóticamente.

a. Cuando se conoce 𝜎𝑖2 : método de los mínimos cuadrados ponderados

𝑌𝑖ൗ ∗ 1 ∗ 𝑋1ൗ 𝑢ො 𝑖
𝜎𝑖 = 𝛽෠0 ൗ𝜎𝑖 + 𝛽෠1 𝜎𝑖 + ( ൗ𝜎𝑖 )

b. Cuando no se conoce 𝜎𝑖2 ¿hay alguna manera de obtener estimaciones consistentes de


las varianzas y covarianzas de los estimadores de MCO aunque se presente
Heterocedasticidad?
Varianzas y errores estándar consistentes con heterocedasticidad de White
Estimación que puede realizarse de forma que las inferencias estadísticas sean asintóticamente válidas
sobre los verdaderos valores de los parámetros.
Medidas Correctivas

Errores estándar robustos de White

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝑢𝑖 𝑣𝑎𝑟 𝑢𝑖 = 𝜎𝑖2

σ 𝑥𝑖2 𝑢ො 𝑖2
𝑣𝑎𝑟 𝛽መ1 =
(σ 𝑥𝑖2 )2

El procedimiento se puede generalizar al modelo de k variables :

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1𝑖 + 𝛽2 𝑋2𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 + 𝑢𝑖

La varianza de todo coeficiente de regresión parcial, por ejemplo 𝛽መ𝑗 ,se obtiene así:

𝑁
ෝ𝑗𝑖2 𝑢ො 𝑖2
σ𝑤 𝑁
𝑣𝑎𝑟 𝛽መ𝑗 = O MATRICIALMENTE (𝑋 ′ 𝑋)−1 [෍ 𝑒𝑖𝑋𝑖 ′ (𝑒𝑖𝑋𝑖)](𝑋 ′ 𝑋)−1
ෝ𝑗𝑖2 )2
(σ 𝑤 𝑁−𝑘
𝑖=1
Donde 𝑢ො 𝑖2
son los residuos al cuadrado obtenidos de la regresión, y 𝑤ෝ𝑗𝑖2 son los residuos al cuadrado proporcionados por la
regresión auxiliar de la regresora 𝑋𝑗 sobre las regresoras restantes.
Medidas Correctivas

Supuestos Razonables sobre el patrón de Heterocedasticidad

Los estimadores obtenidos por el ajuste de varianzas y covarianzas de White pueden no ser tan eficientes
como los obtenidos por métodos que transforman la información. El procedimiento eficiente, MCG, pondera
cada residual cuadrado con el inverso de la varianza condicional de los errores dado la variable.

Supuesto 1: La varianza del error es proporcional a 𝑋𝑖2 𝐸 𝑢𝑖2 = 𝜎 2 𝑋𝑖2


𝑌𝑖 1 𝑢𝑖
= 𝛽1 + 𝛽2 +
𝑋𝑖 𝑋1 𝑋𝑖
Supuesto 2: La varianza del error es proporcional a 𝑋𝑖 𝐸 𝑢𝑖2 = 𝜎 2 𝑋𝑖
𝑌𝑖 1 𝑢𝑖
= 𝛽1 + 𝛽2 𝑋𝑖 +
𝑋𝑖 𝑋𝑖 𝑋𝑖
Supuesto 3: La varianza del error es proporcional al cuadrado del valor medio de Y𝐸 𝑢𝑖2 = 𝜎 2 [𝐸 𝑌𝑖 ]2
𝑌𝑖 1 𝑋𝑖 𝑢𝑖
= 𝛽1 + 𝛽2 +
𝑌෠𝑖 𝑌෠𝑖 𝑌෠𝑖 𝑌෠𝑖
Supuesto 4: Comprimir las escalas de medida en las variables. Modelo LOG-LOG
Medidas Correctivas
Supuestos Razonables sobre el patrón de Heterocedasticidad
MCG Factibles

En la mayoría de los casos, la forma exacta de la heterocedasticidad no es obvia. Es decir, es difícil encontrar la función del
comportamiento de la varianza del error. Sin embargo, en muchos casos puede modelarse la función y utilizar los datos para estimar
los parámetros desconocidos del modelo.

Hay muchas maneras de modelar la heterocedasticidad:

𝑉𝑎𝑟 𝑢 𝑥 = 𝜎 2 exp(𝛿0 + 𝛿1 𝑥1 + 𝛿2 𝑥2 + ⋯ + 𝛿𝑘 𝑥𝑘 )

෡ + 𝛿2 𝑌𝑖
log 𝑢2 = 𝛼0 + 𝛿1 𝑥1 + 𝛿2 𝑥2 + ⋯ + 𝛿𝑘 𝑥𝑘 + 𝑣𝑖 ó log 𝑢2 = 𝛼0 + 𝛿1 𝑌𝑖 ෡ 2 + 𝑣𝑖
Procedimientos
1. Realizar la regresión por M.C.O. La variable dependiente en función de las independientes y obtener los residuos.
2. Obtener el logaritmo de los residuos al cuadrado.
3. Realizar la regresión del logaritmo natural de los residuos en función de las variables independientes.
4. Sacar el antilogaritmo a los valores ajustados
5. Estimar la ecuación ponderando el residual al cuadrado con 1/ℎ෡𝑖
Medidas Correctivas

Supuestos Razonables sobre el patrón de Heterocedasticidad

Tener que estimar hi con los mismos datos significa que el estimador de MCGF deja de ser insesgado. Sin
embargo, el estimador de MCGF es consistente y asintóticamente más eficiente que M.C.O, por lo tanto,
tienen estadísticos de prueba con las distribuciones t y F, para muestras grandes. Si se tiene alguna duda
sobre el comportamiento de la varianza especificada en las ecuaciones, puede utilizarse errores estándar
robustos a la heterocedasticidad.

En casos de una fuerte heterocedasticidad, suele ser mejor usar una forma incorrecta de Heterocedasticidad
y emplear MCP que ignorar por completo la heterocedasticidad y usar M.C.O. Según Fox (1997), una
heterocedasticidad fuerte es cuando la varianza del error más grande sea mayor que 10 veces la más
pequeña.
Conclusiones

• Existen dos maneras de actuar en presencia de Heterocedasticidad: estimar los parámetros


mediante MCP o estimarlos mediante M.C.O y utilizar los errores estándar heterocedástico-
robustos.

• La ventaja de MCP consiste en que son mas eficientes que el estimador de M.C.O, al menos
asintóticamente. La desventaja esta en conocer la función de la varianza condicional. Si la forma
funcional es incorrecta, entonces los errores estándar calculados mediante rutinas de regresión MCP no
son validos, incluso para una muestra grande. No obstante, se podría aplicar errores robustos con el
propósito de estimar un modelo donde la función de la varianza este arbitrariamente mal especificada.

• La ventaja de utilizar errores robustos es que dan lugar a inferencias asintóticamente válidas incluso si
no se conoce la forma de la función de la varianza condicional. La desventaja es que el estimador de
MCO tendrá una mayor varianza que el estimador de MCP, al menos asintóticamente.

• Conclusión final: Siempre será buena idea calcular errores estándar y estadísticos de prueba
completamente robustos de la estimación de MCP.
Violación de los supuestos de regresión

Supuesto 4: No autocorrelación. Este supuesto establece que los errores de la regresión no deben
ser serialmente correlacionados, es decir, que los errores en el periodo i, no deben depender de los
errores de cualquier otro periodo j.
Violación de los supuestos de regresión
Supuesto 4: No autocorrelación. ¿Qué causa la autocorrelación de los errores?
La existencia de un patrón estacional.
El uso de una forma funcional incorrecta.
Omisión de variables relevantes.
¿Cómo se detecta?
El test de Durbin Watson permite determinar la presencia de autocorrelacion de primer
orden, es decir:
𝑒𝑖 = 𝑝𝑒𝑖−1 + 𝑣𝑖
La hipótesis son las siguientes:
𝐻0 : 𝑝 = 0 𝑛𝑜 ℎ𝑎𝑦 𝑝𝑟𝑒𝑠𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑝𝑟𝑖𝑚𝑒𝑟 𝑜𝑟𝑑𝑒𝑛
𝐻1 : 𝑝 ≠ 0 ℎ𝑎𝑦 𝑝𝑟𝑒𝑠𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑝𝑟𝑖𝑚𝑒𝑟 𝑜𝑟𝑑𝑒𝑛
Violación de los supuestos de regresión
Durbin Watson

σ𝑡=𝑛 ො 𝑡 − 𝑢ො 𝑡−1 )2
𝑡=2 (𝑢
𝑑=
σ𝑡=𝑛 ො 𝑡2
𝑡=1 𝑢
Violación de los supuestos de regresión
Supuesto 4: No autocorrelación. ¿Cómo se detecta?
El test de Breusch-Godfrey sigue la siguiente forma:
𝑒𝑖 = 𝑝𝑒𝑖−1 + 𝑝𝑒𝑖−2 + ⋯ + 𝑝𝑒𝑖−𝑚 + 𝑣𝑖
La hipótesis son las siguientes:
𝐻0 : 𝑝1 = 0, 𝑝2 = 0, … , 𝑝𝑚 = 0 = 0 𝑛𝑜 ℎ𝑎𝑦 𝑝𝑟𝑒𝑠𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛.
𝐻1 : 𝑝1 ≠ 0, 𝑝2 ≠ 0, … , 𝑝𝑚 ≠ 0 ℎ𝑎𝑦 𝑝𝑟𝑒𝑠𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑎𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖ó𝑛
El test se distribuye como una distribución chi-cuadrada con m grados de libertad, m es el
número de rezagos utilizados en la ecuación.
(𝑛 − 𝑚)𝑅 2 ~𝑥 2 (𝑚)
Violación de los supuestos de regresión
Supuesto 4: No autocorrelación ¿Cuáles son las consecuencias?
La presencia de autocorrelación no afecta la propiedad de insesgamiento de los coeficientes. Sin embargo
los parámetros no serán eficientes, esto significa que las inferencias serán incorrectas. En la presencia de
autocorrelación positiva, los errores estándar serán sesgados hacia abajo, lo que significa que los test
estadísticos sean grandes, lo que a su vez incrementará la probabilidad de rechazar la hipótesis nula siendo
verdadera. También, como la varianza de los errores es menor, el 𝑅 2 será mayor.
¿Como se corrige?
1. Primeras diferencias.
2. Método de Newey-West.
3. Método de Cochrane-Orcutt
Violación de los supuestos de regresión
Supuesto 4: No autocorrelación
1. Método de Cochrane-Orcutt
1. Este método se basa en el supuesto que la forma de la autocorrelación es
conocida o que se puede determinar analizando los datos.
2. Procedimiento
1. Estimar el modelo.
2. Determinar la autocorrelación usando un test.
3. Si se presenta autocorrelación se debe evaluar la regresión de los errores en función de
su pasado y obtener el valor de p.
4. Con ese valor p estimar la nueva regresión.
Violación de los supuestos de regresión
Supuesto 5: Normalidad de los errores. ¿Cómo se detecta?
El test de normalidad de Jarque Bera, tiene las siguientes hipótesis:
𝐻𝑜 : 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙
𝐻1 : 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑜𝑠 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑛𝑜 𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙
El test es dado por:

𝑛 2 1
𝐽𝐵 = 𝑆 + (𝑘 − 3)2 ~𝑥 2 2 ; 𝑠𝑖𝑒𝑛𝑑𝑜 𝑆 𝑒𝑙 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑎𝑠𝑖𝑚𝑒𝑡𝑟í𝑎 𝑦 𝑘, 𝑙𝑎 𝑐𝑢𝑟𝑡𝑜𝑠𝑖𝑠.
6 4
Violación de los supuestos de regresión
Supuesto 5: Normalidad de los errores ¿Cuáles son las causas?
Presencia de estacionalidad en los datos
Presencia de valores extremos
¿Cómo se corrige?
1. Hacer caso omiso si se cuenta con una muestra bastante amplia.
(Teorema del limite central)
2. Incluir variables dicotómicas temporales ó inclusión de valores extremos.
Violación de los supuestos de regresión
Otros problemas del modelo de M.C.O: Multicolinealidad
Se presenta cuando hay una alta correlación entre las variables explicativas
del modelo.
¿Cómo detectar?
1. Se observarán 𝑅2 bastantes altos acompañados de parámetros
estadísticamente no significativos.
2. Evaluar el factor inflador de varianza, a partir de regresiones auxiliares de
la variable independiente en función de las independientes.

1
𝐹𝐼𝑉 = 2 > 10 𝑠𝑒 𝑡𝑖𝑒𝑛𝑒 𝑚𝑢𝑙𝑡𝑖𝑐𝑜𝑙𝑖𝑛𝑒𝑎𝑙𝑖𝑑𝑎𝑑
1 − 𝑅𝐽
Violación de los supuestos de regresión
Otros problemas del modelo de M.C.O: Multicolinealidad ¿Cómo se corrige?

1. No hacer nada, si la variable que se sospecha tiene multicolinealidad es


significativa, se puede incurrir en un error de especificación al omitirla.
2. Expresar el modelo en primeras diferencias.
3. Eliminar la variables si no es significativa.
Violación de los supuestos de regresión

Otros problemas del modelo de M.C.O: Forma funcional


Otro posible problema, es que la forma funcional de la regresión (lineal) no sea la
adecuada para capturar la relación entre la variables dependiente y las independientes.
¿Cómo se detecta?
Test de Ramsey, esta destinado a probar los errores de especificación del modelo, los
que se pueden deber a:

Variables omitidas
Formas funcionales incorrectas
Presencia de correlación entre los errores y las variables independientes.
Violación de los supuestos de regresión
Otros problemas del modelo de M.C.O: Forma funcional ¿Cómo se detecta?
Test de Ramsey:
La hipótesis de este test son:

𝐻𝑜 : 𝑙𝑎 𝑓𝑜𝑟𝑚𝑎 𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑎𝑙 𝑙𝑖𝑛𝑒𝑎𝑙 𝑒𝑠 𝑐𝑜𝑟𝑟𝑒𝑐𝑡𝑎


𝐻1 : 𝑙𝑎 𝑓𝑜𝑟𝑚𝑎 𝑓𝑢𝑛𝑐𝑖𝑜𝑛𝑎𝑙 𝑙𝑖𝑛𝑒𝑎𝑙 𝑒𝑠 𝑖𝑛𝑐𝑜𝑟𝑟𝑒𝑐𝑡𝑎
El estadístico está dado por:

𝑛𝑅2 ~𝑥 2 𝑞 − 1 ; 𝑠𝑖𝑒𝑛𝑑𝑜 𝑞 𝑒𝑙 𝑜𝑟𝑑𝑒𝑛 𝑑𝑒𝑙 𝑝𝑜𝑙𝑖𝑛𝑜𝑚𝑖𝑜


Violación de los supuestos de regresión

Otros problemas del modelo de M.C.O: Estabilidad de los parámetros estimados


Se asume que los parámetros estimados son estables en el tiempo. Es decir, que si reestiman los
parámetros después de cierto tiempo, estos serán los mismos estadísticamente.
La prueba se basa en dividir la muestra en dos y analizar los cambios en los valores de los
coeficientes; esta división de muestras está dada por el conocimiento de algún evento importante
que puede haber causado la inestabilidad de los coeficientes. La prueba más común es el test de
estabilidad de Chow
La hipótesis es la siguiente:
𝐻0 : 𝑙𝑜𝑠 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑠 𝑠𝑜𝑛 𝑒𝑠𝑡𝑎𝑏𝑙𝑒𝑠
𝐻1 : 𝑙𝑜𝑠 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒𝑠 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑠 𝑛𝑜 𝑠𝑜𝑛 𝑒𝑠𝑡𝑎𝑏𝑙𝑒𝑠
Curso de Series de Tiempo
Entrenamiento especializado en EViews®
Modelos

Teoría Hechos Teoría Estadística

Modelo Datos

Modelo Teoría
Datos Selectos
Econométrico Econométrica

Estimación del modelo econométrico con los datos selectos


usando técnicas econométricas

Análisis Estructural Predicción y Pronóstico Evaluación Política


Comprender fenómenos reales. Invertir o no (Simulación)
Prueba y validación con respecto a las Comprar o no Predicciones Condicionadas
relaciones económicas. Intervenir o no

Basado en Intriligator (1990) Modelos Econométricos, Técnicas y Aplicaciones. Construido por Norberto Rodríguez Niño
¿Qué debemos responder con los modelos?

 ¿Existe alguna relación entre el nivel de tasa de interés y el índice de la bolsa?

 ¿Cómo afectan las uniones y fusiones de empresas los retornos (rendimientos) de los inversionistas?

 ¿Debo invertir en títulos de Gobierno de largo plazo o títulos Privados de corto plazo?

 Probar si el Modelo CAPM representa un modelo adecuado para la determinación de los retornos de un activo.

 Medir y pronosticar la volatilidad de retornos de bonos.


Los expertos en cada caso tendrán ALGO que decir (especular) pero difícilmente están seguros de CUÁNTO, en esos casos
la Modelación cuantitativa les puede ayudar.
En general todas estas preguntas cuantitativas son:

1. Complicadas de responder y

2. (Usualmente) se requiere de una respuesta para la toma de decisiones.


Pronóstico Financiero
Metodologías de Evaluación de pronóstico Combinación del pronóstico
pronóstico y Modelación Puntual o por intervalo. Vía ¿Cómo se aplica?
Teoría, estimación, evaluación y procesos de estimación o
pronóstico. A nivel univariado o simulación de Montecarlo. Para un
multivariado. horizonte h, fijo o en rolling

Econométrico
Estadísticos de error
Algunas técnicas de
combinación.
Procesos estocásticos

Pruebas de hipótesis
Inteligencia artificial
Clasificación de los Modelos Econométricos
Tipo de Efecto: Filosofía Estadística:
Lineales Vs No Lineales Frecuentista (Clásica) Vs Bayesiano

Carácter: Supuestos del Modelo:


Estáticos Vs Dinámicos Paramétrica (Supuesto de forma funcional y distribución del
término de error) Vs Semi-paramétrica (Supuesto de forma
Dimensionalidad: funcional o distribución del término de error) Vs No paramétrica
Uniecuacional Vs Multiecuacional (Ninguna de las dos)

Tipo de Observaciones:
Series de Tiempo Vs Corte Transversal Vs Datos de Panel

Variable a Explicar:
Cuantitativa (Continua) Vs Cualitativa (Discreta)
Metodologías del Pronóstico y Modelado
Procesos estocásticos (Taxonomía):

Supuestos:

No Fraccionales *Fraccionales
(Black, Scholes and Merton, 1973) (Biagini and Oksendal, 2011), (Mandelbrot, 1972), (Taqqu,
Econometría (Taxonomía) Univariada:

(Black and Scholes, 1976) 1999), …


(Cox, Ingersoll and Ross, 1985), …

Volatilidad constante. Volatilidad estocástica


(Black, Scholes and Merton, 1973) (Heston, 1993),…
(Black and Scholes, 1976)
(Cox, Ingersoll and Ross, 1985), …

Normalidad Saltos por Difusión


(Black, Scholes and Merton, 1973) (Oksendal, 2004)
(Black and Scholes, 1976) (Cheridito, 2001), …
(Cox, Ingersoll and Ross, 1985),…

Variables de interés:

Precios Tasas
(Hull and White, 1990) (Vasicek, 1977)
(Black, Scholes and Merton, 1973) (Cox, Ingersoll and Ross, 1985)
(Black and Scholes, 1976) (Hull and White, 1990)
(Cox, Ingersoll and Ross, 1985), …

Taxonomía (Cantidad de variables):

Univariados Multivariados

(Todos los anteriores),… (Heston, 1993)..


VAR-VEC (from SIMS, 1980)

Fuente: (Ariza, 2016) basado en (Granger y Teräsvirta, 1993) y (Jalil y Misas, 2006).
Series de Tiempo
 Proceso estocástico es un conjunto de variables aleatorias asociadas a distintos instantes de tiempo.

 Serie temporal es un conjunto de observaciones o medidas realizadas secuencialmente en intervalos predeterminados y de igual,
o aproximadamente igual, duración. Es una realización del proceso estadístico, es decir, es una observación de T variables
aleatorias ordenadas en el tiempo.

 La relación entre una serie temporal y el proceso estocástico que la genera es la misma que hay entre una muestra y la variable
aleatoria de la que procede.

 Las peculiaridades de una serie temporal (frente a una muestra) y de un proceso estocástico (frente a una variable aleatoria) son:
1) Las series temporales y los procesos estocásticos están referidos a instantes de tiempos concretos y 2) los datos están
ordenados.

 El objetivo del análisis de series temporales es inferir la forma del proceso estocástico a partir de las series temporales que
genera.
X

100

-100
0

-80
-60
-40
-20
20
40
80

60
1
14
27
40
53
66
79
92
105
118
131
144
157
170
183
196
209
222
235
248
261
274
287
300
313
Series de Tiempo

326
339
352
365
378
391
404
417
430
443
456
469
482
495
508
Tiempo
Trayectorias

521
534
547
560
573
586
599
612
625
638
651
664
677
690
703
716
729
742
755
768
781
794
807
820
833
846
859
872
Ejemplo de proceso estocástico y serie de tiempo: 35 realizaciones de paseos aleatorios de tamaño 1000.

885
898
911
924
937
950
963
976
989
Patrones de una Serie de Tiempo
Se busca responder la siguiente pregunta: ¿Por qué la serie no se comporta de la siguiente
manera?
10

7 Por:
6 •Tendencia
•Estacionalidad
Xt

5
•Ciclicidad
4
•Aleatoriedad
3 •Intervenciones-outliers
2

0
1 2 3 4 5 6 7 8 9 10
Tiempo
Patrones de una Series de Tiempo
Tendencia 𝑇𝑡
20,000
 La tendencia representa el comportamiento predominante
de la serie. Esta puede ser definida como el cambio de la
16,000
media a lo largo de un periodo.
 Son movimientos a lo largo de una serie de tiempo, estos 12,000
movimientos son de largo plazo. La tendencia es el
componente que representa el crecimiento (o la declinación) 8,000
subyacente en una serie de tiempo, durante un periodo
extenso. Para una serie de tiempo con tendencia, el nivel de 4,000
la serie no es contante, en otras palabras, es una serie no
estacionaria. La tendencia puede ser determinística o
estocástica. 0
M3 M4 M5 M6 M7 M8 M9 M10 M11 M12
2017

Bitcoin Tendencia
Patrones de una Serie de Tiempo Year % Change GDP
20
Ciclo 𝐶𝑡 : Se refiere a oscilaciones alrededor de la tendencia y son de
larga duración, períodos mayores de un año. Estas oscilaciones 16
periódicas no son regulares (diferencias en duración e intensidad) y se 12
presentan en los fenómenos económicos cuando se dan de forma
alternativa etapas de prosperidad o de depresión. Los patrones 8

cíclicos son difíciles de modelar porque sus patrones generalmente 4


son inestables, al ser difíciles de identificar y complejos de separar de
0
la serie tendencial, con frecuencia el ciclo de la serie de tiempo se le
atribuye como parte de la tendencia, para formar así un componente -4
50 55 60 65 70 75 80 85 90 95 00 05 10 15
𝑇𝑡 , que contiene el componente tendencia-ciclo
Clothing stores

Estacionalidad 𝑆𝑡 : es una serie de tiempo con un patrón de cambio 24,000


que se repite a si mismo año tras año. Es un cambio más o menos
20,000
estable que aparece regularmente a lo largo del tiempo. En otras
palabras es un componente de corto plazo que se repite 16,000
periódicamente en periodos inferiores a un año (casa “S” periodos).
Para datos anuales, la estacionalidad no tendría sentido estimarla 12,000
porque no existe la posibilidad de modelar un patrón con datos que se
recopilan una vez por año. Se ocasionan por causas climáticas, 8,000
normas, usos sociales o económicos.
4,000
92 94 96 98 00 02 04 06 08 10 12 14
Patrones de una Serie de Tiempo
Precio promedio de la Papa (Bogotá, COP/Kg)
2,400
Paro Camionero
Paro Camionero y Agrario
2,000 Paro Camionero

Outliers: Son puntos de la serie que se escapan de lo normal. Un


outliers es una observación de la serie que corresponde a un 1,600

comportamiento anormal del fenómeno o a un error de medición. Se 1,200


debe determinar si un punto dado es outlier o si puede ser una
800
intervención.
400

0
2012 2013 2014 2015 2016 2017

ALEATORIO
Irregular, 𝐼𝑡 : patrón intrínseco de la serie , es un componente de corto
1.0
plazo que captura las fluctuaciones impredecibles o aleatorias que se
presentan por sucesos inusuales y no corresponden a los tres 0.8
componentes antes mencionados, por lo tanto, su comportamiento es
un efecto residual de la serie de tiempo. Son movimientos erráticos 0.6

que no poseen carácter periódico o funcional reconocible.


0.4

0.2

0.0
1980 1985 1990 1995 2000 2005 2010 2015
Modelo

Es una expresión básica, esta dada por:

𝑦𝑡+ℎ = 𝑓 𝐼𝑡 + 𝑒𝑡+ℎ


𝑦ො𝑡+ℎ = 𝑓 𝐼𝑡 ≅ 𝐸[𝑦𝑡+ℎ |𝐼𝑡 ]

𝑒𝑡+ℎ =𝑦𝑡+ℎ - 𝑦ො𝑡+ℎ


¿Cómo evaluar un modelo?

Estadísticas de error, medidas básicas

1
MAD “Desviación media absoluta”: Mide la exactitud del 𝑀𝐴𝐷 =
𝑛
෍ 𝑌𝑡 − 𝑌෡𝑡
pronóstico, promediando la magnitud de los errores.
1 2
𝑀𝑆𝐸 = ෍ 𝑌𝑡 − 𝑌෡𝑡
MSE “Error cuadrático medio”: Sanciona errores grandes en 𝑛

la elaboración de pronósticos.
1 2
𝑅𝑀𝑆𝐸 = ෍ 𝑌𝑡 − 𝑌෡𝑡
𝑛
RMSE “Raiz cuadrada MSE”
¿Cómo evaluar un modelo?

MAPE “Error porcentual absoluto medio” 1 𝑌𝑡 − 𝑌෡𝑡


𝑀𝐴𝑃𝐸 = ෍
𝑛 𝑌𝑡

MPE “Error porcentual medio”: Mide el sesgo del pronóstico. 1 𝑌𝑡 − 𝑌෡𝑡


𝑀𝑃𝐸 = ෍
𝑛 𝑌𝑡

𝑅𝑀𝑆𝐸
𝑈 − 𝑇𝐻𝐸𝐼𝐿1 =
1 𝑛 1 𝑛 ෠2
σ𝑡=1 𝑌𝑡2 + σ 𝑌
𝑛 𝑛 𝑡=1 𝑡
Coeficiente de desigualdad de Theil: Permite analizar la
bondad de ajuste del modelo. Un coeficiente cercano a cero, 2
1 𝑌෠𝑡+1 − 𝑌𝑡+1
indica que la técnica usada es mejor que el método naive. σ𝑛−1
𝑛 − 1 𝑡=1 𝑌𝑡
𝑈 − 𝑇𝐻𝐸𝐼𝐿2 = 2
1 𝑌𝑡+1 − 𝑌𝑡
σ𝑛−1
𝑡=1
𝑛−1 𝑌𝑡
Medidas de Precisión
1. Medidas Dependientes de Escala
a) MSE (Mean Square Error)
Se define MSE (Mean Square Error) como la media de 𝑒𝑡2 , es decir el promedio de los errores entre el estimador y lo que se
estima al cuadrado:
1
𝑀𝑆𝐸 = 𝑛 σ𝑛𝑡=1(𝑦𝑡 − 𝑦ො𝑡 )2

Donde 𝑛 es el número de muestras y 𝑦ො𝑡 es la estimación de 𝑦𝑡 . De la fórmula anterior se deduce que la función de pérdida de la
medida es la cuadrática o error medio al cuadrado.
Características Desventajas

• EL MSE es el segundo momento del error y por lo tanto relaciona la varianza • Por su fórmula en sí, es una medida sensible a valores estimados
del estimador así como su sesgo: Entre más pequeño es el MSE más se atípicos quizás con poca frecuencia de ocurrencia. Esto arrojará un valor
ajusta el estimador a los datos reales. superior en la diferencia con el dato real que se incrementará con la
• El elevar las diferencias al cuadrado hace que los datos negativos y positivos potencia cuadrada y por ende, tendrá un peso en el cálculo del promedio
no se cancelen entre sí. Adicionalmente, al ser de naturaleza cuadrática, haciéndola poco confiable.
otorga mayor peso a aquellos errores de mayor tamaño siendo útil en los • Por la diferencia de unidades en relación con los datos originales es
casos en los que el pronóstico implica una valoración de los errores de esta difícil de interpretar.
manera pero no en aquellos donde no se dé relevancia a lo anterior.
• Las unidades del MSE no son las mismas de los datos ni del estimador.
• Toma valores entre 0 y ∞.
Medidas de Precisión
1. Medidas Dependientes de Escala
b) RMSE (Root Mean Square Error)
Se define RMSE (Root Mean Square Error) como la raíz cuadrada de la media de los errores al cuadrado:
2 2 1 𝑛 2
𝑅𝑀𝑆𝐸 = 𝑀𝑆𝐸 = σ 𝑦𝑡 − 𝑦ො𝑡
𝑛 𝑡=1

Donde n es el número de muestras, 𝑦ො𝑡 corresponde a los valores observados de 𝑦𝑡 y 𝑦𝑡 se modela en valores en tiempo o lugar t.
La función de pérdida de la medida es la cuadrática o error medio al cuadrado.

Características Desventajas

• La raíz del error cuadrático medio (RMSE) también llamado desviación • Se debería evitar el uso de del RMSE cuando la evaluación de error es
cuadrática media es una medida de uso frecuente de la diferencia entre los tan crudo que hay valores atípicos (grandes errores de medición).
valores pronosticados por un modelo y los valores realmente observados. Estos valores tendrán un fuerte efecto en la medida en que se elevan
Estas diferencias individuales son también llamadas residuos y el RMSE al cuadrado. Al igual que la MSE, RMSE es una herramienta muy
sirve para agregar en una sola medida la capacidad de predicción. popular por su relevancia teórica en la modelación estadística, sin
embargo, varios autores las han rechazado precisamente por su
• El RMSE es más apropiado que el MAE para representar el rendimiento del sensibilidad a valores atípico.
modelo cuando se espera que la distribución de error sea gaussiana. La
diferencia con la medida MSE es que el resultado está en las unidades
originales de la información histórica.
Medidas de Precisión
1. Medidas Dependientes de Escala
c) MAE (Mean Absolute Error)
Se define MAE (Mean Absolute Error) como la magnitud promedio de los errores de un ejercicio de pronóstico sin tener en cuenta su
signo, es decir, el promedio de los valores absolutos de los errores calculados:
1
𝑀𝐴𝐸 = 𝑛 σ𝑛𝑡=1 𝑦𝑡 − 𝑦ො𝑡
Donde 𝑛 es el número de muestras y 𝑦ො𝑡 es la estimación de 𝑦𝑡 . La función de pérdida de la medida es la del error absoluto.

Características Desventajas
• MAE arroja un número que puede ser directamente interpretado puesto • Puesto que la mayoría de modelos tienen una asunción en el sentido que
que la pérdida se encuentra en las mismas unidades de la variable de los errores se encuentran distribuidos como una normal y no como una
salida. función uniforme, es posible encontrar métricas que se ajustan de una
• El peso asignado a cada uno de los errores calculados es el mismo. mejor manera a los datos: Este es el caso por ejemplo de RMSE.
• El uso de esta medida es aconsejable para describir errores • Un importante aspecto en las métricas de error es su capacidad de
uniformemente distribuidos. discriminar entre los resultados del modelo. Cuando se utiliza MAE, los
• El hecho mismo de ser una medida absoluta podría convertirse en una resultados podrían estar afectados por una gran cantidad de valores de
desventaja, sin embargo, por no ser de naturaleza cuadrática, recibe error promedio sin necesariamente reflejar errores de gran tamaño.
menos influencia de valores atípicos. • Por la inclusión de valores absolutos en su cálculo, el uso de MAE podría
• Toma valores entre 0 y ∞. significar dificultades en los cálculos de la sensibilidad del valor de MAE
con respecto a los parámetros del modelo en cuestión.
Medidas de Precisión
2. Medidas Basadas en Porcentaje
a) MAPE (Mean Absolute Percentage Error)
MAPE (Mean Absolute Percentage Error) mide el tamaño del error en términos porcentuales lo cual lo hace no dependiente de la
escala. Se calcula como el promedio de los errores porcentuales sin tener en cuenta el signo:
1 𝑦𝑡 −𝑦ො𝑡
𝑀𝐴𝑃𝐸 = σ𝑛𝑡=1
𝑛 𝑦𝑡

Donde 𝑛 es el número de muestras, 𝑦𝑡 es el valor actual y 𝑦ො𝑡 es la estimación. La función de pérdida de la medida es la del error absoluto.

Características Desventajas
• .El uso de esta métrica está asociado a series de tiempo homogéneas e • Por la fórmula misma, si hay valores en cero, esto significará una división
igualmente espaciadas. entre cero. A pesar que lo anterior se soluciona desestimando aquellos
• La métrica es sensible a la escala y no debe ser utilizada en casos donde datos en cero, varios problemas podrían surgir cuando se tienen valores
hay un bajo nivel de datos. de 𝑦𝑡 muy pequeños y 𝑦ො𝑡 grandes ya que esto redunda en valores de
• Puesto que está dado en términos porcentuales, es más fácil de entender MAPE extremadamente grandes que podrían hacer las comparaciones
que los valores arrojados por otras métricas y por ello, es común que inútiles. De esta manera, casos en los cuales donde el valor cero es
MAPE sea usada para comparar diferentes modelos de pronóstico con importante, por ejemplo pronósticos de temperaturas en grados
conjuntos de datos diferentes. Fahrenheit o Centígrados, este tipo de medidas podría no ser de las
• La métrica tiene propiedades estadísticas valiosas por cuanto usa todas las preferidas para la comparación de modelos.
observaciones y tiene la más pequeña variabilidad de muestra a muestra • Un mismo valor de error puede significar un porcentaje diferente: Casos
• Toma valores entre 0 y ∞. en que Si 𝑦𝑡 es mayor que 𝑦ො𝑡 , esto arrojará un porcentaje más pequeño
que cuando 𝑦𝑡 es menor que 𝑦ො𝑡 .
Medidas de Precisión
3. Estadístico U de Theil
Henri Theil propuso dos medidas de error en diferentes momentos. El estadístico U1 hace referencia a una medida de exactitud mientras que el U2
hace referencia a una medida de calidad del pronóstico:
2
σ𝑛 2 1 𝑌෠𝑡+1 − 𝑌𝑡+1
𝑡=1 𝑦𝑡 −𝑦ො𝑡 σ𝑛−1
𝑈2 − 𝑇𝐻𝐸𝐼𝐿 = 𝑛 − 1 𝑡=1 𝑌𝑡
𝑈2 − 𝑇𝐻𝐸𝐼𝐿 =
σ𝑛 2 𝑛 ො𝑡 2
𝑡=1 𝑦𝑡 + σ𝑡=1 𝑦 1 𝐹𝑁𝑡 − 𝑌𝑡+1 2
σ𝑛−1
𝑡=1
𝑛−1 𝑌𝑡
Donde 𝑛 es el número de muestras, 𝑦𝑡 es el valor actual, 𝑦ො𝑡 es la estimación del modelo y 𝐹𝑁𝑡 es el pronóstico seleccionado de comparación que
suele ser el de caminata aleatoria o el modelo ingenuo o naive.
El U1 tiene poco valor como un índice de la exactitud de un pronóstico: Sin importar si se trabaja con datos absolutos o deltas de cambio, los
valores serán delimitados entre 0 (el mejor caso) y 1 (el peor caso).
Características Desventajas

• El estadístico U2 toma valores entre 0 y ∞. Un valor de 1 significa que la • El estadístico U de Theil es altamente influenciado por los valores
exactitud del modelo de pronóstico seleccionado es la misma que el atípicos. En el límite inferior cuando el numerador de la expresión es
modelo de referencia. Un valor por debajo de 1 significa que el modelo cercano a cero, su cuadrado será aún más cercano a cero. Por el
es mejor que el de referencia y un valor mayor a 1 significa lo opuesto: contrario, en el límite superior, cuando 𝑦𝑡 y 𝐹𝑁𝑡 tienden a cero, el
estadístico tendrá una tendencia hacia infinito.
Procesos de Validación y Ajuste

෣|I 𝑇 ]
𝐸[𝑌𝑇+ℎ

Donde:

h es el horizonte de pronóstico

I 𝑇 es la información conocida hasta


el periodo de tiempo T.
Procesos de Validación y Ajuste

AJUSTE VALIDACION
RMSE MAD MAPE RMSE MAD MAPE
m=2 122,918785 96,3168519 4,4844% 56,4620724 47,7366667 2,5238%
m=3 139,191153 110,044088 5,1215% 44,2317593 39,4983333 2,1119%
m=6 175,288553 139,843833 6,6358% 58,6980368 43,9161111 2,3992%
m=12 234,829011 198,30303 9,5102% 86,1648938 74,4141667 4,0374%
α=0,1 196,349289 166,007529 7,9354% 132,492088 125,168817 6,7540%
α=0,3 149,663603 121,523721 5,6984% 49,2514166 39,4983333 2,1477%
α=0,5 124,909581 99,7900581 4,6591% 44,9519512 39,5684481 2,1120%
α=0,7 112,143516 88,1438239 4,1179% 53,8701258 46,3333863 2,4530%
α=0,9 105,610935 80,9488088 3,7920% 61,0510205 51,7475282 2,7333%

Ajuste: Estimación de lo existente con los que se


construye el modelo.
Pronóstico
Validación : estimación de datos futuros existentes.
Modelos univariados de Series de Tiempo

MÉTODOS DE SUAVIZACIÓN-FILTROS “FORMALES”-METODOLOGÍA BOX-JENKINS ARIMA

Los métodos de pronóstico dependen del tipo de Métodos basados en la teoría estadística y
patrones de datos que posea la variable objeto de econométrica de las series de tiempo. Propuesto por
estudio. Estos patrones pueden ser de tendencia, los estadísticos George E. P. Box y Gwilym Jenkins
estacionales y aleatorios, principalmente. Algunos 1970-1976.
modelos son:
Promedios móvil simple y doble. Suavización
exponencial simple, doble, de Holt-Winters no
estacional y Holt-Winters estacional (aditivo y
multiplicativo)
Métodos de Suavización

Promedio Móvil (MA)


 El MA para el período t es la media aritmética de las (m) observaciones más recientes.

 Trabajan mejor con los datos estables, no maneja muy bien la tendencia o la estacionalidad.

 Mientras más grande es el orden del MA utilizado, mayor es el efecto del suavizamiento, pero como
pronóstico coloca muy poca atención a las fluctuaciones.

𝑌𝑡 + 𝑌𝑡−1 + ⋯ 𝑌𝑡−𝑚+1
𝑀𝑡 = Ajuste k=1
𝑚
Validación Pronóstico
k=#Valores futuros a pronosticar
t=último dato ajustado
𝑌෠𝑡+𝑘 = 𝑀𝑡
Métodos de Suavización

Suavización Exponencial Simple (SES)

 Permite revisar continuamente el pronóstico a la luz de los nuevos datos actualizados.

 Se basa en promediar o suavizar los valores pasados de una serie de tiempo de una manera decreciente o
exponencial.

 Las ponderaciones utilizadas son  para el valor más reciente, (1- ) para el siguiente valor más reciente, (1-
)2 para el siguiente y así sucesivamente.

 Trabajan mejor con los datos estables, no maneja muy bien la tendencia o la estacionalidad

𝐴𝑡 = 𝛼𝑌𝑡 + 1 − 𝛼 𝐴𝑡−1 → 𝐶𝑜𝑛 0 ≤ 𝛼 ≤ 1 Ajuste k=1

Validación Pronóstico
𝑉𝑎𝑙𝑜𝑟 𝐼𝑛𝑖𝑐𝑖𝑎𝑙: 𝐴𝑜 = 𝑋1 k=#Valores futuros a pronosticar
t=último dato ajustado
𝑀𝑜𝑑𝑒𝑙𝑜: 𝑌෠𝑡+𝑘 = 𝐴𝑡
Métodos de Suavización

Promedio Móvil Doble(m,n)


 Se basa en promediar o suavizar los valores pasados de una serie de tiempo.

 Trabajan mejor con datos con tendencia aprox lineal, sin estación

𝑌𝑡 + 𝑌𝑡−1 + ⋯ 𝑌𝑡−𝑚+1 𝑀′𝑡 + 𝑀′𝑡−1 + ⋯ 𝑀′𝑡−𝑛+1


𝑀′𝑡 = 𝑀′′𝑡 =
𝑚 𝑛
Ajuste k=1
2
𝑎𝑡 = 2𝑀′𝑡 − 𝑀′′𝑡 𝐹𝑎𝑐𝑡𝑜𝑟 𝑑𝑒 𝐴𝑗𝑢𝑠𝑡𝑒 = 𝑏𝑡 = (𝑀′ 𝑡 − 𝑀′′ 𝑡 )
𝑚−1 Validación Pronóstico
k=#Valores futuros a pronosticar
t=último dato ajustado

𝑌෠𝑡+𝑘 = 𝑎𝑡 + 𝑘𝑏𝑡
Métodos de Suavización

Suavización Exponencial Doble-Brown (𝝰)

 Permite revisar continuamente el pronóstico a la luz de los nuevos datos actualizados cuando se presenta una
tendencia aprox Lineal, sin estacionalidad.

𝐴′𝑡 = 𝛼𝑌𝑡 + 1 − 𝛼 𝐴′𝑡−1 → 𝐶𝑜𝑛 0 ≤ 𝛼 ≤ 1

𝐴′′𝑡 = 𝛼𝐴′𝑡 + 1 − 𝛼 𝐴′′𝑡−1


Ajuste k=1
′′
𝑎𝑡 = 2𝐴′𝑡 − 𝐴 𝑡
Validación Pronóstico
𝛼 k=#Valores futuros a pronosticar
𝑏𝑡 = (𝐴′ 𝑡 − 𝐴′′ 𝑡 ) t=último dato ajustado
1−𝛼

𝑉𝑎𝑙𝑜𝑟 𝐼𝑛𝑖𝑐𝑖𝑎𝑙: 𝐴′𝑜 = 𝐴′′𝑜 = 𝑌1

𝑀𝑜𝑑𝑒𝑙𝑜: 𝑌෠𝑡+𝑘 = 𝑎𝑡 + 𝑘𝑏𝑡


Métodos de Suavización

Método de Holt-Winters no estacional (𝜶, 𝜷):

 Modelo de dos parámetros, este método suaviza la estimación de la tendencia de la serie de tiempo.

෡ 𝒕+𝒌 = 𝑨𝒕 + 𝑻𝒕 𝒌
𝒀

𝑨𝒕 = 𝜶𝒀𝒕 + (𝟏 − 𝜶)(𝑨𝒕−𝟏 + 𝑻𝒕−𝟏 )

𝑻𝒕 = 𝜷 𝑨𝒕 − 𝑨𝒕−𝟏 + (𝟏 − 𝜷)𝑻𝒕−𝟏

𝑌෠𝑡+𝑘 , pronóstico para el periodo k.


𝐴𝑡−1 + 𝑇𝑡−1 , actualización o ajuste del nivel de la serie cuando existe una tendencia.
𝐴𝑡 − 𝐴𝑡−1 , cambio en el nivel de tiempo t-1 a t, representa la tendencia en las observaciones.
𝐴𝑡 , valor suavizado (estimado del nivel actual).
𝑇𝑡 , estimado de la tendencia.
k, periodos a pronosticar en el futuro.
𝛼, constante de suavización para el nivel
𝛽, constante de suavización para el estimado de la tendencia.
Métodos de Suavización

Holt Winters de Estacionalidad Aditiva (𝜶, 𝜷, 𝜸):

El método de suavización exponencial lineal y estacional de tres parámetros de Winters, es una extensión del
método de Holt que podría representar mejor los datos y reducir el error del pronóstico cuando existe un patrón de
estacionalidad. En el método de Winters se emplea una ecuación adicional para estimar la estacionalidad.

𝑁𝑖𝑣𝑒𝑙 = 𝐴𝑡 = 𝛼 𝑌𝑡 − 𝑆𝑡−𝑠 + 1 − 𝛼 𝐴𝑡−1 + 𝑇𝑡−1

𝑇𝑒𝑛𝑑𝑒𝑛𝑐𝑖𝑎 = 𝑇𝑡 = 𝛽 𝐴𝑡 − 𝐴𝑡−1 + 1 − 𝛽 𝑇𝑡−1

𝐸𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑙𝑖𝑑𝑎𝑑 = 𝑆𝑡 = 𝛾 𝑌𝑡 − 𝐴𝑡 + 1 − 𝛾 𝑆𝑡−𝑠

𝑌෠𝑡+𝑘 = 𝐴𝑡 + 𝑇𝑡 𝑘 + 𝑆𝑡+𝑘−𝑠
Métodos de Suavización

Holt Winters de Estacionalidad Multiplicativa (𝜶, 𝜷, 𝜸):


෡ 𝒕+𝒌 = 𝑨𝒕 + 𝑻𝒕 𝒌 𝑺𝒕−𝒔+𝒌
𝒀

𝒀𝒕
𝑨𝒕 = 𝜶 + (𝟏 − 𝜶)(𝑨𝒕−𝟏 + 𝑻𝒕−𝟏 )
𝑺𝒕−𝒔

𝑻𝒕 = 𝜷 𝑨𝒕 − 𝑨𝒕−𝟏 + (𝟏 − 𝜷)𝑻𝒕−𝟏

𝒀𝒕
𝑺𝒕 = 𝜸 + (𝟏 − 𝜸)𝑺𝒕−𝒔
𝑨𝒕
s, longitud de la estacionalidad o duración de la estacionalidad

𝐴𝑡 , nivel estimado o serie suavizada exponencialmente

𝑇𝑡 , estimado de tendencia

𝑆𝑡 , estimado de estacionalidad, es equivalente a suavizar los valores previos y actuales del índice estacional.
𝑌𝑡
, índice estacional que crea una razón que se puede usar de manera multiplicativa para ajustar un pronóstico que toma en cuenta los picos y valles.
𝐴𝑡

𝑌𝑡
, ajuste de Yt por estacionalidad, eliminando así los efectos estacionales que pudiera existir en los datos originales.
𝑆𝑡−𝑠
Resumen de Modelos

NO ESTACIONALIDAD CON ESTACIONALIDAD

 PROMEDIO MÓVIL SIMPLE.  ADITIVO ESTACIONAL.

SIN TENDENCIA  SUAVIZAMIENTO EXPONENCIAL SIMPLE  MULTIPLICATIVO EXPONENCIAL.

 PROMEDIO MÓVIL DOBLE.  ADITIVO HOLT-WINTERS.

 SUAVIZAMIENTO EXPONENCIAL DOBLE  MULTIPLICATIVO HOLT-WINTERS.


CON
TENDENCIA  HOLT WINTERS NO ESTACIONAL
Modelos univariados de Series de Tiempo

“FORMALES”-METODOLOGÍA BOX-JENKINS ARIMA

Proceso Estacionario

Sentido Fuerte. Sentido débil

Un proceso estocástico es estacionario en sentido estricto Un proceso estocástico es estacionario en sentido débil si los
o fuerte cuando la distribución de probabilidad conjunta de momentos del primero y segundo orden de la distribución
cualquier parte de la secuencia de variables aleatorias es (esperanzas, varianzas, covarianzas) no dependen del tiempo.
invariante del tiempo.
𝐸 𝑥𝑡 = 𝜇, 𝜇 < 𝛼, ∀𝑡
𝐹 𝑥𝑡 , 𝑥𝑡+1 , … , 𝑥𝑡+𝑘 = 𝐹 𝑥𝑡+𝜏 , 𝑥𝑡+1+𝜏 , … , 𝑥𝑡+𝑘+𝜏 𝐸 (𝑥𝑡 − 𝜇𝑡 )2 = 𝜎 2 < 𝛼, ∀𝑡
𝐸 (𝑥𝑡 − 𝜇𝑡 )(𝑥𝑡+𝜏 − 𝜇𝑡+𝜏 ) = 𝛾𝜏, 𝛾𝜏, < 𝛼, ∀𝑡, 𝜏
𝐶𝑜𝑣 𝑥𝑡 , 𝑥𝑡+𝜏 = 𝐶𝑜𝑣 𝑥𝑡±𝑟 , 𝑥𝑡+±𝑟+𝜏 = 𝛾𝜏
Modelos univariados de Series de Tiempo

Algunas Propiedades de los Procesos Estacionarios en sentido débil

𝛾𝑡,𝜏 = 𝐶𝑜𝑣 𝑥𝑡 , 𝑥𝑡+𝜏 = 𝐸 (𝑥𝑡 − 𝜇𝑡 )(𝑥𝑡+𝜏 − 𝜇𝑡+𝜏 ) = 𝐸 (𝑥𝑡 − 𝜇)(𝑥𝑡+𝜏 − 𝜇) = 𝛾𝜏


𝜏 = ⋯ , −1,0,1, …

Memoria de corto plazo, ergodicidad lim 𝛾𝜏 = 0


𝜏→𝛼

𝛾𝜏 = 𝛾−𝜏

𝛾0 = 𝜎 2

𝛾𝑡,𝜏 𝐸 (𝑥𝑡 − 𝜇𝑡 )(𝑥𝑡+𝜏 − 𝜇𝑡+𝜏 ) 𝐸 (𝑥𝑡 − 𝜇)(𝑥𝑡+𝜏 − 𝜇) 𝛾𝜏


𝜌𝜏 = = = 2 =
𝜎𝑡+𝜏 𝜎𝑡 2
𝐸(𝑥𝑡 − 𝜇𝑡 ) 𝐸(𝑥𝑡+𝜏 − 𝜇𝑡+𝜏 ) 2 𝐸(𝑥 𝑡 − 𝜇) 𝛾0
Modelos univariados de Series de Tiempo

Función de Autocorrelación Simple

𝛾𝑡,𝜏 𝐸 (𝑥𝑡 − 𝜇𝑡 )(𝑥𝑡+𝜏 − 𝜇𝑡+𝜏 ) 𝐸 (𝑥𝑡 − 𝜇)(𝑥𝑡+𝜏 − 𝜇) 𝛾𝜏


𝜌𝜏 = = = =
𝜎𝑡+𝜏 𝜎𝑡 𝐸(𝑥𝑡 − 𝜇𝑡 )2 𝐸(𝑥𝑡+𝜏 − 𝜇𝑡+𝜏 )2 𝐸(𝑥𝑡 − 𝜇)2 𝛾0

𝛾0
𝜌0 = =1
𝛾0
Modelos univariados de Series de Tiempo

Algunos ejemplos de Procesos Estocásticos importantes

𝑇
𝜀𝑡 𝑡=1 → Es un proceso 𝐑𝐮𝐢𝐝𝐨 𝐁𝐥𝐚𝐧𝐜𝐨 si:
𝐸 𝜀𝑡 = 0, ∀𝑡

𝐸 𝜀𝑡2 = 𝑉 𝜀𝑡 = 𝜎𝜀2 , ∀𝑡
𝐸 𝜀𝑡 , 𝜀𝑡+𝜏 = 𝛾𝜏 = 0, ∀𝑡,𝜏 ≠ 0
 1 si   0
  
 Es el proceso mas aleatorio que existe. Es por construcción estacionario.
Es una colección de variables aleatorias con media cero y no
0 si   0
correlacionadas entre ellas.
 Un proceso ruido blanco no es posible pronosticar utilizando modelos 1
ARIMA. Un proceso Ruido Blanco no tiene memoria, es decir, que el
último dato conocido recoge toda la información histórica disponible. 0
 Paseo aleatorio, un paseo aleatorio representa una variable cuyos 𝜏
cambios son ruido blanco y, por tanto, imprevisibles. La característica -1
fundamental de este proceso es la falta de afinidad de las series a una
media estable.
Modelos univariados de Series de Tiempo

Algunos ejemplos de Procesos Estocásticos importantes

𝑇
𝑥𝑡 𝑡=1 → Es un proceso de 𝐂𝐚𝐦𝐢𝐧𝐚𝐭𝐚 𝐀𝐥𝐞𝐚𝐭𝐨𝐫𝐢𝐚 si:

𝑥𝑡 = 𝑥𝑡−1 + 𝜀𝑡 𝑑𝑜𝑛𝑑𝑒 𝜀𝑡 𝑒𝑠 𝑅𝑢𝑖𝑑𝑜 𝐵𝑙𝑎𝑛𝑐𝑜

𝑥𝑡 = 𝑥𝑡−1 + 𝛿 + 𝜀𝑡 ; ∆𝑥𝑡 = 𝛿 + 𝜀𝑡 Caminata Aleatoria con Deriva

Se puede reescribir como:

𝑥𝑡 = 𝑥𝑡−1 + 𝛿 + 𝜀𝑡 = 𝑥𝑡−2 + 𝛿 + 𝜀𝑡−1 + 𝛿 + 𝜀𝑡 = ⋯ = 𝑥0 + 𝛿𝑡 + ෍ 𝜀𝑗


𝑗=1
Modelos univariados de Series de Tiempo

Caminata Aleatoria

Función de autocorrelación de una caminata aleatoria

 2 (t   )
 t , 
 2t  2 (t   )

xt     t

En conclusión, una caminata aleatoria es no estacionaria. Si transformamos el proceso de caminata


aleatoria bajo la siguiente transformación (diferenciación) sería estacionario, pero no predecible.
Modelos univariados de Series de Tiempo

En resumen, para un proceso:

𝑥𝑡 = 𝛼𝑥𝑡−1 + 𝜀𝑡
𝑥𝑡 − 𝛼𝑥𝑡−1 = 𝜀𝑡
Operador de rezago 𝑳 :
(1 − 𝛼𝐿)𝑥𝑡 = 𝜀𝑡
Lxt  xt 1
Polinomio de rezago
L xt  xt  k
k

 𝑅𝑢𝑖𝑑𝑜 𝐵𝑙𝑎𝑛𝑐𝑜 𝑠𝑖 𝛼 = 0
 𝐶𝑎𝑚𝑖𝑛𝑎𝑡𝑎 𝐴𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑠𝑖 𝛼 = 1 𝑁𝑜 𝐸𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑜 ; 1 − 𝐿 = 0; 𝐿 = 1 →
Una Raiz Unitaria
 Explosivo no estacionario si α > 1
 Estacionario si α < 1
Modelos univariados de Series de Tiempo

En resumen, para un proceso:

𝑥𝑡 = 𝛼𝑥𝑡−1 + 𝜀𝑡 ; 𝑥𝑡 − 𝛼𝑥𝑡−1 = 𝜀𝑡 ; (1 − 𝛼𝐿)𝑥𝑡 = 𝜀𝑡

 Si una serie es ruido blanco es no pronosticable a partir de su pasado.


 La diferencia de este proceso asegura estacionariedad.
 La diferencia de un proceso puede servir para homogenizar (volver el proceso estacionario).
 Si una serie presenta un proceso generador con alfa igual a 1 (raíz unitaria), se diferencia y, a su
vez, presenta un comportamiento similar al ruido blanco, tampoco es una serie pronosticable a
partir de su pasado. La serie sigue un comportamiento de caminata aleatoria.
 Si un proceso presenta un alfa mayor que 1, el proceso no permite pronosticar. Es explosivo, no
estacionario.
 Si la serie fue generada por un proceso que presenta un alfa menor a 1, es pronosticable.
 Caso especial: Si la serie fue generada por un proceso con alfa igual a 1 (raíz unitaria), se
diferencia, y este no es ruido blanco, es pronosticable.

¿Como detectar si una serie sigue un proceso de ruido blanco o si presenta raíz o raíces unitarias?
Modelos univariados de Series de Tiempo

Validación de Ruido Blanco: (IC) -1 0 1


La Función de Autocorrelación muestral esta dada 𝜌𝑘 ~𝑁(0, 1/𝑛)
por 𝜌ො𝜏 = 𝑟𝜏

El área que esta entre las líneas


Si el proceso es estacionario gaussiano (normal) y
𝜌ො𝑘 = 0 para 𝑘 ≥ 𝜏, se puede estimar la varianza de 𝑟𝜏 punteadas corresponden a los
con esta formula: intervalos de confianza. 𝜇 ±
𝑍𝛼/2 𝜎 = 1 − 𝛼.
1
𝑉(𝑟𝜏 ) ≅ 1 + 2 σ𝜏−1
𝑖=1 𝑟𝑖
2
𝑇
Cuando esta dentro de la banda
Se puede usar la varianza para contrastar la 𝐻0 : 𝜌𝜏 = significa estadísticamente que es
0. Se considera que 𝜌𝜏 es diferente de cero si 𝑟𝜏 esta cero.
fuera del intervalo (-1.96 𝜎𝑟𝜏 , + 1.96 𝜎𝑟𝜏 ) con una
confianza del 95%. 𝜎𝑟𝜏 es la desviación estándar de
las correlaciones muestrales

Una serie se considera ruido blanco si las autocorrelaciones se encuentran dentro del anterior intervalo.
Modelos univariados de Series de Tiempo

Validación de Ruido Blanco: (PH)


• Estadístico Q-Prueba conjunta

𝐻𝑜 : 𝜌1 = 𝜌2 = 𝜌3 = ⋯ = 𝜌𝑘 = 0 𝑅𝑢𝑖𝑑𝑜 𝐵𝑙𝑎𝑛𝑐𝑜
𝐻1 : ∃𝜌𝑖 ≠ 0 ; 𝑖 = 1, … , 𝑘; 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑛𝑜 𝑒𝑠 𝑅𝑢𝑖𝑑𝑜 𝐵𝑙𝑎𝑛𝑐𝑜
𝑘

𝑄𝐵𝑃−𝑘 = 𝑛 ෍ 𝑟𝑖2 ~𝑥𝑘2


𝑖=1

• Estadístico LB pero para muestras pequeñas- Ljung Box

𝑘
𝑟𝑖2
𝐿𝐵 = 𝑄𝑘 = 𝑛(𝑛 + 2) ෍
𝑛−𝑖
𝑖=1

Una serie se considera ruido blanco si los p-values son mayores que el nivel de significancia de la prueba.

En la práctica, desde que no sean los primeros rezagos, se permite que sea mayor el p-value en uno de cada 20 rezagos
para considerar la serie ruido blanco.
Modelos univariados de Series de Tiempo

Test de Raíz Unitaria o de Estacionariedad

Tal y como se ha señalado, la aplicación de la metodología ARIMA precisa la utilización de series económicas estacionarias en
varianza y en media. La presencia de una raíz unitaria en una serie de tiempo económica revela directamente inestabilidad de la
misma, siendo necesario transformarla para poder trabajarla con ella.

Cuando una serie no es estacionaria en media, o lo que es lo mismo, cuando no es integrada de orden cero I(0), se dice que
presenta al menos una raíz unitaria. Cuando esto ocurre, sabemos que es posible la obtención de una serie estacionaria mediante
una sencilla transformación de la serie original, como es la diferenciación adecuada. Pues bien, el número de diferencias que
habrá que tomar en la serie para convertirla en estacionaria en media viene dado, justamente, por el número de raíces unitarias
que la serie original presente.

Si se parte del modelo: 𝑥𝑡 = 𝛼𝑥𝑡−1 + 𝜀𝑡 y 𝛼 = 1 existe una raíz unitaria, no estacionariedad en varianza.

Ahora, si 𝑥𝑡 = 𝛼𝑥𝑡−1 + 𝜀𝑡 es un proceso estacionario

2 2 2
𝜎𝑥2𝑡 = 𝛼 2 𝜎𝑥2𝑡−1 + 𝜎𝜀2 → 𝜎𝑥2𝑡 − 𝛼 2 𝜎𝑥2𝑡 = 𝜎𝜀2 → 𝜎𝑥𝑡 (1 − 𝛼 ) = 𝜎𝜀
𝜎𝜀2 Si 𝛼 = 1, el proceso no es estacionaria (raíz unitaria)
𝜎𝑥2𝑡 = remediable. Si 𝛼 > 1, proceso explosivo. Si 𝛼 < 1, proceso
(1 − 𝛼 2 )
estacionario.
Modelos univariados de Series de Tiempo

Test de Raíz Unitaria o de Estacionariedad

Este test sirve para probar si la serie es o no es estacionaria.

𝐻0 : 𝜙 = 0; 𝑥𝑡 𝑇𝑖𝑒𝑛𝑒 𝑟𝑎𝑖𝑧 𝑢𝑛𝑖𝑡𝑎𝑟𝑖𝑎(𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑎) → 𝑥𝑡 𝑆𝑒𝑟𝑖𝑒 𝑒𝑠 𝑛𝑜 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑎.


𝐻1 : 𝜙 < 0; 𝑥𝑡 𝑁𝑜 𝑇𝑖𝑒𝑛𝑒 𝑟𝑎𝑖𝑧 𝑢𝑛𝑖𝑡𝑎𝑟𝑖𝑎 → 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒 𝑥𝑡 𝑒𝑠 𝑒𝑠𝑡𝑎𝑐𝑖𝑜𝑛𝑎𝑟𝑖𝑎. 𝐿𝑎 𝑠𝑒𝑟𝑖𝑒𝑠 𝑒𝑠 𝐼(0)
𝐼 𝑑 , representa el orden de integración de la serie, equivalente al número de veces que la prueba debe realizarse para que la serie
sea estacionaria.
La presencia de una raíz unitaria en una serie de tiempo económica revela directamente inestabilidad de la misma, siendo necesario
transformarla para poder trabajar con ella.

𝑥𝑡 = 𝛼𝑥𝑡−1 + 𝜀𝑡
𝑥𝑡 − 𝑥𝑡−1 = 𝛼𝑥𝑡−1 − 𝑥𝑡−1 + 𝜀𝑡
∆𝑥𝑡 = 𝑥𝑡−1 𝛼 − 1 + 𝜀𝑡 ; 𝛼 − 1 = 𝜙
∆𝑥𝑡 = 𝜙𝑥𝑡−1 + 𝜀𝑡 ; 𝑟𝑒𝑔𝑟𝑒𝑠𝑖ó𝑛 𝑎𝑢𝑥𝑖𝑙𝑖𝑎𝑟
𝑝
∆𝑥𝑡 = 𝑎 + 𝑏𝑡 + 𝜙𝑥𝑡−1 + σ𝑖=2 𝜂𝑖 ∆𝑥𝑡−𝑖+1 + 𝜀𝑡 ; Dickey Fuller Aumentado

En caso de rechazar la hipótesis nula es necesario analizar entonces la estacionariedad de ∆xt .


Modelos univariados de Series de Tiempo

Test de Raíz Unitaria o de Estacionariedad


Test Propiedades

• Estadístico t, pero contra una distribución simulada distinta (la verdadera distribución ya no es
DF t-Student, sino que sigue un cociente de procesos de Wiener).
Dickey-Fuller • La hipótesis nula es que hay una raíz unitaria.
• Supone que el término de perturbación es ruido blanco.

• DF extendido para error autocorrelacionado.


• La hipótesis nula es que hay raíz unitaria.
ADF • Usa la misma distribución que la DF
Augmented Dickey-Fuller • Ahora supone que el término de perturbación es estacionario.
• La validez del test requiere residuos RB.
• Problemas de potencia (limite para agregar rezagos)

• Test no paramétrico (corrige el estadístico en lugar de la distribución)


PP • No requiere especificar rezagos.
Philips-Perron • También tiene problemas de potencia.
• La hipótesis nula es que hay raíz unitaria.

• Usa la hipótesis nula de estacionariedad.


KPSS • Es no paramétrico.
Kwiatkowski-Phillips-Schmitd-Shin • La potencia no es un problema.
Modelos univariados de Series de Tiempo

Test de Raíz Unitaria o de Estacionariedad

En el test ADF el número de rezagos a utilizar de las variaciones de la variable en la regresión auxiliar es
determinado por el criterio de información Bayesiano de Schwarz.
𝑛 𝑒 ′𝑒
Logaritmo de Máxima Verosimilitud L=− (1 + 𝐿𝑜𝑔 2𝜋 + 𝐿𝑜𝑔 )
2 𝑛

El estadístico AIC, propuesto por Akaike (1974) y el estadístico SC propuesto por Schwarz (1978) y basado en la teoría
de la información, siguen el siguiente cálculo:

2𝑙 2𝑘
Criterio de Información Akaike 𝐴𝐼𝐶 = − +
𝑛 𝑛
2𝑙 (𝑘𝐿𝑜𝑔𝑛)
Criterio de Información Schwarz 𝑺𝑪 = − +
𝑛 𝑛

Los estadísticos AIC y SC, a diferencia de los coeficientes de determinación, indican mejores ajustes cuanto más bajos
sean sus valores.

El resultado final del test de estacionariedad es determinar si la serie es estacionaria o no y establecer el número
de diferenciaciones 𝒅 necesarias para que la serie sea estacionaria. Establecer el orden de integración 𝑰 𝒅 .
Modelos univariados de Series de Tiempo

Procesos Integrados

 Los procesos no estacionarios más importantes son los procesos integrados, estos procesos tienen la
propiedad fundamental de que al diferenciarse se obtienen procesos estacionarios.

 Una propiedad importante que diferencia a los procesos integrados de los estacionarios es la forma en
que desaparece la dependencia con el tiempo.

 En los procesos estacionarios ARMA las autocorrelaciones disminuyen geométricamente y se


hacen prácticamente cero a los pocos retardos.

 En los procesos integrados, las autocorrelaciones disminuyen linealmente con el tiempo y es


posible encontrar coeficientes de autocorrelación distintos de cero hasta retardos muy altos.

Generalizando, diremos que un proceso es integrado de orden 𝑑 (𝑑 ≥ 0) , y lo representaremos por 𝐼(𝑑),


cuando al diferenciarlo 𝑑 veces se obtiene un proceso estacionario.
Modelos univariados de Series de Tiempo
Log Pasajeros

Transformación de Datos: Diferencias 6.50


6.25
A menudo, la tendencia de una serie de tiempo puede 6.00
eliminarse diferenciando los datos. Se dice que una serie es 5.75
“integrada de orden uno”, o 𝐼(1), si su primera diferencia es 5.50
estacionaria: 5.25

Δ𝑥𝑡 = 𝑥𝑡 − 𝑥𝑡−1 5.00


4.75
4.50
49 50 51 52 53 54 55 56 57 58 59 60
 La primera figura muestra el logaritmo una serie.
Log Differenced Pasajeros
 Si al dato en cada mes se le resta el dato del mes
.3
anterior queda una serie sin tendencia con mayor
posibilidad de ser estacionaria. Se acostumbra: .2

.1

1. Tendencia Lineal->Primera diferencia .0

2. Tendencia cuadrática->Segunda diferencia -.1

-.2

-.3
49 50 51 52 53 54 55 56 57 58 59 60
Modelos ARIMA(p,d,q)

Propuesto por los estadísticos George E. P. Box y Gwilym Jenkins 1970-1976.


Para series que son estacionarias 𝐼 0 .

𝐴𝑅 𝑝 , Autorregresivo de orden p.
MA 𝑞 , media móvil de orden q.
𝐴𝑅𝑀𝐴 𝑝, 𝑞 , 𝐴𝑢𝑡𝑜𝑟𝑒𝑔𝑟𝑒𝑠𝑖𝑣𝑜 𝑑𝑒 𝑚𝑒𝑑𝑖𝑎 𝑚ó𝑣𝑖𝑙.

𝐴𝑅𝐼𝑀𝐴 𝑝, 𝒅, 𝑞 , 𝐴𝑢𝑡𝑜𝑟𝑒𝑔𝑟𝑒𝑠𝑖𝑣𝑜, 𝑖𝑛𝑡𝑒𝑔𝑟𝑎𝑑𝑜 𝑑𝑒 𝑚𝑒𝑑𝑖𝑎 𝑚𝑜𝑣𝑖𝑙.

Para series que no son estacionarias 𝐼(𝑑) , que evidencian al menos una raíz unitaria,
específicamente 𝑑 raíces unitarias, 𝑑 diferenciaciones para que la serie sea estacionaria.
Para saber el valor de d se utilizan los test de raíces unitarias (ADF,PP, KPSS..).
Modelos ARIMA(p,d,q)
𝑋𝑡 = 𝑓 𝐼𝑡−1 + 𝜀𝑡 , si 𝑑 = 0.
Δ𝑋𝑡 = 𝑓 𝐼𝑡−1 + 𝜀𝑡 , si 𝑑 = 1.
Δ2 𝑋𝑡 = 𝑓 𝐼𝑡−1 + 𝜀𝑡 , si 𝑑 = 2.

Hasta el momento 𝑡 − 1 se tiene los valores pasados de la serie y las innovaciones pasadas.
Hay tres posibles procesos generadores:

Para series estacionarias:


Modelos de medias móviles (MA) puro, 𝐴𝑅𝐼𝑀𝐴(0,0, 𝑞)
𝑥𝑡 = 𝑓 𝜀𝑡−1 , … , 𝜀𝑡−𝑞 + 𝜀𝑡 ; 𝑥𝑡 = 𝜀𝑡 − 𝜃1 𝜀𝑡−1 − 𝜃2 𝜀𝑡−2 − ⋯ − 𝜃𝑞 𝜀𝑡−𝑞
Modelos autorregresivos (AR) puro, 𝐴𝑅𝐼𝑀𝐴(𝑝, 0,0)
𝑥𝑡 = 𝑓 𝑥𝑡−1 , … , 𝑥𝑡−𝑝 + 𝜀𝑡 ; 𝑥𝑡 = ∅1 𝑥𝑡−1 + ∅2 𝑥𝑡−2 + ⋯ + ∅𝑝 𝑥𝑡−𝑝 +𝜀𝑡
Modelos Mixtos (ARMA), 𝐴𝑅𝐼𝑀𝐴(𝑝, 0, 𝑞)
𝑥𝑡 = 𝑓(𝑥𝑡−1 , … , 𝑥𝑡−𝑝 , 𝜀𝑡−1 , … , 𝜀𝑡−𝑞 ) + 𝜀𝑡 ; 𝑥𝑡 = ∅1 𝑥𝑡−1 + ⋯ + ∅𝑝 𝑥𝑡−𝑝 − 𝜃1 𝜀𝑡−1 − ⋯ − 𝜃𝑞 𝜀𝑡−𝑞 + 𝜀𝑡
Modelos ARIMA(p,d,q)
Utilizando el operador de rezago:

𝐴𝑅 𝑝 ; ∅𝑝 𝐿 𝑋𝑡 = 𝛿 + 𝜀𝑡 → ∅𝑝 𝐿 = 1 − ∅1 𝐿 − ∅2 𝐿2 − ⋯ − ∅𝑝 𝐿𝑝

𝑀𝐴 𝑞 ; 𝑥𝑡 = 𝛿 + 𝜃𝑞 𝐿 𝜀𝑡 → 𝜃𝑞 𝐿 = 1 − 𝜃1 𝐿 − 𝜃2 𝐿2 − ⋯ − 𝜃𝑞 𝐿𝑞

𝐴𝑅𝑀𝐴 𝑝, 𝑞 ; ∅𝑝 𝐿 𝑋𝑡 = 𝛿 + 𝜃𝑞 𝐿 𝜀𝑡
Modelos ARIMA(p,d,q)
Recordemos:
Función de Autocorrelación Simple (FAC)

𝛾𝑡,𝜏 𝐸 (𝑥𝑡 − 𝜇𝑡 )(𝑥𝑡+𝜏 − 𝜇𝑡+𝜏 ) 𝐸 (𝑥𝑡 − 𝜇)(𝑥𝑡+𝜏 − 𝜇) 𝛾𝜏 𝛾0


𝜌𝜏 = = = = 𝜌0 = =1
𝜎𝑡+𝜏 𝜎𝑡 𝐸(𝑥𝑡 − 𝜇𝑡 )2 𝐸(𝑥𝑡+𝜏 − 𝜇𝑡+𝜏 )2 𝐸(𝑥𝑡 − 𝜇)2 𝛾0 𝛾0
𝑇

𝑀𝑒𝑑𝑖𝑎 𝜇 → 𝑥ҧ = 𝑇 −1 ෍ 𝑥𝑡
AUTOCORRELOGRAMA 𝑡=1
𝑇

𝑉𝑎𝑟𝑖𝑎𝑚𝑧𝑎 𝛾0 → 𝛾ො0 = 𝑇 −1 ෍(𝑥𝑡 − 𝑥)ҧ 2


𝑡=1

𝐴𝑢𝑡𝑜𝑐𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝑠 𝛾𝜏 → 𝛾ො𝜏 = 𝑇 −1 σ𝑇−𝜏


𝑡=1 (𝑥𝑡 − 𝑥)(𝑥
ҧ 𝑡+𝜏 − 𝑥)ҧ

𝛾ො𝜏
𝐴𝑢𝑡𝑜𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑒𝑠 𝜌𝜏 → 𝜌ො𝜏 = 𝛾𝜏 → 𝑟𝜏 =
𝛾ො0
Se considera que 𝜌𝜏 es diferente de cero si 𝑟𝜏 esta fuera del intervalo (-1.96𝜎𝑟𝜏 , +1.96𝜎𝑟𝜏 ) con una confianza del 95%. 𝜎𝑟𝜏
es la desviación estándar de las autocorrelaciones muestrales, el cual se puede asumir como (1/T) bajo ruido blanco.
Modelos univariados de Series de Tiempo

Función de Autocorrelación Parcial (FACP)


Mide la relación lineal entre 𝑥𝑡 y 𝑥𝑡−𝑘 cuando se ha eliminado la correlación que estas variables tienen con
otras variables.
∅𝑘𝑘 = 𝐶𝑜𝑟𝑟(𝑥𝑡 , 𝑥𝑡−𝑘 |𝑥𝑡−1 , … , 𝑥𝑡−𝑘+1 )

 xt  0  11 xt 1  vt
Se puede estimar a través regresiones o   xt  0  21 xt 1  22 xt  2  vt
ecuaciones de Yule-Walker. Vía regresiones sería: 
 
 xt  0  k1 xt 1  k 2 xt  2  ...  kk xt  k  vt

Donde ∅ ෡11 , … , ∅
෡ 𝑘𝑘 son estimaciones consistentes de la FACP. Bajo los supuestos: proceso gaussiano y ∅𝑘𝑘 =
∅𝑘+1,𝑘+1 = ⋯ = 0, se puede estimar la varianza con, 𝑉 ∅ ෡ 𝑘𝑘 ≅ 1 , de manera que si ∅
෡ 𝑘𝑘 esta fuera del intervalo
𝑇
(-1.96𝑇 −1/2 ,+1.96 𝑇 −1/2 ) se considera que ∅෡ 𝑘𝑘 ≠ 0, con una confianza del 95%.
Modelos Autorregresivos de orden: AR(p)

• El modelo AR(p) incorpora la información de las últimas 𝒙𝒕 = 𝝓𝟏 𝒙𝒕−𝟏 + 𝜺𝒕


p observaciones.
1  1
𝒙𝒕 = 𝜹 + 𝝓𝟏 𝒙𝒕−𝟏 + 𝝓𝟐 𝒙𝒕−𝟐 + ⋯ +𝝓𝒑 𝒙𝒕−𝒑 + 𝜺𝒕

En particular un 𝐴𝑅(1) = 𝐴𝑅𝐼𝑀𝐴(1,0,0)

Es un proceso autorregresivo de primer orden, AR(1),


representa una variable cuyo valor actual esta
relacionado con su valor anterior.
El proceso AR(1) se reconoce por una FAC infinita con
caída rápida exponencial y una FACP que se anula a
partir del segundo rezago, tiene “vida” hasta el primer
rezago. Si los datos tienen media, es necesario
especificar un término constante
Modelos Autorregresivos de orden: AR(p)

Un proceso autorregresivo ARIMA(p,0,0) se puede escribir:

∅𝑝 𝐿 𝑥𝑡 = 𝛿 + 𝜀𝑡

1 − ∅1 𝐿 − ∅2 𝐿2 − ⋯ − ∅𝑝 𝐿𝑝 𝑥𝑡 = 𝛿 + 𝜀𝑡

𝑥𝑡 = 𝛿 + ∅1 𝑥𝑡−1 − ∅2 𝑥𝑡−2 − ⋯ − ∅𝑝 𝑥𝑡−𝑝 + 𝜀𝑡

Para que un proceso AR sea estacionario, los inversos de las raíces del polinomio de rezago asociado:

∅𝑝 𝐿 = 1 − ∅1 𝐿 − ∅2 𝐿2 − ⋯ − ∅𝑝 𝐿𝑝 = 0

Deben ser menor que uno


LOS PROCESOS AR SIEMPRE CUMPLEN LA CONDICIÓN DE INVERTIBILIDAD
Modelos de Media Móvil: MA(q)

El modelo MA(q) incorpora la información de la últimas q


innovaciones
xt     t  1 t 1
𝑥𝑡 = 𝛿 + 𝜀𝑡 − 𝜃1 𝜀𝑡−1 − 𝜃2 𝜀𝑡−2 − ⋯ − 𝜃𝑞 𝜀𝑡−𝑞
1  1

= 𝛿 + 𝜃𝑞 (𝐿)𝜀𝑡

En particular un 𝑀𝐴(1) = 𝐴𝑅𝐼𝑀𝐴(0,0,1)

El proceso MA(1) se reconoce por una FACP infinita con


caída rápida exponencial y una FAC que se anula a partir
del segundo rezago, tiene “vida” hasta el primer rezago.

LOS PROCESOS MA SIEMPRE CUMPLEN LA CONDICIÓN DE ESTACIONARIEDAD


Modelos ARMA(p,q)

Incluyen p retardos de la propia variable y q innovaciones pasadas.

𝑥𝑡 = 𝛿 + ∅1 𝑥𝑡−1 + ⋯ + ∅𝑝 𝑥𝑡−𝑝 − 𝜃1 𝜀𝑡−1 − ⋯ − 𝜃𝑞 𝜀𝑡−𝑞 + 𝜀𝑡

1 − ∅1 𝐿 − ⋯ − ∅𝑝 𝐿𝑝 𝑥𝑡 = (1 − 𝜃1 𝐿 − ⋯ − 𝜃𝑞 𝐿𝑞 )𝜀𝑡

 Parte autorregresiva.  Parte de medias móviles.


 Responsable de la estacionariedad.  Responsable de la invertibilidad.
 Responsable de la estructura de la  Responsable de la ausencia de estructura de la
función de autocorrelación. función de autocorrelación.

Los inversos de las raíces de los polinomios de rezago asociados con los componentes AR y
MA deben ser menores que uno para asegurar estacionariedad e invertibilidad.
Modelo ARMA(1,1)

Un 𝐴𝑅𝑀𝐴(1,1) = 𝐴𝑅𝐼𝑀𝐴(1,0,1):

𝑥𝑡 = 𝛿 + ∅1 𝑥𝑡−1 − 𝜃1 𝜀𝑡−1 + 𝜀𝑡
Modelos ARMA(p,q)

Proceso FAC FACP Estacionariedad Invertibilidad

Si los inversos de las raíces del


Con “vida” hasta el rezago polinomio de rezago asociado
AR(p) Caída exponencial –(rápida) Siempre
p. son menores que uno en valor
absoluto.

Si los inversos de las raíces


del polinomio de rezago
Con “vida” hasta el rezago
MA(q) q.
Caída exponencial-–(rápida) Siempre asociado son menores que
uno en valor absoluto.

Si los inversos de las raíces


Si los inversos de las raíces del
Con “vida” hasta el rezago p del polinomio de rezago
Con “vida” hasta el rezago q polinomio de rezago asociado al
o caída exponencial desde asociado al componente MA
ARMA(p,q) o caída exponencial desde
el rezago p.
componente AR son menores
son menores que uno en
el rezago q. que uno en valor absoluto.
valor absoluto.

En resumen se podría decir que el componente MA se revisa en la FAC y el componente AR en la FACP.


Modelos ARIMA(p,d,q)

Pasos para la propuesta y estimación de modelos ARIMA:

1. Definir la variable objeto de estudio. (información de la variable igualmente espaciada).


2. Validar estacionariedad de la variable. Test de raíz unitaria (ADF, PP, KPSS,…). Definir si se va a analizar 𝑥𝑡 , ∆𝑥𝑡 , …
3. Evaluar si se tiene una serie ruido blanco, caminata aleatoria o una serie pronosticable bajo esta metodología.
4. Proponer el modelo ARIMA analizando la FAC y FACP de 𝑥𝑡 , ∆𝑥𝑡 , …, de acuerdo con el número de raíces unitarias de
la variable 𝑥𝑡 .
5. Estimar los parámetros del modelo ARIMA (componentes ARMA) y evaluar significancia estadística.
6. Evaluar estacionariedad e invertibilidad del proceso propuesto y estimado (inversos de las raíces de los polinomios
de rezago asociados-circulo unitario).
7. Evaluar aleatoriedad-ruido banco de los residuos del modelo estimado (Test LB).
8. Calcular estadísticas de error. (comparar frente a otras propuestas)
9. Pronosticar (puntual o por intervalo).

Si alguno de los supuestos requeridos en los pasos 6 y/o 7 no se logran, hay que volver al paso 4.
Estacionalidad y Procesos Estacionales
Una serie temporal es estacional si tiende a repetir una pauta de comportamiento cada periodo
estacional denotado por “s”.

Suponemos que el periodo estacional es un año, por lo que si la serie es mensual, el periodo
estacional es s=12, ya que 12 meses es el número de observaciones que forman el ciclo
estacional.

La estacionalidad hace que la media de las observaciones no sea constante, pero evoluciona de
forma previsible de acuerdo con un patrón cíclico.

Forma de Corrección:
De la misma forma que tomar diferencias regulares induce estacionariedad en la parte regular
(no estacional) de una serie, tomar la primera diferencias estacional inducirá estacionariedad en
la parte estacional.
Estacionalidad y Procesos Estacionales
• Las series mensuales y trimestrales, generalmente presentan dependencia con las
observaciones previas, pero también con las que ocurrieron hace un año.

• Dada esa dependencia estacional, la función de autocorrelación de los modelos mostrará una
dependencia temporal larga que conducirá a modelos con valores altos de p y q.
• Se simplificará con el uso de modelos multiplicativos.
• La estacionalidad puede ser de carácter estacionario o no estacionario.
Estacionalidad y Procesos Estacionales
• Recuerde que si la magnitud de las fluctuaciones estacionales no es proporcional al nivel de la serie, el efecto estacional es
aditivo, mientras que si las fluctuaciones estacionales son proporcionales al nivel de la serie, el efecto estacional es
multiplicativo.
• El conjunto de datos mensuales, por ejemplo, inicio de la vivienda, tienen un fuerte componente estacional.
• En un modelo ARIMA estacional, usamos un segundo proceso ARMA para modelar las fluctuaciones estacionales. Para los
datos mensuales de inicio de la vivienda, usaríamos un proceso ARMA para modelar las fluctuaciones mes a mes y un
segundo proceso ARMA para modelar la variación estacional; un modelo ARIMA estacional aditivo se denomina así porque
los dos procesos se suman. Por ejemplo, digamos que el modelo de vivienda comienza ht como:

ℎ𝑡 = 𝛼 + 𝜃1 ℎ𝑡−1 + 𝜃12 ℎ𝑡−12 + 𝑒𝑡 + 𝛽1 𝑒𝑡−1 + 𝛽12 𝑒𝑡−12


• Aquí estamos usando un proceso ARMA (1,1) para las fluctuaciones mensuales, y también estamos usando un proceso
ARMA (1,1) para la variación estacional. Los términos estacionales AR y MA están rezagados 12 meses porque hay un
ciclo anual en los datos. Si utilizamos un proceso ARMA (2,2) para la variación estacional, nuestro modelo sería:

ℎ𝑡 = 𝛼 + 𝜃1 ℎ𝑡−1 + 𝜃12 ℎ𝑡−12 + 𝜃24 ℎ𝑡−24 + 𝑒𝑡 + 𝛽1 𝑒𝑡−1 + 𝛽12 𝑒𝑡−12 + 𝛽24 𝑒𝑡−24

• Usando la denotación con operador de rezagos, tendríamos:

1 − 𝜃1 𝐿 − 𝜃12 𝐿12 − 𝜃24 𝐿24 ℎ𝑡 − 𝛼 = (1 + 𝛽1 𝐿 + 𝛽12 𝐿12 − 𝛽24 𝐿24 )𝑒𝑡


Estacionalidad y Procesos Estacionales
• Al modelo ARMA (1,1) con un componente estacional ARMA (1,1) que funciona multiplicativamente sería (asumiendo datos
mensuales)

1 − 𝜃1 𝐿)(1 − 𝜃12 𝐿12 ℎ𝑡 − 𝛼 = (1 + 𝛽1 𝐿)(1 + 𝛽12 𝐿12 ) 𝑒𝑡

1 − 𝜃1 𝐿 − 𝜃12 𝐿12 − 𝜃1 𝜃12 𝐿13 ℎ𝑡 − 𝛼 = (1 + 𝛽1 𝐿 + 𝛽12 𝐿12 + 𝛽1 𝛽12 𝐿13 ) 𝑒𝑡

• Esa expresión ilustra la diferencia clave entre los modelos ARIMA estacional y multiplicativo. Obsérvese la presencia del
decimotercero rezago tanto en el término autorregresivo como en el promedio móvil, con su coeficiente limitado a ser el
producto de los coeficientes del primer rezago y duodécimo.
• En general, podemos escribir un modelo ARIMA estacional multiplicativo que permita la diferenciación regular y estacional
de la variable dependiente como:

1 − 𝜃1 𝐿 − ⋯ − 𝜃𝑝 𝐿𝑝 )(1 − 𝜃𝑠,1 𝐿𝑠 − 𝜃𝑠,2 𝐿2𝑠 − ⋯ − 𝜃𝑠,𝑃 𝐿𝑃𝑠 ∆𝑑 ∆𝐷 𝑞 𝑠 2𝑠


𝑠 − 𝛼 = 1 − 𝛽1 𝐿 − ⋯ − 𝛽𝑞 𝐿 )(1 − 𝛽𝑠,1 𝐿 − 𝛽𝑠,2 𝐿 − ⋯ − 𝜃𝑠,𝑄 𝐿
𝑄𝑠
𝑒𝑡
y lo denotamos como un modelo (p, d, q) x (P, D, Q)𝑠 . p es el número de términos autorregresivos, q es la cantidad de términos
de media móvil que se debe incluir en el modelo regular. s denota la estacionalidad (por ejemplo, s = 4 para datos trimestrales).
P y Q indican la cantidad de términos autorregresivos y términos de media móvil que se deben incluir en el componente
estacional del modelo. d y D indican el número de veces que se diferencian de manera regular y estacional los datos,
respectivamente.
Modelos SARIMA(p,d,q)(P,D,Q)xs

Recordemos que una serie temporal es estacional si tiende a repetir una pauta de
comportamiento cada periodo estacional denotado por “s”.

SARIMA p, d , q  P, D, Q s
AR(p) I(d) MA(q)

∅𝑝 𝐿 Φ 𝐿𝑠 (1 − 𝐿)𝑑 (1 − 𝐿𝑠 )𝐷 𝑥𝑡 = 𝛿 + 𝜃𝑞 (𝐿)𝞗 𝐿𝑠 𝜀𝑡
SAR(P) I(D) SMA(Q)

Por ejemplo, un SARIMA(1,0,0)(1,0,0)12 :

1 − 0.3𝐿 1 − 0.2𝐿12 𝑥𝑡 = 𝜀𝑡
1 − 0.3𝐿 − 0.2𝐿12 + 0.3 ∗ 0.2𝐿13 𝑥𝑡 = 𝜀𝑡
𝑥𝑡 = 0.3𝑥𝑡−1 + 0.2𝑥𝑡−12 + 0.05𝑥𝑡−13 + 𝜀𝑡
Modelos SARIMA(p,d,q)(P,D,Q)xs

Como estrategia, para la parte regular (no estacional) se examina la mitad de la primera
estación y para la propuesta de los patrones estacionales solo se miran los múltiplos
estacionales: s, 2s, 3s, ….

𝑆𝐴𝑅𝐼𝑀𝐴(? , 0, ? )(1,0,0)12

𝑆𝐴𝑅𝐼𝑀𝐴(? , 0, ? )(0,0,1)12
Modelos SARIMA(p,d,q)(P,D,Q)xs

Para una serie con raíz unitaria en la parte regular y en la estación, se diferencia en los dos
componentes, lo que permite realizar la propuesta SARIMA. En EViews 𝑑(𝑋𝑡, 𝑑, 𝑠 ∗ 𝐷) .

Parte no estacional o regular Parte estacional

Podría ser SARIMA(3,1,4)(0,1,1)12


En EViews: 𝑑(𝑥𝑡 ,1,12) AR(1) AR(2) AR(3) MA(1) MA(2) MA(3) MA(4) SMA(12)
Modelos SARIMA(p,d,q)(P,D,Q)xs

𝑆𝐴𝑅𝐼𝑀𝐴(0,1,0)(1,0,0)12 .

La tendencia, generada en ocasiones por raíces unitarias, oculta en muchos casos la estacionalidad.
Modelos SARIMA(p,d,q)(P,D,Q)xs

𝑆𝐴𝑅𝐼𝑀𝐴(0,0,0)(1,1,0)12 .

Raíz unitaria estacional se asocia con caída lenta en los múltiplos estacionales.
Modelos SARIMA(p,d,q)(P,D,Q)xs

𝑆𝐴𝑅𝐼𝑀𝐴(0,1,0)(1,1,0)12 .

Raíz unitaria en la parte regular y en el componente estacional (gráficamente aunque se podría probar mediante Hegy
test). Se diferencia en ambos componentes previo a la propuesta del modelo.
Modelo-Volatilidad

• La volatilidad es una característica inherente a las series de


tiempo financieras. En general, no es constante y en
consecuencia los modelos de series de tiempo tradicionales se
suponen varianza homocedástica, no son adecuados para
modelar series de tiempo financieras.
Características de la volatilidad
• Se define la volatilidad como la varianza condicional de la
serie subyacente. En el caso de las series de tiempo
financieras, se modela la volatilidad de los retornos. Es de
anotar que, aunque la serie sea estacionaria y tenga por
tanto varianza constante, puede presentar oscilaciones a
corto plazo que es lo que recoge la varianza condicional para
el estudio de la volatilidad cuyo conocimiento es de interés,
en particular para hacer predicciones a corto plazo.
Características de la volatilidad
• La volatilidad no es observable directamente, para un día,
por ejemplo, se tiene una única observación. En la series
financieras se presenta periodos largos de alta volatilidad
seguidos por periodos de baja volatilidad, lo que indica la
presencia de heterocedasticidad. Son mas interesantes las
medias y las varianzas condicionales a la información pasada
(pronósticos a corto plazo) que las medias y las varianzas no
condicionales (pronósticos a largo plazo.)
Características que pretende capturar los modelos de volatilidad.

• Aglomeración de la volatilidad.

• Reversión a la media.

• La volatilidad es asimétrica.

• Excesos de curtosis.
Características que pretende capturar los modelos de volatilidad.

• Aglomeración de la volatilidad.
Efectivamente, al observar graficas de series financieras, a menudo se observa que la
volatilidad no solo cambian en el transcurso del tiempo sino que, además, tiende
agruparse en clusters. Es decir, que grandes cambios en las variables tienden a ser
seguidos por grandes cambios de cualquier signo, mientras que pequeños cambios en
las variables tienden a ser seguidos de pequeños cambios de cualquier signo. Este
comportamiento sugiere que la volatilidad de los rendimientos de los activos
financieros existe un proceso de correlación serial que es además hererocedástico.
Características que pretende capturar los modelos de volatilidad.

• Reversión a la media.
La aglomeración de la volatilidad implica que a un periodo de alta volatilidad,
eventualmente, seguirá otro de volatilidad normal, y a un periodo de baja volatilidad
seguirá uno de volatilidad mas alta. La volatilidad tiende a revertirse a la media, en
otros términos, existe un nivel normal de volatilidad al cual esta retorna
eventualmente. Los pronósticos a largo plazo convergerán todos al nivel normal de
la volatilidad, sin importar cuando fueron hechos.
Características que pretende capturar los modelos de volatilidad.

• La volatilidad es asimétrica.
La volatilidad se comporta diferente frente a innovaciones positivas y negativas. No
reacciona de la misma manera frente a una gran alza en el precio de un activo que
frente a una caída en su precio.
Características que pretende capturar los modelos de volatilidad.

• Excesos de curtosis (Colas anchas)


Los retornos de los activos financieros tienden a ser leptocurticos; ya que presentan
una gran cantidad de valores extremos y, por tanto, la distribución de los rendimientos
es de colas mas pesadas (o anchas) que las de una distribución normal.
¿Qué pasa cuando las varianza cambian con el tiempo?

• Modelos Univariados de Series de Tiempo con Varianza


– Existen varios modelos que consideran que la volatilidad no es constante en el tiempo
(Heteroscedasticidad).
– Por ejemplo, el comportamiento de los rendimientos de los activos normalmente presentan
una volatilidad no constante.
– Estos modelos se emplean cuando al realizar una transformación de los datos, el problema
de la heteroscedasticiad no se soluciona.
– Entre esos modelos de encuentran: ARCH(q) y GARCH(p,q)
Modelo ARCH (q)
• Engle (1982) introduce una nueva clase de procesos estocásticos llamados
modelos ARCH (Heterocedasticidad Condicional Auto-Regresiva), en los cuales la
varianza condicionada a la información pasada no es constante, y dependen del
cuadrado de las innovaciones pasadas.

𝑌𝑡 = 𝛽0 + 𝑒𝑡
Donde:𝑒𝑡 ~𝑁(0, 𝜎𝑡2 )
2 2
𝜎𝑡2 = 𝛼0 + 𝛼1 𝜀𝑡−1 + 𝛼2 𝜀𝑡−2 2
+ ⋯ + 𝛼𝑝 𝜀𝑡−𝑞
𝑞
2
𝜎𝑡2 = 𝛼0 + ෍ 𝛼𝑖 𝜀𝑡−𝑖
𝑖=1
2
ARCH(1): 𝜎𝑡2 = 𝛼0 + 𝛼1 𝜀𝑡−1 𝛼0 > 0, 0 < 𝛼1 < 1
Observaciones de los modelos ARCH
• El primer parámetro indica la mínima varianza condicional.

• El segundo parámetro mide la PERSISTENCIA DE LA VOLATILIDAD, si es cercano a


uno indica una ALTA PERSISTENCIA DE LOS SHOCKS DE VOLATILIDAD

• El modelo asume que las noticias positivas y negativas TIENEN EL MISMO


EFECTO sobre la volatilidad, ya que depende de las perturbaciones al cuadrado
rezagadas (q) periodos. Es decir, el precio de un activo financiero responde
indistintamente a noticias positivas y negativas.

• Los modelos ARCH probablemente sobre-predicen la volatilidad ya que ellos


responden lentamente a valores extremos de la serie de retornos.
Pruebas de Hipótesis para detectar el efecto ARCH.
Para la construcción del modelo ARCH es necesario seguir los siguientes pasos:
1. Construir un modelo ARMA para la serie dada, con el fin de eliminar alguna
dependencia lineal en la media y usar los residuales del modelo para
determinar si existe efecto ARCH.

𝐻𝑂 : 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠 𝑎𝑙 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑠𝑜𝑛 𝑟𝑢𝑖𝑑𝑜 𝑏𝑙𝑎𝑛𝑐𝑜


𝐻𝑖 : 𝑙𝑜𝑠 𝑟𝑒𝑠𝑖𝑑𝑢𝑜𝑠 𝑎𝑙 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 𝑛𝑜 𝑠𝑜𝑛 𝑟𝑢𝑖𝑑𝑜 𝑏𝑙𝑎𝑛𝑐𝑜
Los que se busca en la prueba es no rechazar la hipótesis nula, si al menos una
probabilidad es menor al nivel de significancia se rechaza la hipótesis nula.

2. Especificar el orden del ARCH(q).


3. Validar el ajuste del ARCH.
Modelos GARCH (p,q)
• Bollerslev (1986) generaliza los modelos ARCH al proponer GARCH en los cuales la varianza
condicional depende no solo de los cuadrados de las perturbaciones, como Engle, sino además,
de las varianzas condicionales de periodos anteriores.
2 2 2
𝜎𝑡2 = 𝛼0 + 𝛼1 𝜀𝑡−1 + 𝛼2 𝜀𝑡−2 2
+ ⋯ + 𝛼𝑝 𝜀𝑡−𝑞 + 𝛽1 𝜎𝑡−1 2
+ ⋯ + 𝛽𝑞 𝜎𝑡−𝑝
𝑞 𝑝
2 2
𝜎𝑡2 = 𝛼0 + ෍ 𝛼𝑖 𝜀𝑡−𝑖 + ෍ 𝛽𝑖 𝜎𝑡−𝑖
𝑖=1 𝑖=1

𝛼0 Existe homocedasticidad, es decir, no existe efecto ARCH ni GARCH


2
𝑒𝑡−1 Volatilidad de ayer. La varianza de hoy es mayor si ayer se obtuvo grandes perturbaciones. Mide la amplitud
con la cual los efectos de las volatilidades pasadas alimentan volatilidades presentes.
2
𝜎𝑡−1 Varianza de la predicción de ayer. El efecto persiste por mucho tiempo.
La sumatorios de los errores rezagados y la volatilidad condicional rezagada mide la tasa a la cual estos efectos van
disminuyendo en el tiempo. Si esta persistencia es mayor o igual que uno es llamado un proceso Integrado GARCH,
persistencia explosiva.
Modelos T-GARCH (p,q)
• Zakoian (1994) desarrollo los modelos Threshold ARCH, donde las noticias positivas y negativas
son tratadas ASIMÉTRICAMENTE, una aproximación T-GARCH es:

2 2 2
𝜎𝑡2 = 𝛼0 + 𝛼1 𝜀𝑡−1 + 𝛾𝑑𝑡−1 𝜀𝑡−1 + 𝛽1 𝜎𝑡−1
𝛼0 > 0, 𝛼1 , 𝛽1 ≥ 0, 0 < 𝛼1 + 𝛽1 < 1
Donde:

1 𝑒𝑡 < 0(𝑀𝑎𝑙𝑎𝑠 𝑁𝑜𝑡𝑖𝑐𝑖𝑎𝑠)


𝑑𝑡 = ቊ
0 𝑒𝑡 ≥ 0 (𝐵𝑢𝑒𝑛𝑎𝑠 𝑁𝑜𝑡𝑖𝑐𝑖𝑎𝑠)

El parámetro 𝛾 mide el impacto de la asimetría, es conocido como EFECTO DE APALANCAMIENTO,


si es=0 es un modelo GARCH estándar, cuando hay buenas noticias –SHOCK POSITIVO-, el efecto
en la volatilidad es 𝛼1 , pero si hay noticias negativas el efecto es 𝛼1 + 𝛾.
Modelos EGARCH
• En 1991, Nelson presenta los modelos EGARCH, en los cuales formula para la
varianza condicional un modelo que no se comporta de manera simétrica para
perturbaciones positivas y negativas, como sucede en los modelos GARCH;
expresando otro rasgo de la volatilidad: su comportamiento asimétrico frente a
las alzas y bajas de los precios de un activo financiero.

• El modelo EGARCH(1,1), propone la siguiente ecuación para estimar la volatilidad


condicional heteroscedástica.

𝜀𝑡−1 𝜀𝑡−1 2
𝑙𝑛𝜎𝑡2 = 𝛿𝑜 + 𝛿1 +𝛾 + 𝜃1 𝑙𝑛𝜎𝑡−1
𝜎𝑡−1 𝜎𝑡−1
De donde,
2
𝜀𝑡−1 𝜀𝑡−1
𝜎𝑡2 = (𝜎𝑡−1 )𝜃1 𝑒𝑥𝑝 𝛿𝑜 + 𝛿1 +𝛾
𝜎𝑡−1 𝜎𝑡−1
Varianza condicional de los errores bajo el proceso EGARCH (1,1)

Si 𝜀𝑡−1 > 0 se tiene que la varianza condicional de los errores es,


𝜀𝑡−1 2
𝑙𝑛𝜎𝑡2 = 𝛿0 + 𝛾 + 𝛿1 + 𝜃1 𝑙𝑛𝜎𝑡−1
𝜎𝑡−1

Si 𝜀𝑡−1 < 0 se tiene que,

𝜀𝑡−1 2
𝑙𝑛𝜎𝑡2 = 𝛿0 + 𝛾 − 𝛿1 + 𝜃1 𝑙𝑛𝜎𝑡−1
𝜎𝑡−1

Los coeficientes 𝛾 + 𝛿1 y 𝛾 − 𝛿1 muestran la asimetría ante choques positivos


y negativos de 𝜀𝑡−1 . Observe que si 𝛾 < 0, existe efecto de apalancamiento.
Varianza incondicional de los errores bajo el proceso EGARCH (1,1)

La varianza incondicional (o de largo plazo) de los errores bajo una estructura EGARCH (1,1) es,

𝛿0
𝜎𝜀2 = 𝑒𝑥𝑝
1 − 𝜃1

Finalmente comparando los modelos GARCH y EGARCH se puede decir que un modelo GARCH tiene
la limitación de que trata los efectos de modo simétrico, debido que utiliza los cuadrados de las
innovaciones. Otra importante limitación son las restricciones que deben cumplir los parámetros,
dichas restricciones eliminan el comportamiento al azar-oscilatorio que pueda presentar la varianza
condicional. En un modelo EGARCH no hay restricciones en los parámetros.
Causalidad: Correlación Cruzada

La función de correlación cruzada, 𝜌𝑥𝑦 𝑘 , de dos procesos estocásticos conjuntamente


𝛾𝑥𝑦 𝑘
estacionarios, 𝑥𝑡 , 𝑦𝑡, viene dada por: 𝜌𝑥𝑦 = 𝜎 𝜎 ; 𝑘 = 0, ±1, ±2 … .
𝑥 𝑦

Donde, 𝛾𝑥𝑦 𝑘 , es la función de covarianzas cruzadas que se define mediante la siguiente


expresión: 𝛾𝑥𝑦 𝑡, 𝑡 + 𝑘 = 𝛾𝑥𝑦 𝑘 = 𝐸 𝑥𝑡 − 𝜇𝑥 𝑦𝑡+𝑘 − 𝜇𝑦 .

Propiedades:

a. 𝜌𝑥𝑦 𝑘 ≤ 1;

b. En general 𝜌𝑥𝑦 𝑘 ≠ 𝜌𝑦𝑥 −𝑘 no es simétrica alrededor del origen. Para 𝑘 > 0 mide la
relación desde 𝑥 hacia 𝑦, mientras que para 𝑘 < 0 la relación desde 𝑦 hacia 𝑥.
Causalidad: Correlación Cruzada

Propuesto por Pierce y Haugh, utiliza la técnica de preblanqueo para eliminar cualquier
patrón de autocorrelación existente en los datos.
Este procedimiento consiste en identificar y estimar el modelo ARIMA que mejor se ajuste a
cada serie y obtener los correspondientes residuos ruido blanco; estos constituyen la serie
preblanqueada.
Finalmente, se estima la correlación cruzada entre las series preblanqueadas y se
determinan las relaciones de causalidad entre cada par de series.
𝐸 𝑢𝑡 𝑣𝑡+𝑘 𝑐𝑢ෝ𝑣ො 𝑘
𝜌𝑢𝑣 𝑘 = 𝑟𝑢ෝ𝑣ො 𝑘 =
𝐸 𝑢𝑡2 𝐸 𝑣𝑡2 𝑐𝑢ෝ 0 𝑐𝑣ො 0
𝑛−𝑘

𝑛−1 ෍ 𝑢ො 𝑡 𝑣ො𝑡+𝑘 𝑘 ≥ 0 𝑐𝑢ෝ 0 = 𝑐𝑢ෝ𝑢ෝ 0 , y 𝑢ො 𝑡 y 𝑣ො𝑡 corresponden a las


𝑡=1 series preblanqueadas, siendo 𝑛 el tamaño de
𝑐𝑢ෝ𝑣ො 𝑘 = 𝑛 la muestra.
𝑛−1 ෍ 𝑢ො 𝑡 𝑣ො𝑡+𝑘 𝑘 < 0
𝑡=1−𝑘
Causalidad: Correlación Cruzada
Relaciones Restricciones sobre 𝝆𝒖𝒗 𝒌
𝑥 causa a 𝑦 𝜌𝑢𝑣 𝑘 ≠ 0, para algún 𝑘 > 0
𝑦 causa a 𝑥 𝜌𝑢𝑣 𝑘 ≠ 0, para algún 𝑘 < 0
causalidad instantánea 𝜌𝑢𝑣 0 ≠ 0
retroalimentación 𝜌𝑢𝑣 𝑘 ≠ 0, para algún 𝑘 > 0 y para algún 𝑘 < 0
𝜌𝑢𝑣 𝑘 ≠ 0, para algún 𝑘 > 0 y 𝜌𝑢𝑣 0 ≠ 0
𝑥 causa a 𝑦 pero no instantáneamente 𝜌𝑢𝑣 𝑘 = 0, para todo 𝑘 < 0
𝑦 no causa a 𝑥 𝜌𝑢𝑣 𝑘 = 0, para todo 𝑘 ≤ 0
𝑦 no causa a 𝑥 de ninguna forma 𝜌𝑢𝑣 𝑘 ≠ 0, para algún 𝑘 > 0, y 𝜌𝑢𝑣 𝑘 = 0, para:
Causalidad unidireccional de 𝑥 a 𝑦 a) todo 𝑘 < 0 ó
b) todo 𝑘 ≤ 0
𝑥 e 𝑦 sólo están relacionadas instantáneamente 𝜌𝑢𝑣 0 ≠ 0, y 𝜌𝑢𝑣 𝑘 = 0 si 𝑘 ≠ 0
𝑥 e 𝑦 no se causan 𝜌𝑢𝑣 𝑘 = 0, para todo 𝑘
Condiciones de causalidad de acuerdo con la correlación cruzada
Fuente: Pierce y Haugh (1977, p. 276)
Causalidad de Granger

El test de causalidad de Granger sirve para determinar el grado de significación relativa a la


precedencia estadística entre dos series temporales. El test no refleja una relación “causal”
en sentido estricto o filosófico sino que indica “causalidad” en términos de precedencia o
predictibilidad entre dos series.

La hipótesis nula de los test, Ho: que no exista dicha causalidad. En este sentido podemos
decir que la causalidad en el sentido de Granger es una condición necesaria pero no
suficiente para la existencia de verdadera causalidad.
Causalidad de Granger

1. Si las variables son estacionarias o, siendo no estacionarias, están cointegradas, se puede correr el
siguiente modelo con las variables en estado:
𝑚 𝑛

𝑥𝑡 = 𝛼 + ෍ 𝛽𝑖 𝑥𝑡−𝑖 + ෍ 𝛾𝑗 𝑦𝑡−𝑗 + 𝑢𝑡
𝑖=1 𝑗=1
Estadístico:
𝑞 𝑟 𝐿 𝑚1
𝑦𝑡 = 𝑎 + ෍ 𝑏𝑖 𝑦𝑡−𝑖 + ෍ 𝑐𝑗 𝑥𝑡−𝑗 + 𝑣𝑡 𝐿𝑅 = −2 ln
𝐿 𝑚2
𝑖=1 𝑗=1 = 2 𝐿𝑙(𝑚1) − 𝐿𝑙(𝑚2) ~𝑋𝑛2 ó 𝑟
Se comparan frente a:
Donde 𝐿 𝑚1 y 𝐿 𝑚2 es la verosimilitud
𝑚
del modelo restringido y no restringido,
𝑥𝑡 = 𝛼 + ෍ 𝛽𝑖 𝑥𝑡−𝑖 + 𝑢𝑡 respectivamente, y 𝐿𝑙 𝑚1 y 𝐿𝑙 𝑚2 es el
𝑖=1 logaritmo de la verosimilitud.
𝑞

𝑦𝑡 = 𝑎 + ෍ 𝑏𝑖 𝑦𝑡−𝑖 + 𝑣𝑡 Es posible también usar el estadístico F


equivalente de comparación.
𝑖=1
Causalidad de Granger

2. Para testar la causalidad de series temporales no estacionarias pero cointegradas, es


comprobar si existe causalidad en el sentido de Granger entre las variables en
diferencias, pero dada la no estacionariedad de las series, dicha correlación ha de ser
corregida mediante el modelo de corrección de errores.
𝑚 𝑛

∆𝑥𝑡 = 𝛼 + ෍ 𝛽𝑖 ∆𝑥𝑡−𝑖 + ෍ 𝛾𝑗 ∆𝑦𝑡−𝑗 + 𝛿𝜀𝑡−1 +𝑢𝑡


𝑖=1 𝑗=1
𝑞 𝑟

∆𝑦𝑡 = 𝑎 + ෍ 𝑏𝑖 ∆𝑦𝑡−𝑖 + ෍ 𝑐𝑗 ∆𝑥𝑡−𝑗 + 𝑑𝜀𝑡−1 + 𝑣𝑡


𝑖=1 𝑗=1

Donde 𝜀𝑡−1 es el mecanismo de corrección de error; es decir, los residuos estimados 𝜀𝑡 de la


ecuación:
𝑦𝑡 = 𝛼 ′ + 𝛽 ′ 𝑥𝑡 + 𝜀𝑡

Las dos variables se encuentran cointegradas si los residuos del modelo anterior se
comportan como un proceso estacionario.
Causalidad de Granger

Una dificultad inherente a cualquiera de las dos versiones es determinar el número de rezagos a incluir
en los modelos, una alternativa es utilizar Akaike Información Criterion (AIC) o Criterios de información
Bayesiana (BIC) que son dos medidas usuales que comparan el ajuste (medido como verosimilitud o en
función de estadísticos de error) de distintos modelos.

 AIC: Es un criterio de selección de modelos propuesto por Akaike (1974), que se basa en la teoría de
información; es útil para evaluar el desempeño de la predicción dentro y fuera de la muestra. Su
𝑆𝐶𝐸 𝐾
expresión es: ln( ) + 2 , donde 𝑆𝐶𝐸 es la suma de cuadrados del error, T el tamaño muestral y k el
𝑇−𝐾 𝑇
número de regresores usados en el modelo.

 BIC: Es un criterio alternativo de selección de modelos propuesto por Schwarz (1978) con un enfoque
𝑆𝐶𝐸 𝐾
Bayesiano. Su expresión es ln 𝑇−𝐾 + 𝑇 ln 𝑇 .
Causalidad de Granger

¿𝑥𝑡 y 𝑦𝑡 son estacionarias?


Si No (en el mismo grado)

CG entre 𝑥𝑡 y 𝑦𝑡 ¿Están 𝑥𝑡 y 𝑦𝑡 cointegradas?

Si No

1. CG entre 𝑥𝑡 y 𝑦𝑡 CG entre ∆𝑥𝑡 y ∆𝑦𝑡

2. CG entre ∆𝑥𝑡 y ∆𝑦𝑡


controlando por 𝜀𝑡−1
Modelos VAR (Vectores Autorregresivos)

Popularizado en 1980 por Sims como una generalización de los modelo Autorregresivos
univariados AR(p).

Es un modelos de sistemas de ecuaciones, en el cuál hay más de una variable dependiente.


En resumen estos modelos:
1. Permite estimar un sistema de ecuaciones
2. Asume endogeneidad en todas las variables
3. Indicado para modelar series de tiempo estacionarias
4. En ocasiones, estas técnicas tienen un mejor desempeño en pronóstico que los
métodos univariados
5. Las limitaciones es que en los resultados se obtiene muchos parámetros. Por ejemplo,
si se tiene k variables con p rezagos en cada ecuación, tendríamos (𝑘 + 𝑝𝑘 2 )
parámetros.
Modelos VAR (Vectores Autorregresivos)
Un VAR(1)

𝑦1𝑡 = 𝛽10 + 𝛽11 𝑦1𝑡−1 + 𝛼11 𝑦2𝑡−1 + 𝑢1𝑡


𝑦2𝑡 = 𝛽20 + 𝛽21 𝑦2𝑡−1 + 𝛼21 𝑦1𝑡−1 + 𝑢2𝑡

Donde 𝑢𝑖𝑡 es un termino de perturbación Ruido Blanco.

𝑦1𝑡 𝛽10 𝛽11 𝛼11 𝑦1𝑡−1 𝑢1𝑡


𝑦2𝑡 = 𝛽20 + 𝛼21 𝛽21 𝑦2𝑡−1 + 𝑢2𝑡

Lo anterior se puede reescribir como:

𝑦𝑡 = 𝑉 + 𝐴𝑦𝑡−1 + 𝑢𝑡
Modelos VAR (Vectores Autorregresivos)

 Una forma de definir la longitud de rezago es a través de los criterios de información, identificar el
rezago en el que los criterios se hagan mínimos. (AIC, BIC, HQ, …). Otra forma, es con conocimiento
a priori sobre la teoría económica de las variables objeto de estudio.
 Es necesario validar la estabilidad del modelo a través del análisis de los módulos de los inversos de
las raíces del polinomio conjunto de rezago asociado, los cuales deben ser menores que uno. Si el
VAR es no estable varios de los resultados serán no validos. Ej.
Modelos VAR (Vectores Autorregresivos)

 Se debe verificar que los residuos tengan un comportamiento Ruido Blanco. Para
verificar el comportamiento Ruido Blanco de los residuos se utiliza la prueba Portmanteu,
un test conjunto multivariado Q-statistics de Ljung-Box hasta un especifico orden.

 La hipótesis nula es que las variables son multi-ruido blanco. No autocorrelación residual
hasta un rezago determinado.

 Si las series no son estacionarias, es necesario evaluar la posibilidad de una modelación


de corrección del error, modelos VEC, los cuales tienen en cuenta la presencia de una o
más ecuaciones de cointegración.
Modelos VAR (Vectores Autorregresivos)

• Funciones impulso respuesta. Esta función permite determinar ante choques, por lo
general de una desviación estándar, en una determinada variable (X o Y o Z), como se
afectan las demás variables. Un choque a la i-esima variable no solo afecta la i-esima
variable sino que el efecto es transmitido a todas las otras variables a través de la
estructura dinámica o de rezago del modelo VAR. Es importante resaltar que para lograr
la identificación de los choques sobre las variables es necesario llevar a cabo una
transformación sobre el vector de errores o innovaciones del VAR a una forma ortogonal.

• Lo mas aconsejable es usar la transformación de impulso respuesta generalizada la cual


construye un conjunto ortogonal de innovaciones en donde el orden de inclusión de las
variables al VAR no importa.
Modelos VAR (Vectores Autorregresivos)

 Descomposición de la varianza. Otorga la proporción de variación de cada variable


dependiente debido a sus propios choques o innovaciones y frente a los choques o
innovaciones de las otras variables, k periodos futuros después de los choques.
Proporciona información sobre la importancia relativa de cada innovación aleatoria.

 Pronóstico. Permite realizar estimaciones futuras de las variables, puntualmente o por


intervalo, en donde se tiene la ventaja de reconocer la estructura de relación de las
variables a través del modelo VAR. Se realiza un pronóstico conjunto de las variables. En
algunas ocasiones genera mayor precisión que métodos univariados
Modelos VEC (Vectores Autorregresivos)

¿Qué sucede cuando quiero estimar un modelo donde las variables son no estacionarias? La solución
consiste en la búsqueda de una o más combinaciones lineales de dichas variables que sean estacionarias, y
que, a su vez minimicen la varianza de la representación VAR estacionaria.

Esta solución se conoce como VEC

La forma general del modelo VEC es la siguiente:

𝑍𝑡 = 𝛽 ′ 𝑌𝑡
𝑝
∆𝑌𝑡 = 𝛼𝛽 ′ 𝑌𝑡−1 + σ𝑖=1 𝜏𝑖 ∆𝑌𝑡−𝑖 + 𝜀𝑖

El vector α, contiene los coeficientes de velocidad de ajuste, multiplica el desequilibrio que encuentra en el
corto plazo entre las variables del sistema, y lo transmite a cada una de ellas, de tal manera que los
cambios en las variables para el siguiente período dependan de su desequilibrio en el período anterior.
Modelos VEC (Vectores Autorregresivos)

X,Y

¿Son estacionarias las series?  El VAR en diferencias se debe


utilizar cuando las variables están
integradas, pero no cointegradas.

Si No
 El VEC se debe utilizar cuando las
variables están integradas y están
cointegradas.
Adoptar un Modelo VAR ¿Están cointegradas?

 Si las series no están integradas, se


Si no lo están, se deberá debe realizar un VAR (en niveles).
Si los están, se deberá
adoptar un Modelo VAR
adoptar un Modelo VEC
en diferencias.
Modelos VEC (Vectores Autorregresivos)

¿Cómo evaluar y tener en cuenta la existencia de mas de una ecuación de


cointegración?.

Cuando se consideran sistemas de más de dos variables, el análisis de cointegración se


torna más complejo ya que puede existir más de una combinación lineal estacionaria
de las variables. Realizar las pruebas tradicionales de cointegración bajo estimación
uniecuacional, conduce a una pérdida de información valiosa y es un método
ineficiente.

Para la búsqueda del número de ecuaciones de cointegración y su estimación, se utiliza


el test y método de Johansen.
Modelos VEC (Vectores Autorregresivos)

La Metodología de Johansen establece un mecanismo de reconocimiento conjunto de todas las posibles


relaciones cointegrantes existentes dentro del vector de variables integradas de orden d, I(d), d≥ 1

Los objetivos de la prueba: Determinar el número de vectores de cointegración entre las variables y
estimar el sistema conformado por dichas variables, considerando las restricciones de largo plazo (si estas
existen).

H0 :Existen máximo r vectores de cointegración


Ha :Existen al menos r+1 vectores de cointegración

Ya sea mediante el test de la traza o del máximo valor propio, es una prueba secuencial que finaliza al no
encontrar evidencia para rechazar la hipótesis nula
Modelos VEC (Vectores Autorregresivos)
Como existen varias posibilidades en la estructura de cointegración del modelo:

a) Sin tendencia determinista en niveles y sin intercepto en la ecuación de cointegración;


b) Sin tendencia determinista en niveles y con intercepto en la ecuación de cointegración;
c) Con tendencia determinista en niveles y con intercepto en la ecuación de cointegración; y
d) Con tendencia determinista en niveles y con tendencia e intercepto en la ecuación de cointegración.

Se utiliza la propuesta del criterio de Pantula, la cual permite identificar la opción menos restrictiva.

Hipótesis nula: -Se va de izquierda a derecha, empezando por


Modelo (a) Modelo (b) Modelo (c) Modelo (d)
Máximo…
r=0, para el modelo (a), luego modelo (b),
0 vectores de modelo (c), modelo (d), después bajo a r=1
P-value P-value P-value P-value modelo (a), etc.…se detiene cuando se indique
cointegración
que “No se rechaza la Ho”.
1 vectores de
P-value P-value P-value P-value
cointegración
-Si se tiene un p-value>alfa en r=0, implica
que no hay vectores de cointegración, las series
… … … … ...
no están cointegradas. Pero si el no rechazo se
da para r diferente de cero, implica que tengo r
r vectores de
cointegración
P-value P-value P-value P-value vectores de cointegración.
Modelos de Selección Discreta
La microeconomía estudia principalmente casos donde la variable dependiente no es continua. Por
ejemplo:

• Un modelo que trata de explicar los factores determinantes de que una familia sea propietaria de una
casa. (1 Propietario-0 no Propietario).
• Economía Laboral: Determinantes de participación laboral y de ocupación.
• Economía de la Educación: Determinantes de ir a la Universidad.
• Economía de la Innovación: Determinantes de las actividades innovadoras.
• Economía Internacional: Determinantes de la decisión de exportar.
• Economía de la Salud: Determinantes de tener hijo, determinantes de fumar.
• Geografía Económica: Analizar las decisiones sobre los medios de transporte
Realizando un Análisis de Transporte
Usted tiene dos alternativas para resolver su problema de transporte a su trabajo:

• Conducir su auto (Transporte Privado)

• Tomar un Bus (Transporte Público)

Representamos el caso con una variable Dummy

1 𝑇𝑟𝑎𝑛𝑠𝑝𝑜𝑟𝑡𝑒 𝑃𝑟𝑖𝑣𝑎𝑑𝑜
𝑌=ቊ
0 𝑇𝑟𝑎𝑛𝑠𝑝𝑜𝑟𝑡𝑒 𝑃ú𝑏𝑙𝑖𝑐𝑜
Transporte ¿en que medio de transporte se va para el trabajo?
Base de datos: Transporte (Corte Transversal)
Por lo tanto la probabilidad de que usted
seleccione un medio de transporte privado es
igual a P[Y=1]=p, y transporte público,
P[Y=0]=1-p, la función de probabilidad es

𝑓 𝑦 = 𝑝 𝑦 (1 − 𝑝)1−𝑦 , 𝑦 = 0,1

Tomaremos una variable x que será la


diferencia entre el tiempo que toma en ir en
bus y el tiempo en ir en auto.

X=(Tiempo en bus-Tiempo en auto)


Estadísticos Descriptivos
Modelo de Probabilidad Lineal
• Modelos de regresión donde la variable dependiente es binaria o dummy

𝑦 = 𝑋𝛽 + 𝑒

1 𝑆𝑒 𝑐𝑢𝑚𝑝𝑙𝑒 𝑐𝑜𝑛 𝑢𝑛 𝑐𝑟𝑖𝑡𝑒𝑟𝑖𝑜


𝑦𝑖 = ቊ
0 𝑁𝑜 𝑠𝑒 𝑐𝑢𝑚𝑝𝑙𝑒 𝑐𝑜𝑛 𝑐𝑟𝑖𝑡𝑒𝑟𝑖𝑜

• Nuestro interés no esta en el valor de Y (que puede ser 1 o 0) sino que esta en la probabilidad
que el valor sea 1 (“Response Probability”)
• La probabilidad es una función lineal de las variables exógenas
𝑃 𝑌𝑖 = 1 = 𝑋𝑖 𝛽 + 𝑒𝑖
• Análogo al modelo de regresión lineal múltiple.
• Estimación por mínimos cuadrados ordinarios.
Modelo de Probabilidad Lineal
• Se puede aplicar MCO a este problema, pero existen 3 inconvenientes:

1. Las predicciones del modelo no necesariamente estarán entre cero y uno.


2. Considere el término de error para un valor dado de Xi, el término de error sólo puede tomar uno
de los siguientes valores.

𝑒𝑖 = 1 − 𝛼 − 𝛽𝑋𝑖 𝐶𝑢𝑎𝑛𝑑𝑜 𝑌𝑖 = 1
𝑒𝑖 = −𝛼 − 𝛽𝑋𝑖 𝐶𝑢𝑎𝑛𝑑𝑜 𝑌𝑖 = 0

En consecuencia los errores no se distribuyen como una normal (de hecho lo hacen como una
binomial)

3. Se puede demostrar que los errores son Heterocedásticos

𝑉𝑎𝑟 𝑒 𝑋 = 𝑥′𝛽(1 − 𝑥 ′ 𝛽)
Modelo de Probabilidad Lineal
• Estimación
Valores fuera de Rango
X para los cuales P(Y=1) nos da valores fuera del rango (0,1)

0.5

0
-3 -2 -1 0 1 2 3
Modelos No Lineales-Logit y Probit
Se asume existencia de una variable latente (Y*)
• Y* determina el valor de y
1 → 𝑦𝑖∗ = 𝑋𝑖 𝛽 + 𝑣𝑖 > 0
𝑦𝑖 = ቊ
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
• Entonces vamos a observar Y=1 solo cuando
𝑣𝑖 > −𝑋𝑖 𝛽
• Consecuentemente
𝑃 𝑦𝑖 = 1 = 𝑃 𝑣𝑖 > −𝑋𝑖 𝛽 = 1 − F(−𝑋𝑖 𝛽)
• Siendo F la función de densidad acumulada de la variable aleatoria 𝑣𝑖 y entonces la probabilidad que
y=0 es:
𝑃 𝑦𝑖 = 0 = 𝐹(−𝑋𝑖 𝛽)
• La forma de F dependerá desde la distribución de 𝑣𝑖
–Si 𝑣𝑖 se distribuye como una función normal
–Si 𝑣𝑖 se distribuye como una función logística
Ajuste no Lineal

Modelo Probit

𝛼+𝛽𝑋𝑖 𝑆2
1 −
𝑌𝑖 = න 𝑒 2 𝑑𝑠 + 𝑢𝑖
−𝛼 2𝜋

Modelo Logit

1 𝑒 𝛼+𝛽𝑋𝑖
𝑌𝑖 = + 𝑢𝑖 = + 𝑢𝑖
1 + 𝑒 −𝛼−𝛽𝑋𝑖 1 + 𝑒 𝛼+𝛽𝑋𝑖
Selección del Modelo
1. Elección de variables de acuerdo a la significancia
2. Prueba de significancia global
3. No existe mucha diferencia entre Logit y Probit
– Ajuste de probabilidades bajas
Función de Densidad Función de Distribución Acumulada
Distribución Normal Normal Estándar
1

0
𝜇 𝑋 -3 0 3 𝑍
−𝑋𝑖 𝛽
𝑃 𝑣𝑖 < −𝑋𝑖 𝛽 = F −𝑋𝑖 𝛽 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑃 𝑣𝑖 > −𝑋𝑖 𝛽 = 1 − F(−𝑋𝑖 𝛽)
¿Cómo vamos a encontrar los parámetros beta?
Se utiliza la técnica de máxima verosimilitud donde 𝑃 𝑌𝑖 = 1 − F −𝑋𝑖 𝛽 si 𝑌𝑖 =1 o 𝑃 𝑌𝑖 = F −𝑋𝑖 𝛽 si
𝑌𝑖 =0.

De este manera se deriva la función de máxima verosimilitud (Likelihood Function) y se soluciona


iterativamente.
𝐿 = ෑ 1 − F −𝑋𝑖 𝛽 ෑ F −𝑋𝑖 𝛽
𝑌𝑖 =1 𝑌𝑖 =0
Esto deriva en formas funcionales diferentes para 𝐹(𝑋𝑖 𝛽)
• Logit
exp(𝑋𝑖 𝛽)
𝐹 𝑋𝑖 𝛽 =
1 + exp(𝑋𝑖 𝛽)
• Probit
𝐹 𝑋𝑖 𝛽 = 𝜙(𝑋𝑖 𝛽)
Diagnóstico
1. Prueba de Hosmer-Lemeshow
–Hipótesis Nula: el modelo es válido

2. Evaluación del Poder Predictivo


–Deber escogerse un valor de corte (cutoff) de la probabilidad predicha para clasificar los
pronósticos en 1 y 0.
–Porcentaje de observaciones clasificadas correctamente
–Porcentaje de error.
Evaluación del Poder Predictivo

REAL

Y=1 Y=0

Predichos
PRONÓSTICO

Y´=1 Verdadero Positivo Falso Positivo Positivos


Y´=1
Predichos
Verdadero
Y´=0 Falso Negativo Positivos
Negativo
Y´=0

Positivos Y=1 Negativos Y=0

Sensibilidad: Tasa de Verdaderos Positivos


Especificidad: Tasa de Verdaderos Negativos
Interpretación de los Betas
Ahora la cuestión es: como se interpretan los betas.

• La interpretación no puede ser la misma que en un modelo lineal.

• El impacto de las variables independientes (impacto marginal) es diferente dependiendo del punto en
el cual se calcula el impacto.
𝑑𝐹(𝑋𝑖 𝛽 )
= 𝑓(𝑋𝑖 𝛽)𝛽𝑘
𝑑𝑥𝑖𝑘
• Entonces recordando la distribución normal es claro que el impacto marginal varia dependiendo en
donde se encuentre el umbral 𝑋𝑖 𝛽.

• Puntos cercanos a la media tienen un impacto mucho mayor en comparación con puntos en las “colas”
de la distribución
Evaluación del Modelo
• Una forma intuitiva de hacerlo es medir la capacidad de nuestro modelo de “atinar” la realidad.
–Si 𝑌𝑖 = 1 y nuestro modelo predice que P(𝑌𝑖 ) F(𝑋𝑖 𝛽)>0.5 entonces esta bien.
–La “Frecuencia” con que “Atinamos” es un indicador de bondad de ajuste.

• Otra forma de evaluar el modelo es usar el Pseudo R2 que compara la función de verosimilitud así
como maximizada por los betas estimados con una función donde todos los betas son cero (y solo hay
una constante)

• Medidas de Confiabilidad del Modelo:


–La Devianza
–El Pseudo R2
–El criterio de Información Akaike (AIC)
–La prueba de Bondad de Ajuste de H-L
Devianza
Es similar a la suma de cuadrado del error de la regresión lineal.

Si la variable de respuesta Y no esta agrupada se tiene que:

𝑛 𝑛

𝐷 = −2 ෍ 𝐿𝑜𝑔 𝑝Ƹ 𝑖 + ෍ 𝐿𝑜𝑔 1 − 𝑝Ƹ 𝑖
𝑦𝑖 =1 𝑦𝑖 =0

D tiene una distribución Ji-Cuadrado con (n-p-1) grados de libertad


Si D es mayor que una Ji-Cuadrado con (n-p-1) gl para un nivel de significancia dado, entonces, el
modelo logístico no es confiable.
El Pseudo R2
Es similar al 𝑅2 de la regresión lineal se define por:

𝐷𝑒𝑣𝑖𝑎𝑛𝑧𝑎
𝑃𝑠𝑒𝑢𝑑𝑜 − 𝑅2 = 1 −
𝐷𝑒𝑣𝑖𝑎𝑛𝑧𝑎 𝑅𝑒𝑠𝑡𝑟𝑖𝑛𝑔𝑖𝑑𝑎

Donde la Devianza Restringida es la devianza considerando solamente el intercepto y se distribuye


como una Ji-Cuadrado con (n-1) grados de libertad. Para hallar la Devianza Restringida se hace una
regresión de tipo logístico considerando que solo hay una variable predictora cuyos valores son todos
unos.
Criterio de Información Akaike (AIC)
Determina si un modelo es mejor que otro. Esta dado por:

𝐷 2 𝐾+1
𝐴𝐼𝐶 = +
𝑛 𝑛

Donde K, es el número de variables independientes dentro del modelo.

Un modelo es mejor que otro si su AIC es más pequeño.


La Prueba de Bondad de Ajuste: Hosmer Lemeshov
Se aplica cuando los datos son dados en forma agrupada y se define por:

𝑔
(𝑂𝑖 − 𝑛′𝑖 𝑝ҧ𝑖 )2
𝐶=෍ ′
𝑛 𝑖 𝑝𝑖ҧ (1 − 𝑝ҧ𝑖 )
𝑖=1

Donde g es el número de grupos, 𝑛′ 𝑖 es el número de observaciones en el i-esimo grupo, 𝑂𝑖 es la suma


de las y´s en el i-ésimo grupo y 𝑝ҧ𝑖 es el promedio de las 𝑝𝑖 en el i-ésimo grupo.
Ejemplo Aplicado: Riesgo de Crédito
Pérdida Esperada:
𝑃𝐸 = 𝑃𝐼 ∗ 𝑃𝐷𝐼 ∗ 𝐸𝐷𝐼

Siendo PI, Probabilidad de Incumplimiento, PDI es la Pérdida Dado el Incumplimiento, también conocida
como Severidad (% del monto que perdería la entidad) y EDI es la Exposición Dado el Incumplimiento,
que es simplemente el monto de los activos expuestos (saldo de cuenta).

𝑃𝐸 = 𝑃𝐼 ∗ 𝑃𝐷𝐼 ∗ 𝐸𝐷𝐼 • Análisis Discriminante


• Regresión Logística
• Arboles de Decisión
Pérdida Dado al Incumplimiento (1-R) Valor de Venta • Redes Neuronales
Valor Recibido • Matrices de Transición
Pagos

Curador Pérdida Activo Gastos Administrativos


Secuestro
Definición de la Variables Respuesta
Estos criterios dependerá del tipo de crédito que se tenga. Por esta razón, se definirá la variable de
respuesta con el valor de uno si el cliente ha alcanzado la altura de mora M en el periodo t+x y cero en
caso contrario. En Colombia, la Superintendencia Financiera ha definido esta altura de la siguiente
manera:

• Créditos comerciales que se encuentren en mora mayor o igual a 150 días.


• Créditos que según lo establecido en el numeral 1 del Capítulo XX de esta Circular se consideren de tesorería y se encuentren en mora.
• Créditos de consumo que se encuentren en mora mayor a 90 días.
• Créditos de vivienda que se encuentren en mora mayor o igual a 180 días.
• Microcréditos que se encuentren en mora mayor o igual a 30 días.
Regresión Logística

𝑝
𝐿𝑛 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑛 𝑋𝑛
1−𝑝

Variable Dependiente: Categórica


Variables Independientes:
Parámetros: Estimación Máximo Categóricas y/o Continuas
Verosimil (Método Iterativo)

1 𝑒𝑧
𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝐸𝑣𝑒𝑛𝑡𝑜 = =
1 + 𝑒 −(𝛽0+𝛽1𝑋1+𝛽2𝑋2+⋯+𝛽𝑛𝑋𝑛) 1 + 𝑒𝑧
Después de la Estimación
El Scoring:

Calificación que se le da a los clientes:


–Si tiene un Score Alto significa que es un buen cliente

–Si se tiene un Score Bajo se le pone tasas de interés alta, se vende la cartera, se titulariza,
se les presta menor cantidad, se colocan más garantías, altas políticas de cobranza.
Miguel Angel Bello
Economista, MBA, CRM.
miguel.bello@software-shop.com