You are on page 1of 29

PROYECTO AMPLIADO

PREVISIÓN DE SERIES TEMPORALES

VENTA DE CALZADO - INFORME COMERCIAL

RHEA.S.M
PGPDSBA Online Sep_B 2021

1
Índice

1. Problema 1:....................................................................................................................................................
1.1. Objetivo..........................................................................................................................................................
1.2. Análisis descriptivo y exploratorio de datos...................................................................................................
1.2.1. Análisis descriptivo de datos:..................................................................................................................
1.2.2. Datos de series temporales:....................................................................................................................
1.2.3. Análisis exploratorio de datos:................................................................................................................
1.3. División de los datos de entrenamiento y prueba..........................................................................................
1.4. Construcción de diferentes modelos y comprobación del RMSE..................................................................
1.4.1. Regresión lineal:....................................................................................................................................
1.4.2. Modelo Naïve Bayes:............................................................................................................................
1.4.3. Previsión media simple:........................................................................................................................
1.4.4. Previsión de medias móviles:................................................................................................................
1.4.5. Suavizado exponencial simple:.............................................................................................................
1.4.6. Suavizado exponencial doble:...............................................................................................................
1.4.7. Suavizado exponencial triple:...............................................................................................................
1.4.8. Suavizado exponencial triple (multiplicativo):......................................................................................
1.5. Comprobación de la estacionariedad...........................................................................................................
1.6. ARIMA y SARIMA utilizando el método AIC más bajo:..................................................................................
1.7. ARIMA y SARIMA basados en los puntos de corte de ACF y PACF:...............................................................
1.8. Comparación de los valores RMSE................................................................................................................
1.9. Construcción del modelo óptimo y previsión a 12 meses.............................................................................
1.10. Conclusiones y sugerencias...................................................................................................................

2
Lista de figuras
Figura Nombre Nº de
No. página
Figura Gráfico de series temporales -Venta de zapatos 5
1
Figura Trama mensual de ventas de calzado 6
2
Figura Ventas mensuales de calzado a lo largo de los años 6
3
Figura Gráfico de series temporales con media y mediana 6
4
Figura Descomposición multiplicativa del conjunto de datos 7
5
Figura Descomposición aditiva del conjunto de datos 8
6
Figura Venta de calzado- Formación y prueba dividida 9
7
Figura Regresión lineal 10
8
Figura Modelo Naïve Bayes 11
9
Figura Previsión media simple 11
10
Figura Previsión de la media móvil final 12
11
Figura Suavizado exponencial simple 13
12
Figura Suavizado exponencial simple y doble 13
13
Figura Alisamiento exponencial simple, doble y triple 14
14
Figura Alisamiento exponencial simple, doble y triple (multiplicativo) 14
15
Figura Estacionariedad de las ventas de calzado en el lag 1 16
16
Figura AIC-ARIMA(2,1,3) A. Resumen, B. Gráfico y C. Diagnóstico 18
17
Figura AIC- SARIMA(0,1,2) (1, 0, 2, 12) A. Resumen, B. Gráfico y C. Diagnóstico 20
18
Figura Autocorrelación de datos diferenciados 21
19
Figura Autocorrelación parcial de datos diferenciados 21
20
Figura ACF/PACF- ARIMA(3,1,1) A. Resumen, B. Gráfico y C. Diagnóstico 22
21
Figura Figura-22 ACF/PACF- SARIMA(3,1,1) (2, 0, 4, 12) A. Resumen, B. Gráfico y C. 24
22
Diagnóstico
Figura Modelo óptimo Previsión para los próximos 12 meses 25

3
23

Lista de cuadros
Tabla No. Nombre Nº de página
Cuadro 1 Resumen de la información estadística descriptiva 4
Cuadro 2 Formar y probar la división 9
Cuadro 3 Resumen de los resultados de todos los modelos 24

1. Problema 1:
1.1. Objetivo

 El objetivo del problema es construir un modelo óptimo para predecir las ventas de
pares de zapatos en los próximos 12 meses a partir de los datos actuales.
 Además, tenemos que comentar el modelo así construido e informar de nuestras
conclusiones y sugerir las medidas que la empresa debería adoptar para futuras
ventas.

1.2. Análisis descriptivo y exploratorio de datos

Antecedentes: Usted es analista en la empresa de calzado IJK y debe realizar una


previsión de las ventas de pares de zapatos para los próximos 12 meses a partir de
donde terminan los datos. Se le han facilitado los datos de las ventas de pares de
zapatos desde enero de 1980 hasta julio de 1995.
Diccionario de datos:
AñoMes: Mes y año de venta del calzado
Shoe_Sales: La venta mensual de zapatos
1.2.1. Análisis descriptivo de datos:

 El conjunto de datos se ha leído y almacenado como marco de datos para su


posterior análisis.
 El conjunto de datos proporcionado consta de un total de 2 columnas y tiene
187 entradas de naturaleza numérica. No hay valores nulos presentes.
 La primera columna representa la fecha en la que se han registrado las ventas
de zapatos. Mientras que la segunda columna representa las Ventas
propiamente dichas.
 La siguiente tabla 1 contiene los parámetros head(), tail(), info() y la
descripción del conjunto de datos.

Tabla-1: Resumen de la información estadística descriptiva

Cabeza del conjunto de Cola del conjunto de Información del conjunto de datos:
datos: datos:

4
Describir la función en el conjunto de datos: No hay valores nulos en el conjunto de
datos.

1.2.2. Datos de series temporales:

 Una serie temporal es una serie de mediciones de la misma variable


recogidas a lo largo del tiempo. Estas mediciones se realizan a intervalos de
tiempo regulares. Una serie temporal es una serie de puntos de datos
indexados en orden temporal. Por lo general, una serie temporal es una
secuencia tomada en puntos sucesivos igualmente espaciados en el tiempo.
Se trata, pues, de una secuencia de datos en tiempo discreto.
 En la figura 1 se aprecia claramente la tendencia anual de las ventas de
calzado. Este gráfico nos da una visión general de los datos sin tener que
comprobar cada número del conjunto de datos.

Figura-1 Gráfico de series temporales - Venta de zapatos

1.2.3. Análisis exploratorio de datos:

 El análisis exploratorio de datos se refiere al proceso crítico de realizar


investigaciones iniciales sobre los datos para descubrir patrones, detectar
anomalías y probar hipótesis.

5
 En la siguiente Figura-2 podemos ver las gráficas de caja mensuales de las
ventas de calzado. Podemos ver que hay valores atípicos en abril y mayo.
Esto nos indica que en esos meses se realizaron algunas ventas fuera de lo
habitual.
 Vemos que las ventas tienden a repuntar en la segunda mitad del año más
que en la primera. Diciembre registra las mayores ventas de calzado.
 El repunte puede deberse a la temporada de vacaciones, y quizá los zapatos
se compren y utilicen mucho, ya sea para consumo propio o para regalar.
 En la Figura 3 se muestra la tendencia mensual y anual. Una vez más,
diciembre es el mes más popular para la venta de calzado, así como el año en
que se alcanzó el máximo de ventas, entre 1986 y 1988. Este pico puede
deberse al interés generalizado y a la gran cantidad de innovaciones
realizadas para atraer a los clientes a la compra de sus productos, impulsando
así las ventas.
 La Figura 4 nos muestra la serie temporal trazada junto con los valores de la
media y la mediana trazados a lo largo del mismo gráfico, para comprender
la fluctuación de los datos a partir de estas dos medidas de tendencia central.
 Además, la media es superior a la mediana, lo que lleva a la conclusión de
que la distribución está sesgada positivamente.

Figura-2 Box plot mensual de las ventas de calzado

6
Figura 3 Ventas mensuales de calzado a lo largo de los años

Figura 4 Gráfico de series temporales con media y mediana


 DESCOMPOSICIÓN DEL CONJUNTO DE DATOS:

La descomposición de series temporales implica pensar en una serie como


una combinación de componentes de nivel, tendencia, estacionalidad y ruido.
La descomposición proporciona un modelo abstracto útil para pensar en las
series temporales en general y para comprender mejor los problemas durante
el análisis y la previsión de series temporales. Son de dos tipos, generalmente
multiplicativos y aditivos.

(i) Descomposición multiplicativa del conjunto de datos:


Los datos se representan en términos de multiplicación de
componentes estacionales, tendenciales, cíclicos y residuales. Se utiliza
cuando el cambio se mide en porcentaje (%).

7
Figura-5 Descomposición multiplicativa del conjunto de datos

(ii) Descomposición aditiva del conjunto de datos:


Los datos se representan sumando los componentes de estacionalidad,
tendencia, cíclico y residual. Se utiliza cuando el cambio se mide en
cantidad absoluta.

8
Figura-6 Descomposición aditiva del conjunto de datos

Dado que estamos estudiando el cambio en la cantidad absoluta para este conjunto de
datos concreto, pasamos a utilizar el modelo aditivo.

1.3. División de los datos de entrenamiento y prueba

La división entrenamiento-prueba se utiliza para estimar el rendimiento de los


algoritmos de aprendizaje automático aplicables a algoritmos/aplicaciones basados en
la predicción. Este método es un procedimiento rápido y fácil de realizar, de forma
que podemos comparar los resultados de nuestro propio modelo de aprendizaje
automático con los resultados de la máquina.
Ambos conjuntos de datos se han dividido en el año 1991. Esto significa que los datos
de la prueba comienzan a partir de 1991.

Tabla 2: División entre entrenamiento y prueba

Datos de entrenamiento Cabecera del Datos de prueba Cabecera del conjunto de


conjunto de datos: datos:

9
Datos de entrenamiento Cola del conjunto de Datos de prueba Cola del conjunto de datos:
datos:

Datos de prueba Forma = (55, 1)


Datos del tren Forma = (132, 1)

Representación gráfica de la división entre tren y prueba:

Figura 7 Ventas de calzado: división entre tren y prueba

1.4. Construcción de diferentes modelos y comprobación del RMSE

10
 Se nos ha pedido que construyamos varios modelos de suavizado
exponencial en los datos de entrenamiento y que evaluemos el modelo
utilizando el RMSE en los datos de prueba.
 También vamos a elaborar otros modelos, como la regresión lineal, los
modelos de previsión ingenuos, los modelos de media simple, etc., y
comprobar el rendimiento en los datos de prueba mediante el RMSE.
 El objetivo principal de construir tantos modelos es asegurarnos de que
elegimos un modelo óptimo con los valores RMSE y MAPE más bajos.
 MAPE son las siglas en inglés de error medio porcentual absoluto. Es el
efecto multiplicativo medio entre cada media estimada y el resultado
observado. RMSE son las siglas en inglés de error cuadrático medio, es
decir, la desviación estándar.

1.4.1. Regresión lineal:

 La regresión lineal es un algoritmo de aprendizaje automático basado en el


aprendizaje supervisado. Realiza una tarea de regresión. Es una gran
herramienta de previsión. Podemos ver en la siguiente figura que la regresión
lineal en el tiempo está en un aumento constante.

Figura-8 Regresión lineal

Tipo de modelo RMSE


Regresión en el tiempo 266.2765

1.4.2. Modelo Naïve Bayes:

 Clasificadores como Naive Bayes utilizan un modelo lingüístico para


clasificar y hacer predicciones sobre datos de series temporales. La Figura 9
muestra que el pronóstico ingenuo de los datos de prueba es siempre el mismo
para todos los datos, lo que no es ideal.

11
Figura-9 Modelo Naïve Bayes

Tipo de modelo RMSE


Regresión en el tiempo 266.2765
Modelo ingenuo 245.1213

Los valores de RMSE parecen ser los más bajos para Naïve Bayes hasta el
momento. Pero como la previsión es constante a lo largo de los años, no es un
modelo ideal para nuestro conjunto de datos.

1.4.3. Previsión media simple:

El método es muy sencillo. Hacemos la media de los datos por meses, trimestres
o años y luego calculamos la media del periodo. A continuación, procedemos a
averiguar qué porcentaje representa respecto a la media general.

Figura-10 Previsión media simple

12
Tipo de modelo RMSE
RegresiónEnTiempo 266.276
5
Modelo ingenuo 245.121
3
SimpleAverageModel 63.9845
7

Hasta ahora, los valores de RMSE parecen ser los más bajos para el método de la
media simple. Pero como la previsión es constante a lo largo de los años, no es
un modelo ideal para nuestro conjunto de datos.

1.4.4. Previsión de medias móviles:

 La previsión de medias móviles es una técnica ingenua y eficaz en la previsión


de series temporales.
 El cálculo de una media móvil implica la creación de una nueva serie cuyos
valores se componen de la media de las observaciones brutas de la serie
temporal original.
 Una media móvil requiere que se especifique un tamaño de ventana
denominado ancho de ventana. Define el número de observaciones brutas
utilizadas para calcular el valor de la media móvil. Hemos utilizado el método
de la media móvil.

Figura-11 Previsión de la media móvil final

Tipo de modelo RMSE


RegresiónEnTiempo 266.2765
NaiveModel 245.1213
SimpleAverageModel 63.98457
Media móvil de 2 puntos 45.94874
4pointTrailingMovingAverage 57.87269
Media móvil de 6 puntos 63.45689
Media móvil de 9 puntos 67.72365

13
Hasta ahora, los valores de RMSE parecen ser los más bajos para el método de la
media móvil móvil de 2 puntos.

1.4.5. Suavizado exponencial simple:

 El alisamiento exponencial simple, también denominado alisamiento


exponencial simple, es un método de previsión de series temporales para
datos univariantes sin tendencia ni estacionalidad. Requiere un único
parámetro, denominado alfa (a), también llamado factor de suavizado o
coeficiente de suavizado.
 El valor alfa o nivel de suavizado con el que se traza el gráfico es 0,605.

Figura-12 Suavizado exponencial simple

1.4.6. Suavizado exponencial doble:

 El alisamiento exponencial doble emplea un componente de nivel y un


componente de tendencia en cada período. El suavizado exponencial doble
utiliza dos ponderaciones (también llamadas parámetros de suavizado) para
actualizar los componentes en cada periodo.
 El valor alfa o nivel de suavizado con el que se traza el gráfico es 0,594,
mientras que el valor beta o tendencia de suavizado es 0,0002.

14
Figura-13 Suavizado exponencial simple y doble

1.4.7. Suavizado exponencial triple:

 El alisamiento exponencial triple se utiliza para tratar los datos de series


temporales que contienen un componente estacional. Este método se basa en
tres ecuaciones de suavizado: componente estacionario, tendencia y
estacional. Tanto la estacionalidad como la tendencia pueden ser aditivas o
multiplicativas. Este es el modelo aditivo.
 El valor alfa o nivel de suavizado al que se traza el gráfico es 0,570, mientras
que el beta o tendencia de suavizado es 0,0001 y el gamma o estacional de
suavizado es 0,293.

Figura-14 Suavizado exponencial simple, doble y triple

1.4.8. Suavizado exponencial triple (multiplicativo):

 Este método se basa en tres ecuaciones de suavizado: componente


estacionario, tendencia y estacional. Este es el modelo multiplicativo.

15
 El valor alfa o nivel de suavizado al que se traza el gráfico es 0,571, mientras
que el beta o tendencia de suavizado es 0,0001 y el gamma o estacional de
suavizado es 0,202.

Figura-15 Suavizado exponencial simple, doble y triple (multiplicativo)


Tipo de modelo RMSE
RegresiónEnTiempo 266.2765
Modelo ingenuo 245.1213
SimpleAverageModel 63.98457
Media móvil de 2 puntos 45.94874
4pointTrailingMovingAverage 57.87269
Media móvil de 6 puntos 63.45689
Media móvil de 9 puntos 67.72365
SimpleExponentialSmoothing 196.4048
AlisadoExponencialDoble 266.1612
Alisado exponencial triple 128.9925
TripleExponentialSmoothingMultiplicative 83.73405

Hasta ahora, los valores de RMSE parecen ser los más bajos para el método de la
media móvil móvil de 2 puntos.

1.5. Comprobación de la estacionariedad

 La prueba Dickey-Fuller aumentada es una prueba de raíz unitaria que


determina si existe una raíz unitaria y, en consecuencia, si la serie es no
estacionaria.
 La hipótesis en forma simple para la prueba ADF es:
H0: La serie temporal tiene una raíz unitaria y, por tanto, no es
estacionaria.

16
H1: La serie temporal no tiene raíz unitaria y, por tanto, es
estacionaria.
 Queremos que las series sean estacionarias para construir modelos ARIMA y,
por lo tanto, queremos que el valor p de esta prueba sea inferior al valor
Alpha.
 Al aplicar el ADF al modelo, obtuvimos un valor p de 0,801, que es superior a
0,5, por lo que no rechazamos la hipótesis nula. Concluyendo que la serie no
es estacionaria.
 Ahora tenemos que hacer una diferenciación de niveles en el conjunto de datos
y comprobar la estacionariedad.
 El valor p tras la diferenciación de nivel 1 es 0,0361<0,05, por lo que ahora
rechazamos la hipótesis nula y concluimos que la serie es estacionaria con un
desfase de 1.
 A continuación se ofrece una representación gráfica de la misma. El valor del
estadístico de prueba es -3,532, mientras que el número de rezagos utilizado es
12.
 Ahora que los datos son estacionarios, podemos pasar a construir los modelos
ARIMA y SARIMA.

Figura-16 Estacionariedad de las ventas de calzado en el lag 1

1.6. ARIMA y SARIMA utilizando el método AIC más bajo:

 Un modelo ARIMA se compone de la parte autorregresiva (AR) y la parte de media


móvil (MA) después de haber hecho estacionaria la serie temporal tomando el
grado/orden correcto de diferenciación.
 Los modelos ARIMA también pueden construirse teniendo en cuenta el criterio de
información de Akaike (AIC). En este caso, elegimos los valores 'p' y 'q' para
determinar los órdenes AR y MA respectivamente que nos dan el valor AIC más bajo.
Cuanto menor sea el AIC, mejor es el modelo.

17
 Los lenguajes de codificación prueban diferentes órdenes de 'p' y 'q' para llegar a esta
conclusión. Recuerde que, incluso para esta forma de elegir los valores "p" y "q",
debemos asegurarnos de que la serie es estacionaria.
 La fórmula para calcular el AIC es 2k - 2ln(L), donde k es el número de parámetros
que hay que estimar y L es la estimación de la verosimilitud.
 Para los modelos SARIMA, también podemos estimar 'p', 'q' , 'P' y 'Q' fijándonos en
los valores AIC más bajos.

 ARIMA:
i. Primero creamos una cuadrícula con todos los resultados posibles (p,d,q). El
rango de 'p' y 'q' es (0,4) y 'd' una constante = 1.

A continuación se muestra la parrilla de todos los resultados posibles:

Modelo: (0, 1, 1)
Modelo: (0, 1, 2)
Modelo: (0, 1, 3)
Modelo: (1, 1, 0)
Modelo: (1, 1, 1)
Modelo: (1, 1, 2)
Modelo: (1, 1, 3)
Modelo: (2, 1, 0)
Modelo: (2, 1, 1)
Modelo: (2, 1, 2)
Modelo: (2, 1, 3)
Modelo: (3, 1, 0)
Modelo: (3, 1, 1)
Modelo: (3, 1, 2)
Modelo: (3, 1, 3)

ii. A continuación, pasamos a ajustar el modelo ARIMA a cada una de las


combinaciones anteriores y terminamos eligiendo aquella con el menor valor
AIC.

param AIC

11 (2, 1, 3) 1480.805493

15 (3, 1, 3) 1482.566450

5 (1, 1, 1) 1492.487187

6 (1, 1, 2) 1494.423859

9 (2, 1, 1) 1494.431498

2 (0, 1, 2) 1494.964605

3 (0, 1, 3) 1495.148474

14 (3, 1, 2) 1495.655855

18
13 (3, 1, 1) 1496.346864

7 (1, 1, 3) 1496.385878

10 (2, 1, 2) 1496.410739

1 (0, 1, 1) 1497.050322

12 (3, 1, 0) 1498.930309

8 (2, 1, 0) 1498.950483

4 (1, 1, 0) 1501.643124

0 (0, 1, 0) 1508.283772

iii. El AIC más bajo para ARIMA es claramente (2, 1, 3) con un AIC de 1480,80.
Ahora ajustamos los datos de entrenamiento con el modelo y realizamos la
previsión en el conjunto de pruebas. Y obtenemos el Resumen ARIMA, el
gráfico y los resultados del diagnóstico.

A.

B.

19
C.

Figura-17 AIC-ARIMA(2,1,3) A. Resumen, B. Gráfico y C. Diagnóstico

iv. Por último, comprobamos la precisión del modelo con ayuda del RMSE y el
MAPE calculados.

Tipo de modelo RMSE MAPE


AIC-ARIMA(2,1,3) 184.648 85.73498

 SARIMA:

i. Creamos una cuadrícula de todas las combinaciones posibles de (p,d,q) junto


con la estacionalidad (P,D,Q) y la estacionalidad de 12. El rango de 'p' y 'q' es
(0,4) y 'd' una constante = 1.

A continuación se muestra la parrilla de todos los resultados posibles:

Modelo: (0, 1, 1)(0, 0, 1, 12)


Modelo: (0, 1, 2)(0, 0, 2, 12)
Modelo: (1, 1, 0)(1, 0, 0, 12)

20
Modelo: (1, 1, 1)(1, 0, 1, 12)
Modelo: (1, 1, 2)(1, 0, 2, 12)
Modelo: (2, 1, 0)(2, 0, 0, 12)
Modelo: (2, 1, 1)(2, 0, 1, 12)
Modelo: (2, 1, 2)(2, 0, 2, 12)

ii. A continuación, pasamos a ajustar el modelo SARIMA a cada una de las


combinaciones anteriores y terminamos eligiendo aquella con el menor valor
AIC.

param estacional AIC


23 (0, 1, 2) (1, 0, 2, 12) 1156.165429
50 (1, 1, 2) (1, 0, 2, 12) 1157.082589
26 (0, 1, 2) (2, 0, 2, 12) 1157.772313
77 (2, 1, 2) (1, 0, 2, 12) 1158.490996
80 (2, 1, 2) (2, 0, 2, 12) 1158.630324

iii. El AIC más bajo para SARIMA es claramente (0, 1, 2) (1, 0, 2, 12) con un
AIC de 1156,165429. Ahora ajustamos los datos de entrenamiento con el
modelo y realizamos la previsión en el conjunto de pruebas. Y obtenemos el
Resumen SARIMA, el gráfico y los resultados del diagnóstico. Esto puede
verse en la Figura 18.

iv. Por último, comprobamos la precisión del modelo con ayuda del RMSE y el
MAPE calculados. AIC-SARIMA tiene el RMSE y el MAPE más bajos hasta
ahora.

Tipo de modelo RMSE MAPE


AIC-ARIMA(2,1,3) 184.648 85.73498
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) 69.03066 26.45588

A.

21
B.

C.

Figura-18 AIC- SARIMA(0,1,2) (1, 0, 2, 12) A. Resumen, B. Gráfico y C. Diagnóstico

1.7. ARIMA y SARIMA basados en los puntos de corte de ACF y PACF:

 Un modelo ARIMA se compone de la parte autorregresiva (AR) y la parte de


media móvil (MA) después de haber hecho estacionaria la serie temporal tomando
el grado/orden correcto de diferenciación.
 El orden AR se selecciona observando dónde corta el gráfico PACF (para bandas
de intervalo de confianza apropiadas) y el orden MA se selecciona observando
dónde corta el gráfico ACF (para bandas de intervalo de confianza apropiadas).
 El grado u orden de diferencia correcto nos da el valor de 'd' mientras que el valor
'p' es para el orden del modelo AR y el valor 'q' es para el orden del modelo MA.
 Para SARIMA, el parámetro estacional "F" puede determinarse observando los
gráficos ACF. Se espera que el gráfico ACF muestre un pico en los múltiplos de
"F", indicando así la presencia de estacionalidad.

22
 Además, en el caso de los modelos estacionales, los gráficos ACF y PACF se
comportarán de forma diferente y no siempre seguirán disminuyendo a medida
que aumente el número de retardos.

 ARIMA:

i. Debemos observar los gráficos ACF y PACF. Obtenemos el valor 'p' del
PACF y el valor 'q' del gráfico ACF. A continuación se muestran los gráficos
con d=1:

Figura-19 Autocorrelación de datos diferenciados

Figura-20 Autocorrelación parcial de datos diferenciados

ii. A continuación, pasamos a ajustar el modelo ARIMA en (3,1,1). Estos valores


se han obtenido a partir de los gráficos ACF y PACF. Y obtenemos el
Resumen ARIMA, el gráfico y los resultados del diagnóstico.

A.

23
B.

C.

Figura-21 ACF/PACF- ARIMA(3,1,1) A. Resumen, B. Gráfico y C. Diagnóstico

iii. Por último, comprobamos la precisión del modelo con ayuda del RMSE y el
MAPE calculados. AIC-SARIMA tiene el RMSE y el MAPE más bajos hasta
ahora.

Tipo de modelo RMSE MAPE


AIC-ARIMA(2,1,3) 184.648 85.7349
8
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) 69.0306 26.4558
6 8
ACF/PACF-ARIMA(3,1,1) 144.183 66.9104

24
9 9
 SARIMA:

i. Debemos observar los gráficos ACF y PACF. Obtenemos el valor 'p' del
PACF y el valor 'q' del gráfico ACF. De los gráficos anteriores, las figuras 19
y 20 para d=1, frecuencia= 12. A partir del gráfico anterior, también podemos
hallar P, D y Q buscando picos estacionales.

ii. A continuación, pasamos a ajustar el modelo SARIMA en (3,1,1) (2, 0, 4, 12).


Estos valores se han obtenido a partir de los gráficos ACF y PACF. Y
obtenemos el Resumen SARIMA, el gráfico y los resultados del diagnóstico.

A.

B.

25
C.

Figura-22 ACF/PACF- SARIMA(3,1,1) (2, 0, 4, 12) A. Resumen, B. Gráfico y


C. Diagnóstico

iii. Por último, comprobamos la precisión del modelo con ayuda del RMSE y el
MAPE calculados. AIC-SARIMA tiene el RMSE y el MAPE más bajos hasta
ahora.

Tipo de modelo RMSE MAPE


AIC-ARIMA(2,1,3) 184.648 85.73498
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) 69.0306 26.45588
6
ACF/PACF-ARIMA(3,1,1) 144.183 66.91049
9
ACF/PACF-SARIMA(3,1,1)(2, 0, 4, 12) 109.924 46.26953
2

1.8. Comparación de los valores RMSE

Tabla 3- Resumen de resultados de todos los modelos RMSE


Tipo de modelo RMSE MAPE
Media móvil de 2 puntos 45.9487
4
4pointTrailingMovingAverage 57.8726
9
Media móvil de 6 puntos 63.4568
9
SimpleAverageModel 63.9845
7
Media móvil de 9 puntos 67.7236
5
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) 69.0306 26.45588
6
TripleExponentialSmoothingMultiplicative 83.7340
5
ACF/PACF-SARIMA(3,1,1)(2, 0, 4, 12) 109.924 46.26953
2
Alisado exponencial triple 128.992
5

26
ACF/PACF-ARIMA(3,1,1) 144.183 66.91049
9
AIC-ARIMA(2,1,3) 184.648 85.73498
SimpleExponentialSmoothing 196.404
8
NaiveModel 245.121
3
AlisadoExponencialDoble 266.161
2
RegresiónEnTiempo 266.276
5

 Vemos que el mejor modelo con menor RMSE es la media móvil de 2 puntos, seguida
de todas las demás medias móviles y también de la media simple. En6º lugar vemos
AIC-SARIMA(0, 1, 2)(1, 0, 2, 12).
 Dado que los valores de RMSE no están demasiado alejados entre el 1º y el 6º lugar
para facilitar el cálculo y lograr una predicción precisa, elegimos AIC-SARIMA(0, 1,
2)(1, 0, 2, 12). Además, los modelos ARIMA son más eficientes desde el punto de
vista computacional y nos ofrecen predicciones precisas.
 También tiene en cuenta el MAPE, y siempre es buena idea tener más de un
parámetro de precisión.
 Los modelos de suavización exponencial y ARIMA son más populares en el sector
cuando se trata de construir modelos. Mientras que la técnica de suavizado
exponencial depende de la suposición de la disminución exponencial de los pesos de
los datos pasados y ARIMA se emplea mediante la transformación de una serie
temporal a una serie estacionaria y el estudio de la naturaleza de la serie estacionaria a
través de ACF y PACF y, a continuación, teniendo en cuenta los efectos
autorregresivos y de media móvil en una serie temporal, si están presentes.

1.9. Construcción del modelo óptimo y previsión a 12 meses

Vamos a construir el modelo óptimo con AIC-SARIMA(0, 1, 2)(1, 0, 2, 12) según la


explicación dada anteriormente.

27
Figura-23 Previsión del modelo óptimo para los próximos 12 meses

1.10. Conclusiones y sugerencias

 El conjunto de datos contiene un total de 187 entradas, de las cuales 2


variables. La primera columna representa la fecha en la que se han registrado
las ventas de zapatos. Mientras que la segunda columna representa las Ventas
propiamente dichas. No hay valores nulos en el conjunto de datos.
 Hay valores atípicos en abril y mayo. Esto nos indica que en esos meses se
realizaron algunas ventas fuera de lo habitual.
 Las ventas tienden a repuntar en el segundo semestre más que en el primero.
Diciembre registra las mayores ventas de calzado.
 El repunte puede deberse a la temporada de vacaciones, y quizá los zapatos
se compren y utilicen mucho, ya sea para consumo propio o para regalar.
 Tanto en la tendencia mensual como en la anual, vemos que diciembre es el
mes más popular para la venta de zapatos, así como el año en que alcanzó su
máximo de ventas, entre 1986 y 1988. Este pico puede deberse al interés
generalizado y a la gran cantidad de innovaciones realizadas para atraer a los
clientes a la compra de sus productos, impulsando así las ventas.
 De las previsiones se desprende un claro pico, con mejores ventas que el año
anterior. De ahí que los fabricantes deban asegurarse de que disponen de una
cantidad suficiente y superior a la del año anterior.
 La empresa puede aumentar sus ventas por encima de lo previsto si se centra
en la publicidad y en el lanzamiento de nuevos tipos de calzado.

28
 Con el lanzamiento de los nuevos zapatos pueden atraer a los clientes y
hacerles creer que tienen que comprarlos porque son únicos. Esto da a los
fabricantes la ventaja de ser los primeros.
 Esto garantizará un aumento de las ventas durante un tiempo y luego se
podrá tomar la decisión de dejar de fabricar los tipos de calzado que no sean
tan populares. Esto ayudará a ahorrar importantes recursos que pueden
utilizarse en otros ámbitos.
 Hay esperanzas de que el repunte interanual vuelva a ser máximo, porque el
calzado es un bien de primera necesidad y nunca perderá su importancia.

29

You might also like