You are on page 1of 6

Aplicación de las Redes Neuronales Artificiales de predicción en el

pronóstico de demanda en una empresa de panificación
Ing. Sandra Guadalupe Hernández Aguilar 1, Vicente Figueroa Fernández MC 2, Dr. José Antonio Vázquez López 3 y
Manuel Darío Hernández Ripalda MC 4
Resumen—En este artículo se presenta una aplicación de las redes neuronales artificiales (RNA´s) predictivas en una
empresa panificadora con el fin de pronosticar la demanda diaria de un producto específico. Se entrenó una RNA
utilizando una serie de tiempo generada a partir de la demanda histórica diaria del producto. Posteriormente se ajustaron
modelos estadísticos a la misma serie de tiempo con el fin de generar pronósticos con dichos modelos y compararlos con
los pronósticos obtenidos al utilizar la red neuronal artificial. El error cuadrático medio tanto de los modelos estadísticos
como de la RNA determinó la manera más eficiente de pronosticar la demanda del caso bajo estudio; se obtuvo que
aunque un modelo ARIMA obtuvo un mejor ajuste que la red, el desempeño predictivo de la RNA superó al modelo
ARIMA y a los otros modelos estadísticos comparados.
Palabras clave—Pronósticos, demanda, redes neuronales artificiales.

Introducción
La empresa panificadora bajo estudio fabrica una gran variedad de productos para un amplio mercado en su
región. Un tipo de producto en específico presenta un comportamiento de su demanda a lo largo del tiempo que no
resulta fácil predecir, por lo tanto para los responsables de esta tarea es complicada la toma de una serie de
decisiones acertadas y necesarias para la operación de la empresa. Este trabajo surge de la necesidad de proponer una
manera de pronosticar de forma eficiente la demanda del producto bajo estudio para evitar la mala planeación y
ciertos problemas que ésta origina; de manera que la propuesta ya mencionada representa la principal aportación de
este artículo.
De acuerdo con Escobar-Gómez et al. (2010) uno de los principales objetivos de las empresas es utilizar en
forma óptima los recursos para satisfacer las necesidades de los clientes. Estas necesidades se determinan a través de
proyecciones o pronósticos de la demanda, para lo cual normalmente se utilizan de series de tiempo.
De acuerdo con Box et al. (2008) una serie de tiempo es una secuencia de observaciones tomadas en orden
cronológico. Una de las aplicaciones más importantes de las series de tiempo es el pronóstico de los valores futuros
de ésta a partir de los valores actuales y pasados de la misma.
Para el problema general de pronóstico de series de tiempo existen diversas metodologías dentro de las cuales
destacan métodos que implican modelos estadísticos y algunas técnicas de inteligencia artificial específicamente las
redes neuronales artificiales (Medina Hurtado et al. 2011).
Algunos de los modelos estadísticos conocidos y utilizados para pronosticar demanda utilizando series de tiempo
son el promedio móvil, la suavización exponencial, el método Winters, los modelos autorregresivos (AR), modelos
de medias móviles (MA), la integración de modelos AR con modelos MA (ARMA), así como los modelos
autorregresivos integrados de promedios móviles (ARIMA).
El uso de cada modelo dependerá de la serie de tiempo; de acuerdo con Chase et al. (2009) cuando la demanda no
crece ni decrece con rapidez y tampoco tiene características estacionales, un modelo de promedio móvil puede ser
útil para eliminar fluctuaciones aleatorias del pronóstico. Es importante seleccionar el mejor periodo para el
promedio móvil. Cuanto más largo sea el periodo, más se uniformarán los elementos aleatorios. Si existe una
tendencia en los datos, el promedio móvil tiene la característica adversa de retrasar la tendencia. Por tanto, aunque un

1

La Ing. Industrial Sandra Guadalupe Hernández Aguilar es estudiante de Maestría en Ingeniería Industrial en el Instituto
Tecnológico de Celaya, Guanajuato. sandraghaguilar@hotmail.com
2

Vicente Figueroa Fernández MC es profesor investigador de Ingeniería Industrial en el Instituto Tecnológico de Celaya,
Guanajuato. vicente.figueroa@itcelaya.edu.mx
3

El Dr. José Antonio Vázquez López es profesor investigador de Ingeniería Industrial en el Instituto Tecnológico de Celaya,
Guanajuato. antonio.vazquez@itcelaya.edu.mx
4

M.C. Manuel Darío Hernández Ripalda es profesor investigador de Ingeniería Industrial en el Instituto Tecnológico de Celaya,
Guanajuato. dario.hernandez@itcelaya.edu.mx

Mena O´Meara et al. la estimación de muchos tipos de modelos de series temporales requieren la intervención y supervisión humana. (2004) una característica de las RNA´s que las hacen especialmente interesantes en su aplicación a la previsión de series temporales es su capacidad de aproximar prácticamente cualquier función incluso las no lineales. Por lo tanto un modelo no lineal sería más preciso que uno lineal (por ejemplo el ARIMA) a la hora de hacer predicciones.q) dónde p es el número de parámetros autorregresivos. (2004) algunos métodos estadísticos de series de tiempo tienen limitaciones debidas a la forma en que los modelos son estimados. el pronóstico con RNA´s puede ser automatizado y no es necesario revisar los modelos puesto que las redes aprenden de forma incremental. factor cíclico. por esta razón. Puede también hacerse pronósticos con la metodología de los modelos ARIMA. En muchos casos reales. Ponce Cruz (2010) menciona una clasificación de las RNA´s de acuerdo con su uso que pueden ser para clasificación. De acuerdo con Jiménez at al. (2006) varias investigaciones para determinar el pronóstico de demanda tratan este problema empleando métodos estadísticos como los ya mencionados. De acuerdo con Mena O´Meara et al. (2009) menciona que distintos estudios han señalado que las series de demanda poseen comportamientos no lineales. .periodo más corto produce más oscilación. Cuando esto ocurre la suavización exponencial es un modelo lógico y aceptable para pronóstico. (2006) una alternativa al analizar series de tiempo es el método de descomposición. predicción o reconocimiento de patrones. el pronóstico de demanda es muy incierto debido a la influencia de agentes internos y externos en el comportamiento de la misma. Medina Hurtado et al. (2006) una desventaja de los modelos ARIMA es que necesitan un elevado número de observaciones además de que la estimación e interpretación de sus coeficientes es compleja y no proporciona resultados buenos a largo plazo. Sin embargo. Ya que las series de tiempo son el resultado de la integración de esos cuatro elementos. y q es el número de parámetros de medias móviles. Las RNA´s buscan emular el funcionamiento de las redes neuronales de los seres vivos respecto a su esquema de conexión así como la transmisión y el almacenamiento de información. De acuerdo con Pino Diez et al. De acuerdo con Pino Diez et al.d. Una de las redes neuronales utilizada para predicción es la perceptrón multicapa que se muestra en la figura 1. las observaciones más recientes de las series de tiempo son más indicativas del futuro que aquellas en el pasado más distante. En este caso se suele considerar que la serie se descompone en todos o algunos de los siguientes componentes: tendencia. un periodo más largo da una respuesta más uniforme pero retrasa la tendencia. la mayoría de modelos estadísticos deben ser reestimados periódicamente cuando se dispone de nuevos datos. Esquema del perceptrón multicapa. Figura 1. este método resulta aceptable. de modo aditivo (las fluctuaciones no se ven afectadas por la tendencia) o de modo multiplicativo (las fluctuaciones varían con la tendencia) cuando una serie sigue un esquema multiplicativo y presenta estacionalidad. Por el contrario. existe un seguimiento cercano de la tendencia. la cual parte del hecho de que la serie temporal que se trata de predecir es generada por un proceso estocástico cuya naturaleza puede ser caracterizada mediante un modelo. d es el número de diferenciaciones para que la serie se estacionaria. La notación de estos modelos es ARIMA (p. estacionalidad y aleatoriedad. De acuerdo con Jiménez et al. Por su parte Velásquez et al. En los modelos ARIMA se explica el comportamiento de una serie temporal a partir de las observaciones pasadas (AR) y de los errores pasados de previsión (MA). (2006) mencionan que recientemente las RNA´s se están aplicando en el pronóstico de demanda por su funcionamiento prometedor en áreas de reconocimiento. (2011). Por el contrario. Además.

c son los parámetros del modelo que se ajustan mediante el algoritmo de entrenamiento. mismos que se analizan y comentan en la tercera sección.La explicación y representación matemática de la figura 1. la descripción del método es la segunda sección. Tabla1. De acuerdo con Medina Hurtado et al. la cual puede ser lineal o no lineal y determina la forma en que se relacionan las entradas al modelo con la salida. donde n es el número de entradas al modelo y m es el número de neuronas en la capa oculta de la red. Finalmente en la sección de conclusiones se mencionan puntos relevantes obtenidos con el análisis comparativo realizado. Descripción del Método Los datos con que se elaboró este estudio corresponden a la demanda diaria del producto bajo estudio que van desde enero de 2012 hasta diciembre de 2013. adicionalmente se cuenta con información de un mes de 30 días del año 2014.wij. Son (n+1)(m+1) parámetros a ajustar.diciembre de 2013. 2016 1897 1605 1611 2238 1516 2294 1979 1732 1609 2239 1447 2131 1961 1817 1665 2320 1474 2203 2037 1769 1675 2295 1439 1628 2544 2438 2151 2073 2736 1667 2459 2287 1810 1762 2463 1543 2339 2154 1752 1772 2504 1407 2166 2099 1642 1657 2269 2195 1107 2444 2116 1764 1408 2159 1367 2220 2270 1776 1740 1634 2190 2267 1834 1801 2529 1694 2399 2255 2003 1560 2023 1258 2158 2061 1694 1591 2242 1351 2098 2176 1743 1468 2027 1463 2236 2023 1676 1552 2158 1340 2126 2026 1658 1559 2160 2012 1993 1318 2063 1954 1643 1661 2293 1506 2228 2142 1741 1563 2202 1361 2169 2007 1698 1556 2302 1516 2283 2111 1707 1539 1498 2233 1392 2125 2020 1669 1603 2132 1358 2152 2018 1585 1533 2183 1383 2377 2160 1667 1750 2490 1653 2339 2174 1848 1696 1613 2135 1379 2144 1931 1608 1503 2115 1310 2161 1927 1611 1543 2093 1389 2162 1993 1753 1604 2187 1379 2166 1995 1964 1499 1470 1991 1436 2106 1814 3413 4197 4176 4700 4634 4608 3695 4327 4532 4847 4679 5259 2805 4957 4985 5425 5475 5006 5183 5277 5041 4538 4167 4409 4801 5217 5614 4554 4836 4137 4431 4405 5066 4831 5114 5060 4898 3531 4976 5548 4997 5390 4616 4755 5323 5843 7097 5074 5667 5755 5250 5923 7446 4841 4133 4258 4222 4521 5878 4102 5774 5578 6164 6046 5047 6408 5019 5715 5223 5933 5469 5755 4497 5021 5235 5168 5247 5400 4324 5014 4741 4931 4796 5164 4163 5148 4799 5065 5040 5071 5368 4298 4050 5396 4704 4676 3649 4470 4651 4978 4997 4987 3561 4232 4241 5192 4667 4238 3298 3665 3256 3665 3592 4010 3988 3456 3884 3895 4424 3868 4256 3276 3767 3736 4148 4200 4182 3280 3716 3563 3525 4174 3916 3364 3790 3873 4238 2013 4239 4034 4184 3254 3904 3779 3970 4057 4140 3524 4258 3965 4279 4344 4294 3442 4027 3821 4139 4153 4320 3633 4425 4483 4589 4891 4504 4812 3752 4381 4167 4552 4447 4476 3590 4412 4240 4617 4455 4627 3651 4535 4429 4898 4677 5034 3935 3043 3713 4358 3556 4287 4167 3703 4062 4560 3572 3221 4307 3914 3456 3823 5635 5229 5425 3712 4625 3880 3960 3910 3782 2942 1290 1554 1589 1689 1587 1985 1508 1689 1701 1802 1576 1914 1554 1630 1757 1653 1939 2054 1685 1819 1659 1803 1800 2292 4795 3526 4512 3820 4143 4543 4853 3678 4317 4474 4563 2943 3251 2180 2799 2852 1962 2428 2249 2036 1989 2729 1798 2650 . las unidades en las que se mide la demanda diaria son piezas tabla 1. se indica en la siguiente ecuación: ? ? ? = ∑ ?? ∙ ?? (∑ ??? ?? + ?? ) + ? ?=1 ?=1 dónde: y: es la variable pronosticada xi: es la i-ésima variable de entrada wj: son los pesos que conectan la j-ésima salida de la capa oculta a la capa de salida wij: son los pesos que conectan la i-ésima entrada al modelo con la j-ésima neurona de la capa oculta bj: son los sesgos (bias) o intercepto de las j-ésima neurona oculta c: es el sesgo (bias) o intercepto de la neurona de salida Wj. En el segundo apartado se describen las consideraciones así como el método que se llevó a cabo para llegar a los resultados obtenidos. así como posibles futuras investigaciones derivadas de este análisis. En la primera sección se muestra un planteamiento general del problema así como conceptos generales necesarios para el desarrollo del artículo. la tercera está comprendida por los comentarios finales y por último las conclusiones representan el cuarto apartado. Este artículo está dividido en cuatro secciones. (2011) al interpretar esta ecuación el modelo resulta ser una regresión caracterizada por la función f. Demanda diaria del producto bajo estudio enero 2012. la primera de estas es la introducción.bi.

El entrenamiento de la red fue realizado con el algoritmo Levenberg Marquardt. Figura 2. Posteriormente se procedió a la construcción de modelos estadísticos haciendo uso de la serie de tiempo con la que se cuenta. Una vez que se determinaron los modelos y se calculó el ajuste de cada uno. En la figura 2 se muestra el comportamiento de dos años de la demanda del producto bajo estudio. Velásquez et al. Una vez que se entrenó la RNA se procedió a generar pronósticos con la misma. Con ayuda del toolbox de Redes Neuronales en Matlab una RNA perceptrón multicapa fue entrenada con los datos de la serie de tiempo. Serie de tiempo de la demanda diaria del producto bajo estudio. Con ayuda de los softwares estadísticos R y Minitab se obtuvo el ajuste de modelos de promedio móvil. suavización exponencial simple. una neurona en la capa de salida y la función de transferencia utilizada fue la tangente sigmoidal.diciembre 2013 que contiene la tabla 1. Winters y ARIMA. Cabe mencionar que en el eje horizontal no hay 730 días correspondientes a dos años debido a que los días domingo son no laborables por lo tanto no existe demanda del bien. la cantidad de neuronas en la capa oculta de la red fue 20.2242 2074 1782 1884 2575 1679 1992 2272 1722 1903 2410 1519 2201 2043 1807 1922 2534 1628 1264 2350 1903 1689 1714 2026 1705 1638 1697 2227 1581 2583 2398 1674 1860 1348 1946 1954 1651 1567 2146 1406 2157 2078 1600 1472 2042 1398 2239 2115 1710 1656 2377 1474 2274 2060 1636 1618 2245 1335 2044 2002 1608 1458 2104 1297 2100 1944 1625 1524 2055 1371 2174 1881 1682 1565 2092 1458 2206 5519 4751 5610 4824 5057 4718 5410 4565 4973 4377 4499 4806 4634 4897 5297 4785 5573 5120 6118 5581 5588 4331 6612 5419 5703 5444 6037 5997 5337 4204 4762 4522 4818 4526 5443 4094 4614 4411 4967 3911 3235 3658 3905 4279 3989 3064 2521 4009 3388 4002 3867 4025 3149 3672 3503 3989 3830 3914 3125 3829 3706 4873 5156 5240 3835 4391 4230 4551 4767 4808 3786 4559 4115 5140 4625 5007 3632 3785 4238 3565 4316 4151 4275 2194 2584 2923 2430 1942 1677 1877 2104 1882 1771 1939 2709 3545 3571 3828 3661 4816 3396 4233 4060 4280 4930 1876 2193 2398 1898 2233 1972 Se comenzó por generar una serie de tiempo con los datos de demanda de enero 2012. De manera que con la comparación del modelo ARIMA y la RNA se constataría si efectivamente un modelo no lineal (RNA) es más preciso que un modelo lineal (ARIMA) para hacer predicciones en este caso estudiado. (2009) menciona que distintos estudios han señalado que las series de demanda poseen comportamientos no lineales. Los primeros tres mencionados se consideraron en la comparación debido a que son los modelos normalmente utilizados actualmente en la empresa para hacer pronósticos. Los mejores modelos ARIMA encontrados se obtuvieron con una búsqueda iterativa que se inició con información de los correlogramas de la serie para el grado autorregresivo y de medias móviles. también se generaron pronósticos con estos modelos obteniendo el MSE tanto de ajuste como de pronóstico. Esta serie fue graficada con la finalidad de observar el comportamiento de la demanda y se muestra en la figura 2. para conocer la capacidad de predicción de la RNA se compararon los pronósticos obtenidos con la red contra los datos de la demanda real de los primeros 30 días del año 2014. Es ésta la razón por la cual los modelos ARIMA entran en el presente estudio comparativo. Se calculó el error cuadrático medio tanto del ajuste como de pronóstico. .

689.3534 (α óptima) y arroja un MSE de 263.2) 174.849.32 ARIMA (15.1.617. la tabla 2 muestra que la red tuvo menor error cuadrático medio que los primeros 5 modelos ARIMA mientras que los últimos 4 tienen mejor ajuste que la RNA. La red mostró un buen ajuste en relación al resto de los modelos construidos y comparados.872.05 En la tabla 2 se aprecia que al considerar el ajuste de los modelos a la serie de tiempo de la demanda se tiene que de los modelos de promedio móvil el mejor es el de longitud 6. únicamente fue mejorada en ajuste por modelos ARIMA de alto grado autorregresivo.057.2) 200896.297.218.1.80 Winters aditivo-longitud 6 0.085.1.2) 170.462. Comentarios Finales Resumen de resultados La idea central del presente artículo que consistió en la comparación del desempeño predictivo de la red neuronal con los diferentes modelos estadísticos probados en el ajuste y utilizados también para pronóstico se muestra en la tabla 2. Conclusiones Después del desarrollo y aplicación de las redes neuronales artificiales puede concluirse que éstas son un medio más eficiente de pronóstico de demanda que los utilizados actualmente en la empresa panificadora bajo estudio.887.312.454.00 7. Tabla 2.1.00 10.98 ARIMA (27.686. De los modelos Winters construidos haciendo variar los parámetros de nivel.588.845.00 6.Finalmente se realizó la comparación del desempeño de la RNA con los modelos estadísticos mencionados haciendo uso del error cuadrático medio de ajuste y predicción.3534 263.2) 185.40 ARIMA (27.85 ARIMA (5.20 ARIMA (10.2) 202. Los mejores ajustes se obtuvieron con modelos ARIMA y con la RNA.00 8. Se utiliza el MSE como medida de comparación.177.2 284.0.0.678. En la tabla 1 se muestran los modelos ARIMA más representativos (y con mejor ajuste) de todos los que se construyeron con grados de autorregresiones y medias móviles similares. en éstos últimos cuatro modelos aumenta significativamente el grado autorregresivo del mismo.2 236.720.632.61 Winters aditivo-longitud 6 0.347.085. sin embargo el error en los pronósticos en la mayoría de los casos es más relevante.828. se muestran en la tabla únicamente los dos y el mejor ajuste de estos dos genera un MSE de 229. MODELO MSE (Ajuste) MSE (Pronóstico) Promedio móvil-longitud 4 273.3) 174. Por lo tanto al considerarse el error en el pronóstico la tabla 2 muestra que la RNA presentó mejores resultados predictivos aun comparándola con el modelo ARIMA de menor error de ajuste que la red.391.147.90 Suavización exponencial α = 0.068.860.358.242.87 7.2.86 Promedio móvil-longitud 6 260. Error cuadrático medio de los modelos construidos. Comparando específicamente modelos ARIMA y la RNA.27 Suavización exponencial α = 0.30 3.152.38 5.00 6.1.929.705.020.3 229.2) 174.00 6.42 5.797.540.1.0.18 ARIMA (6. El grado de ajuste de los modelos a la serie de tiempo de la demanda resulta importante.91 RNA 181.687.2) 189.349.104.152.15 7.30 ARIMA (48.1.608.91 7.48 Promedio móvil-longitud 5 283.666.3.777.80 7.1.570.0.526. tendencia y estacionalidad.656.849.678.462.44 5. Respecto a la capacidad predictiva se mostró mejor la RNA por encima de cualquier modelo ARIMA altamente regresivo con muy buen ajuste. .90 ARIMA (2.2. sin embargo estos modelos resultan altamente complejos debido a la cantidad de parámetros necesarios en los mismos que no cumplen el principio de parsimonia.720.814.3.36 7.00 7. Esto para determinar el método más eficiente para pronosticar la demanda diaria del producto bajo estudio.1.65 ARIMA (25. mientras que el modelo de suavización exponencial que mejor se ajusta es el modelo en el que se utiliza un α = 0.590.075.562.85 5.2) 239.

. G.F. Díaz-Núñez . & Alonso García. EUA: John Wiley & Sons. G.. D. 98-107. Antioquia (59).. New Jersey. (Septiembre de 2006). resulta más preciso hacer predicciones con un modelo no lineal como lo son las RNA´s que con modelos lineales como ARIMA. C.. F. Planificación de la demanda en la gestión de cadena de suministros con redes neuronales y lógica difusa. ADMINISTRACIÓN DE OPERACIONES Producción y cadena de suministros. (2004). J. Gázquez Abad.. E. Ingeniería Investigación y Tecnología . G. 289-302. (2010). J. J. P. J. (2010). . Modelo para el ajuste de pronósticos agregados utilizando lógica difusa. & Aquilano . & Reinsel. L. Un modelo no lineal para la predicción de la demanda mensual de electricidad en Colombia.Con el desarrollo del artículo es posible mostrar el porqué del interés actual en la utilización de las RNA´s en un sin número de aplicaciones. específicamente en la previsión de demanda. J. (2009). Pino Diez. N. Inteligencia Artificial (1 ed. & Taracena-Sanz .. F. (2009).. 10(2). ESTUDIOS GERENCIALES. 185-198. Lario Esteban. Moreno Cadavil. Jacobs . 25 (112). Por otra parte el uso de las redes neuronales en la predicción de demanda tiene la ventaja sobre modelos estadísticos de que para pronosticar con estos últimos es necesario un previo análisis de la serie de tiempo por parte de un experto para una elección correcta del modelo (y los parámetros) que generé buen ajuste y pronóstico.. el pronóstico con RNA´s puede ser automatizado y no es necesario revisar los modelos puesto que las redes aprenden de forma incremental (Pino Diez et al. (2006). C. D. H. J. (2008). N. México: Alfaomega. Jenkins. Referencias Velásquez. X Congreso de Ingeniería de Organización. Univ.... J. C. Además. Pronóstico de la demanda de energía eléctrica horaria en Colombia mediante redes neuronales artificiales. R. De la Fuente García. & Gallego Valencia. N. Escobar-Gómez. Aplicación de redes neuronales artificiales al cálculo de previsiones a corto plazo en el mercado eléctrico español. México: Mc Graw Hill. Parreño Fernández . Box. 37-54. Por el contrario. & Vicens Salort. F. A. Debido a la naturaleza de la demanda y a los componentes no lineales que la misma puede presentar. La capacidad predictiva en los métodos Box-Jenkis y HoltWinters: una aplicación al sector turismo. S. Investigaciones Europeas de Dirección y Economía de la Empresa. B.. Jaime Franco. pues se aprovecha el especial desempeño en predictivo de series de tiempo con comportamientos no lineales. Rev. Chase . F.). Inc. Jiménez Guerrero. 221-232. (Junio de 2011).. Ponce Cruz. Fac. & Priore. Revista Europea de Dirección y Economía de la Empresa. Mena O´Meara. Medina Hurtado.. P. R.). XI(3). & Sánchez Fernández. J. R. 2004). M. Time Series Analysis Forecasting and Control (4 ed. J. E. 15(3). P. la mayoría de modelos estadísticos deben ser reestimados periódicamente cuando se dispone de nuevos datos. E. Es esta la razón por la que se recurre a las RNA´s... D... R. Ing.