You are on page 1of 16

Input Analyzer

Magíster Víctor Andrade Soto


Análisis de los Datos de entrada
• Un primer problema a resolver es si el modelado tendrá
entradas determinísticas o aleatorias.
• En la realidad lo más probable es que en términos de
producción muchos procesos mecanizados tengan
duraciones determinísticos, sin embargo, si existe
participación humana a través de operarios estos
procesos suelen ser aleatorios en su duración.
• Un modelo aleatorio siempre es un modelo correcto. Un
modelo determinístico suele ser un modelo incorrecto
dado que no existe variabilidad en el sistema.
Recopilación de datos
• La información suele tomarse de:
– Observación
– Entrevistas
– Data histórica
• Sin embargo a través de cualquiera de estas fuentes es
probable que los datos que se obtengan no sean
suficientes.
• Por ello se requiere mantener las siguientes pistas de
ayuda:
– Análisis de sensibilidad
– Correspondencia del detalle con la calidad de los datos
– Costo
– Basura que entra es basura que sale
Uso de datos
• Desde el punto de vista teórico, los datos recopilados
representan lo que pasó en el pasado y no lo que pasará
en el futuro.
• Puede que la cantidad de datos recopilados no sea
suficiente para soportar el análisis o para realizar un
buen ajuste.
• Arena cuenta con dos posibilidades:
– Leer los datos históricos: a través de ficheros texto, excel, acces
u otros
– Ajustar los datos a una o muchas distribuciones de frecuencia:
empleando el Input Analyzer que viene con Arena.
Input Analyzer
• Debemos colocar los datos históricos en un fichero de
texto con formato ASCII para que el software nos
proporcione parámetros válidos para la distribución de
frecuencia que estemos validando o para que nos
informe acerca de la mejor distribución a la que se
ajustan los datos.
• Existen 2 tipos de distribuciones: teóricas y empíricas.
• Asimismo cada una de ellas se divide en Continua y
Discreta.
• Luego veremos una lista de las distribuciones que Input
Analyzer utiliza. Entonces debemos
– Tener el archivo de texto
– Ajustar los datos
– Seleccionar la distribución a usar
– Copiar la expresión generada al modelo en Arena.
Los datos
• Generamos un conjunto de valores aleatorios que
supongan nuestra observación y los guardamos en un
fichero del block de notas con extensión dst (datos1.dst)
• Ejecute el input Analyzer. File-New. Aparece una hoja en
blanco.
• Ahora File – Data File – Use Existing y seleccione el
fichero datos1.dst.
• Aparecerá un histograma en la parte superior y un
resumen estadístico básico de los datos en la parte
inferior.
• Puede ajustar o maximizar el tamaño de la ventana.
• Hagamos click en el menú Fit(ajustar). Elijamos una
distribución más o menos apropiada al histograma
mostrado (usaré uniforme ya que los datos fueron
creados siguiendo esta distribución).
• Ahora muestra el ajuste (en este caso una línea recta
sobre las barras).
• Un fichero UNIFORM.OUT se ha creado en la carpeta
donde está el fichero.
• Muestra el resumen estadístico y la prueba de ajuste
(que se ven el el analizador) así como la distribución de
frecuencias de los datos.
• Muestra el error cuadrático encontrado en el ajuste que
en este caso es de 0.008 (cuanto más se acerque a 0 es
mejor) que indica un buen ajuste.
• La expresión exacta a usar en arena sería UNIF(3,13)
• Si planeamos utilizar una distribución teórica y
no tenemos ni la más remota idea de cual usar
podríamos ir a Fit-Fit All
• Ajusta todas las distribuciones aplicables a los
datos, calcula estadísticas de prueba de cada
una y presenta la distribución que tiene el menor
valor en el error cuadrático.
• Podemos ver el resumen de este valor para
todas las distribuciones posibles si vamos al
menú Window-Fit All Sumary.
• En el ejemplo planteado la mejor curva es Beta
(que es un tipo de uniforme) y la expresión a
pasar es: 3 + 10 * BETA(0.947, 1.23)
• La decisión acerca del empleo de una un otra
distribución puede no depender solamente del error
cuadrático. En el Resumen se muestran 2 pruebas
adicionales: Chi cuadrado y Kolgomorov – Smirnov.
• En ambos observamos el p-valor correspondiente que
siempre será un número entre 0 y 1.
• Es la probabilidad de obtener un conjunto de datos que
es más inconsistente con la distribución ajustada que el
conjunto de datos que tenemos si se asume que su
ajuste es la verdad. En este caso se busca que el
número sea alto (digamos superior a 0.1).
• Para el ejemplo proporcionado las tres pruebas
indicarían que lo correcto es usar un distribución de tipo
Beta, aunque una uniforme no es una mala elección.
• Por último podríamos ejecutar el modelo con las dos
expresiones para comparar si hay diferencias
significativas.
• Podemos restringir la elección a distribuciones con o sin
límites. La distribución triángulas tiene límites a ambos
lados mientras la normal no los posee.
• Podríamos usar cualquiera de ellas para representar
tiempos de proceso.
• Sin embargo una distribución normal con promedio
cercano a 0 puede devolvernos valores negativos y en
contextos donde dichos valores no tienen sentido Arena
los convierte en 0 por lo que la simulación podría no ser
válida.
• Es más fácil ajustar distribuciones con parámetros
conocidos. Por ejemplo los parámetros de la
exponencial son más fáciles de entender que los de 1
distribución de tipo beta.
• Sin embargo estas dudas deben ser guiadas por los
resultados obtenidos por el analizador de entradas.
Cuando no existen datos
• Dependeremos de suposiciones arbitrarias que
debemos tratar de dignificar de la mejor manera.
• Debemos tratar de obtener información que
represente características de funcionamiento del
sistema (por ejemplo falla entre el 12% y 15%
del tiempo, llega a producir entre 10 y 12 piezas
por hora).
• Para seleccionar la distribución adecuada en
ausencia de datos empíricos guíese de la
siguiente tabla.
Ejemplo de
Distribución Parámetros Características uso
Tiempo
entre
Exponencial Media Varianza Alta llegadas
Límite a la Tiempo para
izquierda fallas
Mínimo,
Moda, Simétrica o Tiempo de
Triangular Máximo Asimétrica actividad
Límite a ambos
lados
Todos los
valores Poco
igualmente conocimient
Mínimo, parecidos en o del
Uniforme Máximo probabilidad proceso
Límites a ambos
lados

You might also like