Professional Documents
Culture Documents
Lenguajes de simulacin
2006-2007
Introduccin (I)
La simulacin orientada a eventos discretos utiliza variables aleatorias, por ejemplo: Tiempos entre llegadas Tiempos de servicios Para poder crear un modelo de ordenador, se necesita: Medir los datos en el sistema real Identificar la distribucin a la que se aproximan esos datos Utilizar la funcin de distribucin correspondiente en el programa de simulacin Este procedimientos es lo que se conoce como anlisis de los datos de entrada
Lenguajes de simulacin
2006-2007
Introduccin (II)
Mundo real Proceso o fenmeno Proceso del mundo real Valoracin de la validez
Muestreo Modelado de la entrada de la simulacin Modelo de simulacin Modelo de entradas aleatorias Programacin de las variables aleatorias Programa de simulacin Generador de var. aleatorias Estrategia del modelado Modelo de la entrada Valoracin de si es razonable Recursos disponibles Experiencia anterior Teora Datos
Introduccin (III)
El hecho de que se conozca tanto sobre los diferentes tipos de procesos de Poisson se debe a que su estudio es tratable matemticamente, lo que no ocurre con otros datos. El uso de los procesos de Poisson para modelar las llegadas a un sistema se justifica con la base de las siguientes suposiciones: 1. Las llegadas se producen una cada vez. 2. El nmero de llegadas que se produce en un intervalo de tiempo que empieza en t es independiente de las que se hayan producido en cualquier instante antes de t. 3. La distribucin del nmero de llegadas tampoco depende de t.
Lenguajes de simulacin
2006-2007
Recogida de datos
La recogida de datos es una de las tareas ms importantes cuando se aborda la solucin de un problema real y es uno de los problemas ms importantes en el caso de la simulacin. Existen muchas dificultades en la recogida de datos: Comprender la estructura del sistema Determinar cundo se han recogido suficientes datos Impedir la censura de datos Detectar interdependencias Detectar autocorrelacin
Lenguajes de simulacin
2006-2007
Recogida de datos
Cuando se utilizan datos recogidos previamente se pueden plantear un serie de situaciones molestas:
Los datos pueden haberse guardado en un orden distinto al de su observacin, lo que impide la comprobacin de suposiciones importantes, por ejemplo la autocorrelacin. Los datos pueden estar agrupados en intervalos (histogramas). Los datos se pueden haber registrado con un nivel de precisin insuficiente. Las muestras consideradas pueden contener valores errneos, al no haberse recogido con criterios de fiabilidad. Las tablas pueden contener valores de ms de un proceso, sin disponer de documentacin que permita su discriminacin. Por ejemplo, los tiempos de reparacin de una mquina pueden variar dependiendo del tipo de reparacin. Los valores de los datos pueden ser representativos de un proceso del mundo real diferente.
Fuente: Handbook of simulation (1998)
Lenguajes de simulacin
2006-2007
Recogida de datos
Cuando los datos se recogen especficamente para un estudio de simulacin, el Handbook of Simulation hace las siguientes sugerencias: Cuando sea posible, recoger entre 100 y 200 observaciones. Con menos datos la calidad del anlisis baja significativamente, mientras que un incremento de las mismas no tiene una repercusin significativa. Intentar registrar los datos reales con una o dos cifras decimales significativas, al menos para sus valores significativos como la media o la mediana. Cuando interesa obtener tiempos entre eventos registrar los instantes de los eventos y calcular posteriormente los intervalos. Si se sospecha que el comportamiento del mundo real depende de la hora o del da de la semana, recoger un nmero de datos significativos de diferentes periodos de tiempo.
Lenguajes de simulacin
2006-2007
Identificar la distribucin
El siguiente paso es adivinar el tipo de distribucin de los datos. Para ello hay que realizar dos pasos: Realizar una adecuada identificacin de la distribucin Comprobar la correccin de dicha identificacin Estoa dos pasos se consiguen: Dibujando un histograma de los datos Generando un dibujo de quantil-quantil
Lenguajes de simulacin
2006-2007
Lenguajes de simulacin
2006-2007
Grficos cuantil-cuantil
Los grficos Q-Q prueban si el tipo de la distribucin es correcto Se utilizan cuando n < 30, cuando los histogramas son confusos Dada una variable aleatoria X con cdf F entonces es el q-cuantil de X :
F ( ) = F ( X ) = q
Los pasos para la generacin de un grfico cuantil-cuantil son: 1. Dados los datos xi medidos de la variable aleatoria X 2. Ordenar los xi para obtener yj con y1 y2 . . . yn 3. Dibujar yj frente a F1(( j ) / n) Si el grfico produce una lnea recta, entonces X es de tipo F Los parmetros son correctos si: la pendiente de la lnea es 1, la lnea pasa a travs del origen
Lenguajes de simulacin
2006-2007
Lenguajes de simulacin
2006-2007
Se parece a una distribucin normal. Elegir una distribucin normal para F: F ~N (1.5, 0.7) Dibujar los valores yj frente a F-1((j - ) / n):
Lenguajes de simulacin
2006-2007
Lenguajes de simulacin
2006-2007
Prueba de Chi-cuadrado
1. Divide los datos en k clases 2. Cuenta el nmero de elementos de datos observados Oi en cada clase i 3. Determina el nmero esperado de elementos de datos Ei en cada clase i de acuerdo con la distribucin considerada 4. Calcula el valor X 02 = (Oi Ei )
k i =1 2
Ei
5. Elige un nivel de significacin 6. Buscar en las tablas el valor X 2 , donde f=k-s-1 f , (s es el nmero de parmetros de la distribucin) 7. Si X 0 > X f , se rechaza la hiptesis de que los datos se ajuste a la distribucin considerada
2 2
No hace falta que todas las clases tengan el mismo ancho, lo ideal es que tengan la misma probabilidad
2006-2007
Lenguajes de simulacin
2006-2007
Lenguajes de simulacin
2006-2007
Informacin complementaria
A veces hay pistas obtenidas a partir de un anlisis estadstico de los datos que pueden facilitar la seleccin de la distribucin candidata. Por ejemplo: Si el coeficiente de variacin C est muy prximo a 1 una distribucin posible es la exponencial. Si se obtienen los valores de sesgo (skew) y kurtosis, los valores de ambos nos pueden permitir considerar las posibilidades de algunas distribuciones. El valor del sesgo es muy prximo a cero para datos simtricos y positivo o negativo si los datos estn sesgados hacia la derecha o la izquierda. El valor de kurtosis pequeo indica distribuciones muy centradas y los valores van creciendo a medida que se pierde esa tendencia central. Para una distribucin normal el sesgo es 0 y el valor de la kurtosis puede variar.
Lenguajes de simulacin
2006-2007
Referencias bibliogrficas
Banks, Carson, Nelson, Nicol. Discrete event system simulation Prentice-Hall (second edition) http://www.bcnn.net. El captulo 10 est dedicado modelado de la
entrada.
Law and Kelton. Simulation Modeling and Analysis. McGraw-Hill (second edition) http://www.mhhe.com/lawkelton. El captulo 6 se dedica a seleccin de distribuciones de
entrada.
Lenguajes de simulacin
2006-2007