You are on page 1of 11

Modelado de la entrada

Introduccin Recogida de datos Referencias

Lenguajes de simulacin

2006-2007

Introduccin (I)
La simulacin orientada a eventos discretos utiliza variables aleatorias, por ejemplo: Tiempos entre llegadas Tiempos de servicios Para poder crear un modelo de ordenador, se necesita: Medir los datos en el sistema real Identificar la distribucin a la que se aproximan esos datos Utilizar la funcin de distribucin correspondiente en el programa de simulacin Este procedimientos es lo que se conoce como anlisis de los datos de entrada

Lenguajes de simulacin

2006-2007

Introduccin (II)
Mundo real Proceso o fenmeno Proceso del mundo real Valoracin de la validez

Muestreo Modelado de la entrada de la simulacin Modelo de simulacin Modelo de entradas aleatorias Programacin de las variables aleatorias Programa de simulacin Generador de var. aleatorias Estrategia del modelado Modelo de la entrada Valoracin de si es razonable Recursos disponibles Experiencia anterior Teora Datos

El papel de las distribuciones de entrada


Lenguajes de simulacin

Modelando las entradas


Fuente: Handbook of simulation (1998) 2006-2007

Introduccin (III)
El hecho de que se conozca tanto sobre los diferentes tipos de procesos de Poisson se debe a que su estudio es tratable matemticamente, lo que no ocurre con otros datos. El uso de los procesos de Poisson para modelar las llegadas a un sistema se justifica con la base de las siguientes suposiciones: 1. Las llegadas se producen una cada vez. 2. El nmero de llegadas que se produce en un intervalo de tiempo que empieza en t es independiente de las que se hayan producido en cualquier instante antes de t. 3. La distribucin del nmero de llegadas tampoco depende de t.

Lenguajes de simulacin

2006-2007

Etapas del proceso


La obtencin de las distribuciones apropiadas para un modelo de simulacin es una de las tareas fundamentales desde el punto de vista de tiempo y recursos. Para obtener un modelo adecuado de los datos de entrada los pasos a seguir son: 1. Recoger datos del sistema real en el que se est interesado. A veces esto requiere un tiempo y esfuerzo substanciales. Cuando no existen datos disponibles, se pueden utilizar el conocimiento del proceso y la opinin de los expertos. 2. Identificar una distribucin de probabilidad que represente la entrada al proceso. A veces pueden existir varias distribuciones candidatas. 3. Elegir los parmetros que determinan un caso concreto de la familia de distribuciones. Si hay datos disponibles, los parmetros se deben estimar a partir de ellos. 4. Evaluar la bondad de ajuste de la distribucin elegida y los parmetros asociados. Si el ajuste no es bueno, se debe seleccionar otra distribucin (paso 2)
Lenguajes de simulacin 2006-2007

Recogida de datos
La recogida de datos es una de las tareas ms importantes cuando se aborda la solucin de un problema real y es uno de los problemas ms importantes en el caso de la simulacin. Existen muchas dificultades en la recogida de datos: Comprender la estructura del sistema Determinar cundo se han recogido suficientes datos Impedir la censura de datos Detectar interdependencias Detectar autocorrelacin

Lenguajes de simulacin

2006-2007

Recogida de datos
Cuando se utilizan datos recogidos previamente se pueden plantear un serie de situaciones molestas:
Los datos pueden haberse guardado en un orden distinto al de su observacin, lo que impide la comprobacin de suposiciones importantes, por ejemplo la autocorrelacin. Los datos pueden estar agrupados en intervalos (histogramas). Los datos se pueden haber registrado con un nivel de precisin insuficiente. Las muestras consideradas pueden contener valores errneos, al no haberse recogido con criterios de fiabilidad. Las tablas pueden contener valores de ms de un proceso, sin disponer de documentacin que permita su discriminacin. Por ejemplo, los tiempos de reparacin de una mquina pueden variar dependiendo del tipo de reparacin. Los valores de los datos pueden ser representativos de un proceso del mundo real diferente.
Fuente: Handbook of simulation (1998)

Lenguajes de simulacin

2006-2007

Recogida de datos
Cuando los datos se recogen especficamente para un estudio de simulacin, el Handbook of Simulation hace las siguientes sugerencias: Cuando sea posible, recoger entre 100 y 200 observaciones. Con menos datos la calidad del anlisis baja significativamente, mientras que un incremento de las mismas no tiene una repercusin significativa. Intentar registrar los datos reales con una o dos cifras decimales significativas, al menos para sus valores significativos como la media o la mediana. Cuando interesa obtener tiempos entre eventos registrar los instantes de los eventos y calcular posteriormente los intervalos. Si se sospecha que el comportamiento del mundo real depende de la hora o del da de la semana, recoger un nmero de datos significativos de diferentes periodos de tiempo.

Lenguajes de simulacin

2006-2007

Identificar la distribucin
El siguiente paso es adivinar el tipo de distribucin de los datos. Para ello hay que realizar dos pasos: Realizar una adecuada identificacin de la distribucin Comprobar la correccin de dicha identificacin Estoa dos pasos se consiguen: Dibujando un histograma de los datos Generando un dibujo de quantil-quantil

Lenguajes de simulacin

2006-2007

Distribuciones de frecuencia (histogramas)


Se puede utilizar una distribucin de frecuencia o histograma para identificar la forma de una distribucin. Un histograma se construye de la forma siguiente: 1. Se divide el rango de valores en intervalos (normalmente de igual anchura pero, en algunos casos, pueden ser de anchuras desiguales). 2. Etiquetar el eje horizontal con los intervalos seleccionados. 3. Encontrar la frecuencia de ocurrencias en cada intervalo. 4. Etiquetar el eje vertical con dichas frecuencias. 5. Dibujar las frecuencias sobre el eje vertical. El nmero de intervalos de clase depende del nmero de observaciones y de su dispersin. Algunos autores proporcionan la indicacin de seleccionar dicho nmero igual a la raz cuadrada del tamao de la muestra.
Lenguajes de simulacin 2006-2007

Distribuciones de frecuencia (ejemplos de histogramas)

Lenguajes de simulacin

2006-2007

Grficos cuantil-cuantil
Los grficos Q-Q prueban si el tipo de la distribucin es correcto Se utilizan cuando n < 30, cuando los histogramas son confusos Dada una variable aleatoria X con cdf F entonces es el q-cuantil de X :

F ( ) = F ( X ) = q

Los pasos para la generacin de un grfico cuantil-cuantil son: 1. Dados los datos xi medidos de la variable aleatoria X 2. Ordenar los xi para obtener yj con y1 y2 . . . yn 3. Dibujar yj frente a F1(( j ) / n) Si el grfico produce una lnea recta, entonces X es de tipo F Los parmetros son correctos si: la pendiente de la lnea es 1, la lnea pasa a travs del origen
Lenguajes de simulacin

2006-2007

Ejemplo de Grfico cuantil-cuantil

Lenguajes de simulacin

2006-2007

Ejemplo de Grfico cuantil-cuantil


Ordenar 100 tiempos de fallo yi para un componente mecnico: 0.30 1.21 0.88 3.02 1.45 . . . Dibujar un histograma utilizando k =10:

Se parece a una distribucin normal. Elegir una distribucin normal para F: F ~N (1.5, 0.7) Dibujar los valores yj frente a F-1((j - ) / n):

Lenguajes de simulacin

2006-2007

Ejemplo de Grfico cuantil-cuantil


Se intenta de nuevo eligiendo F como W (3.0, 3.0):

Se intenta de nuevo eligiendo F como W (2.0, 2.0):

Lenguajes de simulacin

2006-2007

Prueba de Chi-cuadrado
1. Divide los datos en k clases 2. Cuenta el nmero de elementos de datos observados Oi en cada clase i 3. Determina el nmero esperado de elementos de datos Ei en cada clase i de acuerdo con la distribucin considerada 4. Calcula el valor X 02 = (Oi Ei )
k i =1 2

Ei

5. Elige un nivel de significacin 6. Buscar en las tablas el valor X 2 , donde f=k-s-1 f , (s es el nmero de parmetros de la distribucin) 7. Si X 0 > X f , se rechaza la hiptesis de que los datos se ajuste a la distribucin considerada
2 2

Eleccin de k: si n < 20 50 < n < 100 n > 100


Lenguajes de simulacin

no utilizar esta prueba, k= n/10 n/5 k= n n/5

No hace falta que todas las clases tengan el mismo ancho, lo ideal es que tengan la misma probabilidad
2006-2007

Prueba de Chi-cuadrado. Ejemplo


Distribucin Weibull
2 Obtener el valor X 0 = 5,10 Elegir un = 0.01 Hacer f = k 1 s = 10 1 2 = 7 2 Buscar el valor X 7 , 0, 001 = 18,5

Por tanto, se acepta la hiptesis

Lenguajes de simulacin

2006-2007

Seleccin de modelos de entrada sin datos (I)


A veces es preciso desarrollar modelos de simulacin sin que existan datos disponibles. En este caso la eleccin de la distribucin adecuada ser fundamental. Existen algunas formas de obtener informacin sobre un proceso aunque no existan datos: 1.- Datos de ingeniera. Muchas veces un producto o un proceso tienen valores de prestaciones proporcionadas por el fabricante, por ejemplo, el tiempo medio para fallo de un disco es 10000 horas. Estos valores proporcionan un punto de partida para el modelado de la entrada fijando un punto central. 2.- Opinin de expertos. La gente con experiencia en el mismo proceso o procesos similares pueden proporcionar de gran valor. Por ejemplo, pueden aportar tiempos ms optimistas, pesimistas o ms probables. Pueden indicar si el proceso es prcticamente constante o fuertemente variable y muchas veces son capaces de indicar la fuente de variabilidad.

Lenguajes de simulacin

2006-2007

Seleccin de modelos de entrada sin datos (II)


3.- Limitaciones fsicas o de convenio. Muchos procesos reales tienen limitaciones fsicas o de prestaciones. Por ejemplo, la entrada de datos desde un teclado a un ordenador no puede ser ms rpida que la capacidad de teclear de una persona. A veces, las polticas de una empresa fijan lmites superiores a determinados valores. Existen lmites obvios que acortan el rango de los valores a considerar. 4.- La naturaleza del proceso. Existen determinadas distribuciones que se ajustan normalmente a determinados procesos. Muchas veces, cuando no hay datos, se utilizan las distribuciones uniforme, triangular o beta. La uniforme no suele ser una buena eleccin porque los lmites inferior y superior no son tan adecuados como los valores centrales en los procesos reales. Una mejora puede ser utilizar puntos de ruptura que son valores intermedios en los que se puede saber que la probabilidad debe ser menor o igual a un valor dado. En los casos en los que no hay datos es conveniente realizar una anlisis de sensibilidad de los resultados de la simulacin para la distribucin elegida
Lenguajes de simulacin 2006-2007

Informacin complementaria
A veces hay pistas obtenidas a partir de un anlisis estadstico de los datos que pueden facilitar la seleccin de la distribucin candidata. Por ejemplo: Si el coeficiente de variacin C est muy prximo a 1 una distribucin posible es la exponencial. Si se obtienen los valores de sesgo (skew) y kurtosis, los valores de ambos nos pueden permitir considerar las posibilidades de algunas distribuciones. El valor del sesgo es muy prximo a cero para datos simtricos y positivo o negativo si los datos estn sesgados hacia la derecha o la izquierda. El valor de kurtosis pequeo indica distribuciones muy centradas y los valores van creciendo a medida que se pierde esa tendencia central. Para una distribucin normal el sesgo es 0 y el valor de la kurtosis puede variar.

Lenguajes de simulacin

2006-2007

Referencias bibliogrficas

Banks, Carson, Nelson, Nicol. Discrete event system simulation Prentice-Hall (second edition) http://www.bcnn.net. El captulo 10 est dedicado modelado de la
entrada.

Law and Kelton. Simulation Modeling and Analysis. McGraw-Hill (second edition) http://www.mhhe.com/lawkelton. El captulo 6 se dedica a seleccin de distribuciones de
entrada.

En el Handbook of simulation hay un captulo dedicado a modelado de la entrada.

Lenguajes de simulacin

2006-2007

You might also like