FACULTAD DE INGENIERA EN SISTEMAS, ELECTRNICA E INDUSTRIAL
PERODO ACADMICO: SEPTIEMBRE/2013 FEBRERO/2014
FORMATO DE TRABAJO FINAL
I. PORTADA
UNIVERSIDAD TCNICA DE AMBATO Facultad de Ingeniera en Sistemas, Electrnica e Industrial
Ttulo: Distribuciones de Probabilidad Continuas con Prueba Ks y JB (Para la distribucin normal) Carrera: Ingeniera en Sistemas Computacionales e Informticos rea Acadmica: Ciencias Bsicas y Aplicadas Lnea de Investigacin: Aplicacin Informtica Ciclo Acadmico y Paralelo: 5to A Alumnos participantes: Chimbo Veronica Gonzalez Christian Landa Patricio Mdulo y Docente: Modelos y Simulacin Ing. Zurita Pal
II. INFORME DEL PROYECTO 1. PP 2. YY 2.1 Ttulo
Distribuciones de Probabilidad Continuas con Prueba Ks y JB (Para la distribucin normal).
2.2 Objetivos
Conocer las distribuciones continuas y los parmetros necesarios que debe tener para poder determinar si un conjunto de datos siguen o no una distribucin propuesta aplicando las pruebas de bondad de ajuste.
2.3 Resumen
En el presente informe se explica detalladamente la finalidad de aplicar las distribuciones de probabilidad continuas para un grupo de datos, para esto se ha realizado varios ejercicios con cada una de las distribuciones continuas aplicando las pruebas de Kolmogrov - Smirnov (KS) de tal manera que podemos tener una idea clara y precisa del modelo matemtico que se aplican en el proceso de estos ejercicios, con los cuales se aplicado un grupo de 750 datos para cada distribucin, y de esta manera tener una idea clara de que distribucin continua se ajusta mejor al grupo de datos. Tambin tenemos la aplicacin de la prueba de y Jarque Bera (JB).Es una prueba de bondad de ajuste para verificar si un conjunto de datos se ajustan a una distribucin normal. Una vez que hemos obtenido el resultado de las pruebas, procedemos a realizar las grficas de las UNIVERSIDAD TCNICA DE AMBATO FACULTAD DE INGENIERA EN SISTEMAS, ELECTRNICA E INDUSTRIAL PERODO ACADMICO: SEPTIEMBRE/2013 FEBRERO/2014
distribuciones correspondientes y tendremos una idea visual de que distribucin se ajusta mejor. 2.4 Palabras clave:
Procedimiento: Mtodo o modo de tramitar o ejecutar una cosa. Distribucin: La distribucin de probabilidad es una funcin que asigna a cada suceso definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra. Variable: Es una caracterstica que al ser medida en diferentes individuos es susceptible de adoptar diferentes valores.
2.5 Introduccin
Una distribucin de probabilidad es continua cuando los resultados posibles del experimento son obtenidos de variables aleatorias continuas, es decir, de variables cuantitativas que pueden tomar cualquier valor, y que resultan principalmente del proceso de medicin. Ejemplos de variables aleatorias continuas son: La estatura de un grupo de personas El tiempo dedicado a estudiar La temperatura en una ciudad
PRUEBAS DE BONDAD DE AJUSTE Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos disponibles se ajustan a una determinada distribucin. Se entiende por bondad de ajuste a la asimilacin de los datos observados de una variable a una funcin matemtica previamente establecida y reconocida. A travs de sta es posible entonces predecir el comportamiento de la variable en estudio. Entre las pruebas de bondad de ajuste ms conocidas, cabe mencionar las siguientes: Prueba de Chi Cuadrado Prueba de Kolmogorov Smirnov Prueba de Anderson Darling. Prueba de Kolmogrov-Smirnov UNIVERSIDAD TCNICA DE AMBATO FACULTAD DE INGENIERA EN SISTEMAS, ELECTRNICA E INDUSTRIAL PERODO ACADMICO: SEPTIEMBRE/2013 FEBRERO/2014
La prueba de Kolmogrov-Smirnov (tambin prueba K-S) es una prueba no paramtrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre s. El estadstico Kolmogorov-Smirnov, D, considera la desviacin de la funcin de distribucin de probabilidades de la muestra P(x) de la funcin de probabilidades terica, escogida Po(x) tal que: Dn = max | P(x) Po(x) | La prueba requiere que el valor Dn calculado con la expresin anterior sea menor que el valor tabulado D para un nivel de significancia (o nivel de probabilidad) requerido. El valor crtico D de la prueba se obtiene de la tabla de valores la cual esta en funcin del nivel de significancia a y del tamao de la muestra n. Nmeros Aleatorios Es un resultado de una variable al azar especificada por una funcin de distribucin. Cuando no se especifica ninguna distribucin, se presupone que se utiliza la distribucin uniforme continua en el intervalo [0,1). 2.6 Materiales y Metodologa
DISTRIBUCIN NORMAL La distribucin de una variable normal est completamente determinada por dos parmetros, su media y su desviacin estndar, denotadas generalmente por y . Con esta notacin, la densidad de la normal viene dada por la ecuacin:
UNIVERSIDAD TCNICA DE AMBATO FACULTAD DE INGENIERA EN SISTEMAS, ELECTRNICA E INDUSTRIAL PERODO ACADMICO: SEPTIEMBRE/2013 FEBRERO/2014
DISTRIBUCIN UNIFORME
La distribucin Uniforme es el modelo (absolutamente) continuo ms simple. Corresponde al caso de una variable aleatoria que slo puede tomar valores comprendidos entre dos extremos a y b, de manera que todos los intervalos de una misma longitud (dentro de (a, b)) tienen la misma probabilidad. Tambin puede expresarse como el modelo probabilstico correspondiente a tomar un nmero al azar dentro de un intervalo (a, b). De la anterior definicin se desprende que la funcin de densidad debe tomar el mismo valor para todos los puntos dentro del intervalo (a, b) (y cero fuera del intervalo). Es decir,
UNIVERSIDAD TCNICA DE AMBATO FACULTAD DE INGENIERA EN SISTEMAS, ELECTRNICA E INDUSTRIAL PERODO ACADMICO: SEPTIEMBRE/2013 FEBRERO/2014
Grficamente:
La funcin de distribucin se obtiene integrando la funcin de densidad y viene dada por:
Grficamente:
Propiedades del modelo Uniforme
1. Su esperanza vale (b + a)/2 2. Su varianza es (b a) 2 /12
DISTRIBUCIN EXPONENCIAL
Se la utiliza como modelo para representar el tiempo de funcionamiento de espera. Esta distribucin est relacionada con la de Poisson, as pues si el nmero de sucesos que ocurren en un determinado intervalo sigue una distribucin de Poisson, entonces la variable aleatoria que representa el tiempo entre ocurrencia de sucesos sigue una distribucin exponencial. Tambin se pueden modelizar mediante la distribucin exponencial las siguientes situaciones: - la duracin de la prestacin de un servicio. - el tiempo entre llegadas sucesivas a una cola o punto de servicio. - el tiempo de duracin de algunos equipos, etc.
UNIVERSIDAD TCNICA DE AMBATO FACULTAD DE INGENIERA EN SISTEMAS, ELECTRNICA E INDUSTRIAL PERODO ACADMICO: SEPTIEMBRE/2013 FEBRERO/2014
La densidad de probabilidad es:
La distribucin acumulada es:
La media es
La varianza es
Distribucin Triangular Se denomina as por el hecho de que la funcin de densidad tiene una forma triangular. Se denomina triangular cuando viene definida por dos parmetros, que representan el valor mnimo y el valor mximo de la variable. En este caso el tringulo es equiltero. Se denomina triangular (triangular general), cuando viene dada por tres parmetros, que representan el valor mnimo y el valor mximo de la variable, y el valor del punto en el que el tringulo toma su altura mxima. En este caso el tringulo no es necesariamente equiltero. Esta distribucin tiene 3 parmetros: a =(lmite inferior de la variable) b = (lmite superior de la variable) c = valor ms probable (La moda)
UNIVERSIDAD TCNICA DE AMBATO FACULTAD DE INGENIERA EN SISTEMAS, ELECTRNICA E INDUSTRIAL PERODO ACADMICO: SEPTIEMBRE/2013 FEBRERO/2014
La densidad de probabilidad es:
EN DONDE: a es un parmetro de localizacin. (b- a) es un parmetro de escala c es un parmetro de forma.
La distribucin acumulada es:
Media:
Mediana:
Moda: Varianza:
UNIVERSIDAD TCNICA DE AMBATO FACULTAD DE INGENIERA EN SISTEMAS, ELECTRNICA E INDUSTRIAL PERODO ACADMICO: SEPTIEMBRE/2013 FEBRERO/2014
Uso de la Distribucin Triangular La Distribucin Triangular es habitualmente empleada como una descripcin subjetiva de una poblacin para la que slo se cuenta con una cantidad limitada de datos muestrales y, especialmente en casos en que la relacin entre variables es conocida pero los datos son escasos.
2.7 Conclusiones
Despus de haber aplicado las distribuciones: Uniforme, Normal, Exponencial y la Triangular para el conjunto de datos ya definidos en excel, sobre todo aplicando las prueba de bondad de ajuste de Kolmogrov-Smirnov y la prueba de normalidad JB se concluye que este conjunto de datos siguen una Distribucin Normal; las diferencias son muy notorias al mirar las grficas que se adjuntan acontinuacin.