You are on page 1of 5

1

´ DE LAS PRECIPITACIONES EN AFRICA
´
REPRESENTACION
PARA EL MONITOREO DE
SEQU´IA A PARTIR DE LA GAMMA.
Introducci´
on

A partir de la distribuci´
on uniforme aplicando el m´etodo de la convoluci´on se crearon las distribuciones Gamma y
Binomial Negativa. Se hicieron ciertas transformaciones a las distribuciones uniforme la cual permiti´o ir escalando
hasta alcanzar la distribuciones requeridas.
El c´
odigo R fue apoyado en el libro Random N umber Generation and M onte Carlo M ethods el cual posee unos
algoritmos los cuales se distribuyen gamma y binomial negativa se aplic´o en R y se generaron n´
umeros de las
distribuciones pedidas, esto fue grafido y contrastado con las distribuciones gamma y Nbinomial que genera R para
tener una mayor apreciaci´
on. Posteriormente se hace las pruebas de bondad de ajuste pertinentes lo cual corrobora
que estos datos te´
oricos simulados gracias a los algoritmos se distribuyen tal cual lo pedido.

1.

´
representaci´
on de las precipitaciones en Africa
para el monitoreo
de sequ´ıa a partir de la gamma.

En este estudio se decide utilizar la gamma ya que es una distribuci´on conocida y f´acil de manejar,esta es
una distribucion para modela variables continuas positivas y asim´etricas positivas lo cual los fen´omenos clim´
aticos
presentan este comportamiento tambi´en tiene la capacidad de ser aproximada para el 98 por ciento de los lugares
y de todos los meses. con esto se eval´
ua la probabilidad de diversas acumulaciones de precipitaciones evaluando
´
diferentes escenarios de Africa.
Para obtener la informaci´
on necesaria de los datos con los cuales trabajar se recurre a la informaci´on hist´
orica
en la cual hay una acumulaci´
on importante en tiempo y espacio para la regi´on, as´ı con la distribuci´on podemos
obtener la probabilidad estimada de diferentes cantidades de lluvia en un lugar durante un tiempo seleccionado.
Como par´
ametros se pueden utilizar la mediana , la varianza, valores m´aximos o m´ınimos, como descriptores de
cualquier ubicaci´
on y con estos par´
ametros se identificar´ıan puntos de sequ´ıa o de inundaciones etc...El fin especifico
es la acumulaci´
on de precipitaciones mensuales para una ubicaci´on.
La distribuci´
on gamma es una buena opci´
on para describir los valores de las precipitaciones por estar limitada
a la izquierda en cero por lo tanto nos dice que las precipitaciones no pueden ser negativas, la distribuci´on gamma
es positivamente sesgada por lo tanto tiene una cola extendida a la derecha, lo cual se asemeja a las precipitaciones
de muchas ´
areas en las cuales hay una alta cantidad de lluvia pero las precipitaciones t´ıpicas no lo son. aparte la
distribuci´
on es muy flexible lo cual permite adecuarse a casi cualquier situaci´on de precipitaci´on ya sea de forma
exponencial o normal.
Los par´
ametros de distribuci´
on se pueden escalar para describir precipitaciones en eventos de diferente duraci´
on,
esto quiere decir que sirve para una variedad de escalas de tiempo.
La prueba de kolmogorov-smirnov una vez estimado los par´ametros, su precision en la aproximaci´
on de la
distribuci´
on de la lluvia debe ser confirmado. para ello , la distribuci´on gamma te´orica se compara con la emp´ırica.
Esta prueba compara las funciones de distribuci´on acumulativa de la distribuci´on te´orica, la distribuci´on descrita
por los par´
ametros estimados de forma y escala con los valores devolviendo la m´axima diferencia entre las dos
distribuciones acumulativas .En esta prueba estad´ıstica, la hip´otesis nula es en la que los datos observados se han
extra´ıdo de la distribuci´
on te´
orica elegida.si el valor de la KS es excesivamente grande, entonces la hip´otesis nula
es rechazada osea los par´
ametros no est´
an haciendo un trabajo adecuado de modelaci´on en precipitaci´on dado un
lugar.
Una vez est´en estimados los par´
ametros con la prueba de KS veremos con que precision los datos hist´
oricos
representan la probabilidad de lluvia modelada .
La confianza de aceptaci´
on o rechazo de la distribuci´on te´orica puede medirse por el valor p, que incorpora el
numero de valores que se utiliza en la prueba en el calculo de su valor , valor p peque˜
no rechaza la hip´otesis nula,
un valor p grande dice que la hip´
otesis nula no puede ser rechazada.
Metodolog´ıa
Cuando no hay ninguna lluvia, la probabilidad de un evento con ninguna precipitaci´on debe tratarse por separado ya que la gamma no acepta valores menores que cero ni iguales a cero.Para esto se utiliza un par´ametro (q) en
la distribuci´
on te´
orica correspondiente.Esta probabilidad no se estima por conteo de las veces que sale N0 sobre
numero de observaciones hist´
oricas(n), dado que los datos de CHARM ( Modelo historico para las precipitaciones
en ´
africa) tiene 36 a˜
nos de historia, n=36 para cada uno de un mes.

1

indicando en qu´e medida las diferencias existentes entre ambas. Prueba Chi . Con la variaci´ on de los par´ ametros podremos determinar en que lugares hay mas precipitaciones y con ello identificar lugares de sequ´ıa los cuales conllevan a enfermedades. 3. El beta se puede ver como la varianza sobre la media por lo tanto as´ı tener gran escala nos dice una gran varianza una regi´on seca y un beta peque˜ no indica poca varianza una regi´ on h´ umeda.3 ´ GAMMA α. con una probabilidad constante de ´exito p. 3.Es por tanto de gran utilidad para aquellos muestreos que procedan de esta manera. 2. . (α) y (β) de los que depende su forma y alcance por la derecha. siempre positivos. tambi´en.Donde la distribuci´on gamma requiere que alpha de forma y el par´ametro beta de escala se interpreten juntos y el alpha dar´ a la forma de curva as´ı cuando aumente la forma de la distribuci´ on se convierte mas sim´etrica. β DISTRIBUCION Un ejemplo seria como los ceros no se toman se hace el conteo sin incluirlos y hay lugares donde (q) es mayor a 0. alpha peque˜ no. Se dice entonces que X tiene una distribuci´on binomial negativa con par´ametros p y r = 1. beta = par´ametro de escala y siendo x= cantidad de lluvia. 2. en la distribuci´on gamma se puede tener una gran combinaci´ on de los par´ ametros donde podemos tener un alpha muy elevado y un beta m´ınimo o un caso contrario con esto podemos representar un lugar de mucha lluvia como tambi´en podemos representar una zona de mucha sequ´ıa. 2 .1. la prueba de Kolmog´ orov-Smirnov (tambi´en prueba K-S) es una prueba no param´etrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre s´ı. p La distribuci´ on binomial negativa es una generalizaci´on de la distribuci´on geom´etrica donde la variable aleatoria X es el n´ umero de ensayos Bernoulli efectuados hasta que se tienen r ´exitos. Prueba de de Kolmogorov-Smirnov En estad´ıstica. mientras que un lugar seco la varianza es alta . Es una distribuci´on de probabilidad continua adecuada para modelar el comportamiento de variables aleatorias con asimetr´ıa positiva y/o los experimentos en donde est´a involucrado el tiempo. En la funci´ on de distribuci´ on gamma los par´ametros alpha = par´ametro de forma. α = µ2 σ 2 β = σ 2 µ Para la comprensi´ on de como los par´ ametros describen las precipitaciones el producto del par´ametro estimaci´ on es igual a la media de los valores distintos de cero en las precipitaciones hist´oricas. En su expresi´ on se encuentran dos par´ametros. Distribuci´ on Binomial Negativa r. de haberlas.cuadrado La prueba χ2 de Pearson es considerada como una prueba no param´etrica que mide la discrepancia entre una distribuci´ on observada y otra te´ orica (bondad de ajuste). se deben al azar en el contraste de hip´otesis. Distribuci´ on gamma α. como una generalizaci´on de la distribuci´on exponencial. β Se le conoce. mediante la presentaci´on de los datos en tablas de contingencia. Un lugar de alta humedad tiene una media grande y una varianza peque˜ na osea alpha grande. 3. donde puede a ver una buena cantidad de lluvia para un buen cultivo. 2.5 osea que los par´ ametros de la distribuci´ on gamma se estiman por debajo de 18 muestras (de 36 a˜ nos) por lo tanto se vuelve sospechoso el ver que faltan muestras. La distribuci´ on binomial negativa es un modelo adecuado para tratar aquellos procesos en los que se repite un determinado ensayo o prueba hasta conseguir un n´ umero determinado de resultados favorables . Tambi´en se utiliza para probar la independencia de dos variables entre s´ı. o excesivas precipitaciones que causen inundaciones.1. adem´as de la distribuci´ on de Erlang y la distribuci´ on Chi-cuadrada.

1.5 Al graficar los datos obtuvimos lo siguiente: Primera mente tenemos un histograma de los datos del hospital mediante este podemos comenzar a pensar que estos datos se distribuyen gamma ya que toma un comportamiento de la distribuci´on dicha.2 de Cheng/F east (1979) del libro Random N umber Generation and M onte Carlo M ethods.1567496) y la prueba de Kolmogorov-Smirnov en la cual se 3 . en a˜ nos. 4.151180 y T e´ oricas = 6. esto fue los pasos graficos tomados para la corroboraci´ on de la hip´ otesis. Se obtuvo informaci´ on de un banco de datos de un hospital sobre la supervivencia. Siguiendo la comprobaciones para verificar la veracidad de la hip´ otesis se hace un gr´afico Q − Q lo cual es un m´etodo gr´afico para el diagn´ ostico de diferencias entre la distribuci´ on de probabilidad de una poblaci´on de la que se ha extra´ıdo una muestra aleatoria y una distribuci´ on usada para la comparaci´ on de la distribuci´on.9 y la varianza σ 2 = 0.202597 y te´ oricas = 2. por ultimo tenemos un plot lo cual se tiene graficado de color rojo el comportamiento que deber´ıa tomar los datos emp´ıricos en este vemos que los datos emp´ıricos se acoplan medianamente bien a la linea. Convoluci´ on Una distribuci´ on se puede expresar en t´erminos de la suma de dos o m´as variables aleatorias de otras distribuciones. La distribuci´ on de la suma es la convoluci´on de las distribuciones de las variables aleatorias independientes. tambi´en tenemos un histograma de datos emp´ıricos los cuales son simulados por el programa R con los mismos par´ametros de alpha y beta y al contrastarla con la gr´ afica de los datos emp´ıricos vamos corroborando la veracidad de la hip´otesis la cual es que los datos encontrado en el banco de datos del hospital se distribuyen Gamma. se tienen datos de que la media de supervivencia en a˜ nos X = . el m´etodo de convoluci´ on permite generar variables aleatorias en funci´on a una combinaci´on lineal poderada de otras variables aleatorias el m´etodo entonces requiere que la variable aleatoria a ser generada Yi pueda expresarse como una suma lineal ponderada de otras variables aleatorias Xi 5. 5. β la distribuci´ on gamma se genero mediante el m´etodo de la convoluci´on partiendo de una variable uniforme apoy´ andose en el Algoritmo 5.12 lo cual trabajando con una confianza del 95 % esta es mas grande que la significancia del 5 % lo que nos dice que en efecto se distribuye gamma. adicionalmente tenemos la comparaci´on de medias (Emp´ıricas = 1.975513) y varianzas (Emp´ıricas = 1.5 RESULTADOS La prueba de bondad utilizada para corroborar que los datos tienen un comportamiento Gamma fue el m´etodo de Kolmogorov-Smirnov lo cual nos da un V alorP de 0. Resultados Distribuci´ on Gamma α. de pacientes que han sido diagnosticados con cierta enfermedad.

05 y la prueba de Kolmogorov-Smirnov arroja un valor P = 0.6146 aceptamos la hip´otesis de que lo datos son Gamma.95246 y un valor calculado de 48.95 y una significancia del 0. primeramente se apoyara en gr´ aficos para representar lo antes dicho.6.60237 lo cual nos da que cae en la zona de aceptaci´ on. encontrado en el libro Monte Carlo Methods with R. un r = 3 y un p = 0.9610. por ultimo tenemos que los datos emp´ıricos deber´ a tener el mismo comportamiento de los datos te´oricos (linea roja) en la cual se observa que tiene una tendencia muy semejante esta son las conclusiones solamente apoy´andose en el m´etodo gr´afico para corroborar estas conclusiones por otra parte se realizaron contrastes de media (Emp´ırica = 6. r) → X e BN (r. el primer gr´ afico de datos emp´ıricos vemos que tienen un comportamiento similar a la de una distribucion Binomial Negativa desde aqu´ı se puede formular la hip´otesis de que los datos obtenidos de la empresa se distribuyen Binomial Negativa por esto lo contrastamos con los datos te´oricos simulados en el software R para poder comparar el comportamiento de los dos gr´ aficos con los mismos par´ametros . p La distribuci´ on Binomial Negativa se simulo mediante el siguiente algoritmo: X | y e poiss(Y ). 5.9504 y T e´ orica = 7. para seguir apoyando la hip´otesis de que los datos son Binomial Negativo se uso un Q−Q plot lo cual nos ayuda a comparar los datos emp´ıricos con los te´oricos lo cual deber´ıa tener una forma lineal y efectivamente en la gr´afica se ve claramente esta tendencia. β 5 RESULTADOS trabaja con una confianza de 0.1. y practicando la prueba Chi-cuadrado obtuvimos un valor P de 0.0455) tambi´en se usa la prueba Chi-cuadrado con una confianza de 95 % lo cual nos da un valor observado de 20.1. En la linea de producci´ on de una empresa de tornillos se tiene un inspector el cual su trabajo es identificar los tornillos defectuoso.3 4 . de esta empresa obtuvimos datos del promedio de veces que este inspector detecte el primer defectuoso sea el tercero defectuoso que pasa por la linea de producci´on.23 podemos concluir que los datos del hospital se se distribuyen gamma con par´ ametros α = 3.1 Distribuci´ on Gamma α.94 y β = 3.27 .05 lo cual se deber´ıa tener un valor P > 0. esto tiene x = 10 y σ 2 = 46.5. se acepta la hip´ otesis de que los datos se comportan Binomial Negativa con un valor P de 0. Y eΓ(P/1 − P. p). Distribuci´ on Binomial Negativa r. y Se obtuvo la informaci´ on de la empresa la cual estos datos fueron graficados para ver que comportamiento tiene.9504 y T e´ orica = 7.0455) varianza (Emp´ırica = 6.

se puede agregar que los m´etodos de bondad de ajuste son buenos. este test puede hacerse en una distribuci´ on continua o una discreta.6 6. por los resultados planteados anteriormente el m´etodo fue eficiente.George Casella editorial Springer *Random Number Generation and Monte Carlo Methods Escrito por James E. al poder utilizar el m´etodo de la convoluci´ on a partir de una distribuci´ on uniforme y poder generar cualquier distribuci´on podemos pensar que esta distribuci´ on es la base para generar cualquier otra. a diferencia de la prueba Kolmogorov-Smirnov que solo se puede hacer solo en continuas Bibliogr´ afica * Probabilidad y estad´ıstica por Michael J. Rosenthal editorial revert´e * Introducing Monte Carlo Methods with R por Christian Robert. CONCLUSIONES Conclusiones la distribuci´ on de probabilidad de la suma de dos o mas variables aleatorias independientes es llamada convoluci´ on este fue el m´etodo aplicado en el trabajo para generar n´ umeros aleatorios de la distribuci´on gamma y binomial negativa. Evans. pero se puede decir que el m´etodo de la Chi-cuadrado es el mas optimo.Jeffrey S. Gentl editorial Springer *Introducci´ on a la Simulaci´ on y a la Teor´ıa de Colas Ricardo Cao Abad editorial netbiblio 5 .