You are on page 1of 11

Simulación de la Distribución Muestral de la Media para una

Distribución Beta
Integrantes: Carlos E. Tito Canecillas, Giancarlo G. Donayre Giribaldi, Arthur E. Bernardo Coopi, Jerad
N. Miranda Vasquez

Docente:

Asignatura: Lenguaje de Programación I

Escuela Profesional de Ingeniería Estadística

Facultad de Ingeniería Económica, Estadística y CCSS

Universidad Nacional de Ingeniería

RESUMEN INTRODUCCIÓN

Se simulan muestras provenientes de En estadística, la distribución beta es una
distribuciones beta y se observan las familia de distribuciones de probabilidad
distribuciones de sus medias. De aquí se continuas definidas en el intervalo
aprecia si usar la regla práctica de “30” es [0,1]parametrizado por dos parámetros de forma
apropiada para distribuciones beta y se forman comúnmente denotados α y β.
conclusiones acerca del tamaño de muestra
necesario que sean específicamente para
distribuciones beta y más útiles para esta que
usar dicha regla práctica.
Su media aritmética es α/(α+β), el cual también
Palabras claves: Distribución Beta, tamaño de
sería la esperanza de una media muestral que
muestra, comportamiento gaussiano.
proviene de una población que se distribuye
según dicha distribución beta. Lo que no es tan
evidente es la función de densidad de esta
ABSTRACT media muestral; sin embargo, el teorema del
límite central nos puede dar una idea.
Samples whose parent distribution are betas
are simulated and the distributions of their
means are observed to check for normality. PRESENTACIÓN DEL PROBLEMA
Then, it’s noted whether using the “30” rule of
thumb is appropriate for beta distributions and a ¿Cuándo ha de usarse la aproximación normal
set of conclusions are drawn that provide a para cómo está distribuida la media de una
better insight into how the required sample size muestra en el caso que la población sea una
behaves rather than just using said rule of distribución beta?
thumb. ¿Será suficiente la regla práctica de “30”?¿Será
demasiado?
Keywords: Beta distribution, sample size,
gaussian behavior. Primero habrá que decidir qué tan aproximado
es suficiente y este documento, por simplicidad,
supondrá que basta con pasar pruebas visuales.

encontrar si es que y qué tamaños de muestra más pequeños también son suficientes. pero no por mucho  Parámetros difieren significativamente . Obtener un conjunto de reglas más apropiado que simplemente considerar treinta como un tamaño de muestra suficientemente grande para muestras provenientes de distribuciones beta. Objetivos secundarios: Poner a prueba la regla práctica de que 30 es un tamaño de muestra suficientemente grande  B(25. 42):  Parámetros son mucho mayores que uno  Parámetros difieren por mucho  B(3. en caso sea suficiente. METODOLOGÍA  B(15.  B(5. diez pares de uno parámetros fueron escogidos para representar  Parámetros difieren significativamente distintos casos con respecto al tamaño de estos y la razón entre ellos. 5):  Parámetros mayores que uno. 25): para usar la aproximación de la distribución de  Parámetros son mucho mayores que la media muestral sugerido por el teorema de uno  Parámetros iguales límite central para los casos de una distribución poblacional beta y. 35): Dado que este tamaño ideal variaría conforme  Parámetros son mucho mayores que lo hagan los parámetros. 7):  Parámetros mayores que uno. pero no por mucho  Parámetros iguales  B(8. OBJETIVOS Objetivo Principal: Simular la distribución muestral de la media de distribuciones beta y verificar su tendencia a distribuirse normalmente con tamaños mayores de muestra.

0. 0. 0. también se trazaron las funciones de densidad de distribuciones normales con la misma media y varianza para cada distribución de media muestral respectiva. pero no por mucho  Parámetros iguales  B(0.1. pero no por mucho  Parámetros difieren significativamente También se escogieron distintos tamaños de muestra “n” a probar: n=5. se calcularon sus medias aritméticas y se  B(0. 30 (regla práctica) y 50 Se simularon muestras pseudo-aleatoriamente en R. B(0.1): trazaron las distribuciones de estas medias  Parámetros mucho menores a uno muestralespara cada combinación entre tamaño  Parámetros iguales de muestra “n” y pares de parámetros previamente mencionados.18):  Parámetros mucho menores a uno  Parámetros difieren por mucho  B(0.02. 0.15):  Parámetros mucho menores a uno  Parámetros difieren significativamente . 0.05.8):  Parámetros menores que uno. (50 combinaciones. 10000000 de muestras simuladas por cada una) Para verificar más fácilmente el comportamiento normal de estas distribuciones.2. 20.  B(0.5.5):  Parámetros menores a uno. 10.

X2. Se indica la distribución beta de la proviene cada una en la parte superior de cada gráfica. X3…Xn una muestra aleatoria de una distribución con media μ y varianza σ . 2 Entonces ladistribución de: Es una distribución normal estándar N (0.1)en el límite cuando n → ∞ (o de manera aproximada cuando n essuficientemente grande). . RESULTADOS Las siguientes gráficas son las distribuciones de las medias de las muestras simuladas.-Teorema del Límite Central: Sean X1.

.

.

.

.

.

0. 0.15) B(0.02. Distribución de Tamaño de muestra la población 5 10 20 30 50 B(5. Siendo “n” dicho tamaño de muestra recomendado en el caso de la media muestral:  Para distribuciones beta simétricas de parámetros significativamente mayores que uno. parece confirmarse el criterio de requerir un tamaño de muestra mayor conforme más asimétrica sea la distribución para el caso de las distribuciones beta. 25) B(15.05. 42) B(0. En fin.1) B(0.5) B(0. 0.1. .5.  Para distribuciones beta asimétricas de parámetros significativamente mayores que uno. 5) B(3.  Para distribuciones beta asimétricas de parámetros significativamente menores que uno.  Para distribuciones beta simétricas de parámetros significativamente menores que uno. n varía mucho según incremente la diferencia entre los parámetros. 35) B(8.18) CONCLUSIONES El tamaño de muestra recomendado para que la media muestral siga una distribución aproximadamente normal a la vista de media α/(α+β) y varianza αβ/((α+β)2(α+β+1)) es mucho menor en caso los parámetros sean iguales (distribución beta simétrica) y moderadamente menor conforme los parámetros sean mayores.8) B(0. RECOMENDACIONES En la siguiente tabla se resumen los resultados de las pruebas visuales de normalidad. 0. 10<n<20. 7) B(25. 0. pero esta sensibilidad disminuye conforme aumenta el tamaño de los parámetros. n es demasiado grande para propósitos generales (n>80) en la mayoría de los casos. n<5.2.

. &Wah.  Realizar más pruebas de normalidad para analizar una gama más amplia de Es una distribución normal estándar N (0. 2(1). SIMULACIÓN DE LA for(i in 1:muestras){ DISTRIBUCIÓN MUESTRAL DE LA MEDIA aux = sample(poblacion. bet<. m[i] = mean(aux) } hist(m. BIBLIOGRAFÍA -Mohd.. poblacion<. (2011). 2017. 2  Utilizar pruebas formales de normalidad Entonces ladistribución de: para la verificación del comportamiento gaussiano de las medias muestrales. Why can hyper parameters in # cantidad de muestras beta and dirichlet distribution be less than 1? sizes<. (2017).character(alpha). Casabona.rep(NA. PARA UNA DISTRIBUCIÓN WEIBULL. 21-33.character(j). 30. Lima: size = j. Lilliefors and Anderson-Darling tests.8 parameters-in-beta-and-dirichlet-distribution-be. replace = T) Escuela Profesional de Ingeniería Estadística. Power comparisons of Shapiro-Wilk. límite cuando n → ∞ (o de manera aproximada cuando n essuficientemente grande).character(bet).bet) -Aguirre. ") n=". 50) # tamaño de muestra [online] Available at: https://www.X2. Kolmogorov.42 less-than-1 [Accessed 7 Nov. Herencia. B. muestras) Poma. -Código utilizado (lenguaje de programación R): Smirnov. N. Retrieved November 14. X3…Xn una muestra aleatoria de específicas y robustas: una distribución con media μ y varianza σ .rbeta(n = 10000000. ylab="densidad") curve(dnorm(x..". xlab="x". add = T.1)en el casos con más tamaños de muestra.Hay sugerencias por parte del equipo que -Teorema del Límite Central: realizó esta investigación con el propósito de que futuros trabajos lleguen a conclusiones más Sean X1.quora. W. main = paste("B(". (2017). breaks=100. B. as.alpha. C.1000000 -Quora. as. and for (j in sizes){ m <.c(5. prob=T. sep='').mean=mean(m). ".sd=sd(m)).com/Why-can-hyper. 2017]. muestras <.as. Y. N. 10. #beta. simulación de medias muestrales Journal of Statistical Modeling and Analytics. L. alpha<. 20.col = "red") } #Este código se ejecuta para cada # par de parámetros a probar ANEXOS .