You are on page 1of 7

Distribuciones

Teorema del Lmite Central

Abstract
Una de las herramientas para el anlisis y representacin de datos, son las distribuciones. Mendenhall, Beaver, and Beaver
(2012), definen a la distribucin de una variable como la descripcin del nmero relativo de veces que acontece un evento, de
un nmero total de eventos. El teorema del
lmite central es un resultado matemtico de
la teora de la probabilidad que ayuda a estudiar distribuciones en donde el tamao de
muestra son representativos de una poblacin
Dudley 1999. El objetivo de este trabajo es la
asimilacin de dicho teorema con una simulacin computacional de variables aleatorias.
En donde se encontr que la simulacin realizada cumple los enunciados del teorema,
principalmente en la media , y en la varianza
2 de la nueva distribucin obtenida por el clculo de las medias de un grupo de variables
independientes.

Daniel Quiroz
Estadstica y Probabilidad
Grupo 1
Prof:
Pablo Jarrn
October 23, 2016

INFORME

Introduccin

Para el estudio de fenmenos que pueden ocurrir en la naturaleza, sistemas sintticos, o incluso en otros
planetas se han utilizado herramientas para poder mejorar la visualizacin e interpretacin de los datos
u observaciones que se recolectan para describir el tema de estudio. Una de estas herramientas es la
representacin de la distribucin de la o las variables estudiadas Van Emden 2012.
Mendenhall, Beaver, and Beaver (2012), definen a la distribucin de una variable como la descripcin del
nmero relativo de veces que acontece un evento, de un nmero total de eventos. En otras palabras, como
se acumulan los eventos posibles de una variable dentro de determinados rangos posibles de acontecer.
Existen varios tipos de distribuciones como: Normal, logartmica, weibull, exponencial, entre otras. Cada
una de ellas describen el comportamiento de los eventos en una variable de manera diferente. Esto acarrea
que, tambin determinadas medidas (i.e. tendencia central) de los datos sean calculadas de maneras
diferentes.
Conforme ha pasado el tiempo se han mejorado las herramientas con las que se estudia determinado
fenmeno, adems se han desarrollado teoremas para sustentar afirmaciones en las cuales se desarrollan
determinadas ciencias.
Uno de los teoremas que se aplican en estadstica para analizar distribuciones, es el teorema del lmite
central (CLT) E 2016. Como lo explica Hildebrand, una muestra aleatoria de tamao n con una distribucin
conocida, define un grupo de n variables independientes: X1 , X2 , X3 , X4 , ..., Xn , en donde cada variable
tiene su propia distribucin, con una media esperada E(Xi ) = , y con una varianza finita esperada
V ar(Xi = 2 ). Al clumplirse estas dos condiciones, las variables aleatorias son independientes, idnticamente distribuidas (iid).
Por ejemplo, en el caso que se est estudiando la masa de hormigas, y se realiza un muestreo de 200
hormigas, entonces el tamao de la muestra es 200. En trminos de la definicin de Hildebrand (n.d),
tenemos un grupo de 200 variables independientes. En otras palabras, el valor de la masa de cada hormiga
es una variable independiente y, estas son idnticamente distribuidas.
Con la definicin antes mencionada, el CLT establece que si se crea una nueva variable Sn , con la suma
de las variables idd, entonces esta nueva variable cumple con una distribucin de caractersticas Sn = 0
y S2 n = 1 o con una distribucin gaussiana, siendo representada como:
Sn = X1 , X2 , ..., Xn = Sn = 0; S2 n = 1
es construida a partir de las medias de las variables idd, entonces
Caso contrario si una nueva variable X
tiene las caractersticas X = y 2 6= 1, en trminos matemticos formales:
esta nueva variable X
X
n

X
2
= 1
X
Xi = X = ; X
6= 1
n i=1
Este trabajo tiene por objetivo la asimilacin de teorema de lmite central mediante la simulacin de una
muestra de tamao 1000a , y la creacin de un conjunto de 1000b variables aleatorias obtenidas por la media
de las 1000a variables aleatorias iid.

Estadstica y Probabilidad

October 23, 2016

Mtodos

1 ) se utiliz el lenguaje de programacin


Para simular un nico muestreo aleatorio de una variable iid (X
se realiz 1000
R, de la distribucin 3.1.1. De la misma manera, para construir una nueva variable (X)

iteraciones para para obtener un grupo de 1000 variables X.


Para aplicar dicho teorema se realiz una aplicacin que permitiese probar diferentes tipos de distribu diferente, entre las distribuciones posibles de simular estn:
ciones, y un tamao de X
1. Normal
2. Binomial
3. Logstica
4. Uniforme
5. Normal Logartmica
6. Chi cuadrado

Resultados

Para este informe se simul un muestreo de un tamao 1000 unidades aleatoriamente en el lenguaje R. El
nmero de medias calculadas fue 1000 unidades y tambin se simul en dicho lenguaje. Para realizar el
presente trabajo se tom nicamente a la distribucin normal logartmica. Sin embargo, la definicin del l
Las estadsticas de estos dos grupos de datos se presentan a continuacin.

Estadstica

Media

Desv. Est.

Min

Max

1) Xi=1

1,000

1.662

2.612

0.068

58.477

2) X

1,000

1.649

0.069

1.457

1.891

Table 1: Estadstica obtenida de la creacin de: 1) Una distribucin normal logartmica de 1000 muestras.
obtenidas de un grupo de 1000 muestras de variables idd.
2) Las variables X

Teorema del Lmite Central

Page 2

Estadstica y Probabilidad

October 23, 2016

Discusin

son valores muy cercanos. La


Como se puede observar en la taba (1), tanto la media de X, como de X

proporcionalidad de estas dos medias X/X


= 1.649
=
0.992,
gracias
a
esta
relacin podemos afirmar que
1.662
no hay diferencias significativas entre el valor de estas medias. Esto concuerda con lo establecido en el
CLT, con la diferencia que las medias X y X son estrictamente iguales en el lmite cuando n tiende al
infinito.
y X, siendo estas
Podemos analizar tambin los resultados obtenidos de la desviacin estndar de X
0.069 y 2.612. La distancia entre dos valores son relativamente grandes, permitindonos expresar una
es
relacin de proporcionalidad 0.069 <<< 2.612. Conforme al CLT la varianza de las nuevas variables X
calculada mediante la frmula:
2
2
X
=
n
Como se explic en el prrafo anterior, si se analiza el teorema cuando el tamao de muestra tiende al
sea
infinito, entonces la varianza tiende a converger en 0, por lo que se justifica que la varianza de X
cercana a cero.
2
2
lim
=
=0
n n

Conclusiones

El teorema del lmite central es una herramienta que nos ayuda a analizar las distribuciones de grandes
nmeros de muestra. El resultado del teorema nos motiva en la prctica a utilizar grandes cantidades
de datos muestreados para reflexionar tericamente con distribuciones normales, cuando o poblacin de
muestreo lo permite (i.e Poblaciones bacterianas). Por otro lado, cuando se tiene un tamao de muestra no
representativa de la poblacin (i.e Individuos de una especie en peligro de extincin), no se puede aplicar
reflexiones tericas a dichos casos. De aqu la importancia que tienen las diferentes distribuciones para
estudiar casos en los cuales no se tienen un tamao de muestra representativa.

Agradecimientos

Se agradece a Gabriel Gaona y Diego Ochoa por la ayuda prestada en el desarrollo de este trabajo.

Teorema del Lmite Central

Page 3

Estadstica y Probabilidad

October 23, 2016

References
Dudley, Richard M (1999). Uniform central limit theorems. Vol. 23. Cambridge Univ Press.
E, Weisstein. (2016). Central Limit Theorem. In: Wolfram Math World.
Hildebrand, A. (n.d). The Central Limit Theorem. In: Illinois University.
Mendenhall, William, Robert J Beaver, and Barbara M Beaver (2012). Introduction to probability and statistics. Cengage Learning.
Van Emden, Helmut (2012). Statistics for terrified biologists. John Wiley & Sons.

Teorema del Lmite Central

Page 4

Estadstica y Probabilidad

7
7.1

October 23, 2016

Apndice
Grficas y Cdigo

Figure 1: Aplicacin desarrollada para simular tipos de distribuciones y comprobar el teorema del lmite
central. En donde se tiene varios tipos de distribuciones, con un nmero de muestras Xi=1 de 1000 y el
de 1000. El histograma de la derecha representa la distribucin de
nmero de medias muestreadas X

Xi=1 , mientras el histograma de la derecha representa el histograma de X.

Teorema del Lmite Central

Page 5

Estadstica y Probabilidad

October 23, 2016

l i b r a r y ( stargazer )
#Log - normal distribution of 1000 samples
3 x < data . frame ( v a l u e s = r l n o r m ( n = 1000 ) )
1
2
4
5
6
7
8
9
10
11
12
13

# Getting 1000 mean of group of 1000 randon variables


a l l m n < c ( )
f o r ( i i n 1 : 1000 ) {
tmp < r l n o r m ( n = 1000 )
a l l m n [ i ] < mean ( tmp )
}
# Export Data
data < data . frame ( Val = x , Med = a l l m n )
s t a r g a z e r ( data )
./code.R

Teorema del Lmite Central

Page 6