You are on page 1of 6

UN MTODO DE EXPERIENCIA DIRECTA PARA EL APRENDIZAJE DE LAS

DISTRIBUCIONES MUESTRALES
Jorge I. Paolini R., Ing, PhD
Universidad Nacional Experimental de Guayana. Venezuela.
jpaolini1@hotmail.com
Campo: Probabilidades y Resolucin de Problemas. Nivel: Superior y Postgrado
RESUMEN
Se presenta el Mtodo Bootstrap como un modelo de solucin al problema de determinar la
distribucin muestral de un estadstico cuando se desconoce la funcin de probabilidades de
la variable aleatoria considerada. El Mtodo Bootstrap es un mtodo basado en simulacin
de muestreos para hacer inferencia estadstica, tiene como objetivo reemplazar el anlisis
estadstico por clculos intensivos sobre las muestras generadas por simulacin de Monte
Carlo. El Mtodo Bootstrap es un mecanismo no paramtrico para el clculo de
estimaciones a travs del muestreo realizado sobre una muestra (resampling). Utilizando
este mtodo resuelve el problema de estimacin y distribucin prescindiendo del supuesto
de una funcin de densidad de probabilidades para la variable aleatoria muestreada. Con
este mtodo se logra sintetizar un conjunto de tcnicas como la simulacin, el muestreo y
la inferencia estadstica en un sistema constructivo que genera distribuciones muestrales
aproximadas independientes de alguna suposicin acerca de la distribucin muestreada,
brindndole al alumno la solucin de un problema a partir de la experiencia directa.
1. INTRODUCCIN.
La eficacia del computador como elemento de apoyo a la estadstica ha permitido mostrar
algunos enfoques emergentes para abordar los problemas de distribucin y estimacin. Las
inferencias en buena medida eran posibles solamente a travs del enfoque tradicional o
mtodo normal. Con el advenimiento del computador podemos obtener y visualizar algunos
resultados que slo eran posibles a travs de mtodos analticos y las deducciones rigurosas
de teoremas lmites. La utilizacin del computador en el campo de la estadstica
matemtica y las probabilidades ha incorporado un elemento de aprendizaje para las nuevas
generaciones de estudiantes y docentes. Stewart (1998) dice que el advenimiento de una
nueva generacin de computadores, con gran capacidad de memoria, clculos aritmticos
muy rpidos y sobre todo grficas precisas de alta resolucin ha cambiado todo el
panorama. Actualmente podemos utilizar el computador como herramienta experimental
en la solucin de problemas, el profesor Stewart comenta que tenemos la posibilidad de
efectuar un recorrido a travs de grandes cantidades de ejemplos de los fenmenos que nos
interesan a travs de las respuesta que ofrece el computador.
El problema de transferencia en los conceptos e ideas acerca de las distribuciones
muestrales ha estado centrada en las aplicaciones de teoremas lmites. Para determinar la
distribucin muestral de un estadstico se utilizan, por ejemplo, los resultados de la
convergencia a la distribucin Normal o Gaussiana. Un alumno recibe un conjunto de
teoremas para enfrentar el problema de determinar la distribucin muestral de un estadstico

como el promedio o la desviacin estndar. El Bootstrap permite aprender el concepto de


las distribuciones muestrales a partir de una construccin sistemtica de la distribucin de
estadstico que se est considerando, convirtiendo la solucin del problema de distribucin
en una experiencia directa y vivencial. Las profesoras Gumila y Soriano (1998) opinan que
la experiencia directa tiene la siguiente ventaja: radica en que funciona en la misma
manera que funciona el cerebro y ofrece a los alumnos la oportunidad de acercarse ms
holsticamente a los contenidos.
El mtodo Bootstrap permite la incorporacin de la experiencia directa en la determinacin
de una distribucin muestral aplicando un algoritmo que permite la construccin de la
distribucin, independientemente de la asuncin de normalidad. Asumir la normalidad
puede conducirnos a equvocos en la determinacin de distribuciones muestrales, de tal
modo que prescindir de este supuesto conduce a elaborar un cuerpo de mtodos que sean
libres de alguna distribucin en la variable que se est observando.
2. PRESENTACIN DEL PROBLEMA.
Estamos interesados en determinar la distribucin de un estadstico T en la distribucin de
probabilidades F de una variable aleatoria X, donde F es desconocida. Tenemos una
muestra de la variable observada X = { X1, X2, ... ,Xn } de F. Cmo encontramos la
distribucin T(F) ?.
Este problema ha sido resuelto utilizando el Teorema Central del Lmite (TCL),
justificando las aproximaciones normales a las distribuciones muestrales de sumas de
variables aleatorias y medias muestrales. Sin embargo, el uso del TCL exige encontrar el
valor esperado y el error del estadstico considerado, que en algunos casos es imposible
determinar analticamente, Efron (1998) dice que la frmula para el error estndar existe
para muy pocos estadsticos. Adicionalmente, sabemos que los resultados de los teoremas
lmites dependen de un nmero considerablemente grande de muestras es decir, un valor
de n .
3. UN MTODO DE EXPERIENCIA
DISTRIBUCIONES MUESTRALES.

DIRECTA

PARA

DETERMINAR

El Mtodo Bootstrap es una manera de enfrentar el problema de distribucin cuando se


desconoce la distribucin de probabilidades de la variable aleatoria que se muestrea. Efron
define el Bootstrap como un mtodo basado en simulacin de muestreos para hacer
inferencia estadstica, el Bootstrap utiliza el computador para:
i.
ii.
iii.

Generar un gran nmero de muestras aleatorias.


Calcular rpida y eficientemente los estadsticos muestrales.
Producir las distribuciones muestrales a travs de clculos intensivos sobre las
muestras generadas.

Para determinar la distribucin muestral de un estadstico T se ejecutan los pasos del


siguiente algoritmo:
1. Determinar Fn la funcin de distribucin de los n datos observados, asignando
probabilidad 1/n a cada punto de la muestra original X = { X1, X2, ... , Xn }.
2. Con un generador de nmeros aleatorios uniformes e independientes en [1,n]
tomar n nuevos datos con reemplazo de Fn, para obtener la muestra aleatoria
X *= { X1*, X2*, ... , Xn* } , a esta muestra se le denomina muestra Bootstrap.
3. Calcular el estadstico de inters T* en la muestra Bootstrap X* .
4. Repetir los pasos (2) y (3) un gran nmero de veces, digamos B veces.
La serie de valores generada ser T*1, T*2, ..., T*b, ..., T*B, con estos B valores de T* se
determina una distribucin muestral denominada GB, con esta distribucin, podemos hacer
inferencias aproximadas sobre el estadstico T. Ntese que en cada iteracin del algoritmo
se obtiene un valor del estadstico T*b, Bien sea por el mtodo de simulacin manual
realizada en el aula de clase o de modo automtico a travs del uso de un computador, el
alumno observa como se produce la distribucin muestral del estadstico que se est
considerando. Por esta va la transferencia del concepto de distribucin muestral es
vivencial y constructiva. Otra de las ventajas del mtodo es el de producir una solucin
expedita al problema de determinar el error estndar de un estadstico. Dado que en cada
iteracin se obtiene un valor para el estadstico T, en las B realizaciones del algoritmo
tenemos el patrn de variacin del estadstico T.
1
1 B
*
*

[
(Tb T * ) 2 ] 2 ,
Para obtener el error estndar de T basta calcular

T
B 1 b 1
B
1
donde T* se calcula as
T *
Tb* .

B b1
La distribucin muestral permite hacer inferencias acerca T. El mtodo Bootstrap no se
reduce a distribucin de sumas de variables aleatorias sino que se extiende a cualquier
estadstico. Para determinar inferencias podemos utilizar la distribucin generada GB , por
ejemplo si se desea obtener un intervalo confidencia al (1-).100% se calculan las
siguientes cantidades:
1
a * GB ( )
2

b * G B (1

)
2

Para un intervalo aproximado, el mtodo Bootstrap toma la distancia entre el percentil


100./2 y el percentil 100.(1-/2) de la distribucin GB del estadstico *. Los valores
encontrados [a* , b*] determinan el intervalo confidencial aproximado central (1-) 100%
para .

Se cumple que:

{ a } / B 2 y { b } / B 1 2
*

Donde la funcin (.) determina la frecuencia de las veces que se cumple la desigualdad,
para determinar las probabilidades el estudiante tiene acceso por la va de frecuencias
relativas, que es un modo vivencial de obtener las probabilidades. En Paolini (1999b y
2000) pueden observarse otros modos de hacer inferencia a travs del Bootstrap, as mismo
se desarrolla un mecanismo basado en la experiencia directa para caracterizar poblaciones
estadsticas.
4. PRESENTACIN DE UN CASO DE ESTUDIO.
Queremos determinar la distribucin muestral del promedio para una muestra aleatoria de
tamao n =16 mineros que contenan valores de mercurio en sangre. Una vez ejecutado el
algoritmo Bootstrap con B= 2500 iteraciones, se encontr la distribucin muestral del
Promedio del contenido de mercurio en Sangre que se muestra en el grfico HGSANG.

450
1.00

400

350
0.80
300

250

0.60

200
0.40

150

100
0.20

67.68

62.90

58.13

53.35

48.58

43.80

39.02

34.25

29.47

24.69

50

0.00

Grfico HGSANG. Distribucin Muestral del promedio * de Mercurio en Sangre.


(B =2.500).

Puede observarse la marcada asimetra de la distribucin del Promedio, contrariamente a lo


que especifica el TCL. La tabla HGSANG nos muestra estimaciones para el promedio del
contenido de mercurio en sangre para n =16 mineros.
Tabla HGSANG. (1- ) = 0.95
Intervalos Confidenciales B para el promedio de
Mercurio en Sangre (g / cc).
B

a*

b*

LB

100
250
1.000
2.500

30,19
30,19
30,63
30,50

53,40
53,58
54,50
55,40

23,21
23,39
23,87
24,90

Error Estndar

*
5,9477
6,0523
6,1635
6,3962

La longitud LB que se obtiene al restar b* - a* , determina un nivel de incertidumbre en la


estimacin y suele utilizarse para observar la variacin a medida que B cambia.
5. LA EXPERIENCIA DEL MTODO BOOTSTRAP EN LA U.N.E.G.
El Mtodo Bootstrap se incorpora en el programa de estudios de Ingeniera Informtica
desde la creacin del proyecto de carrera, a travs de los Cursos de Estadstica II
(Inferencia Estadstica) y Estudio de Casos y Simulacin. En estos cursos se hace nfasis
en la determinacin de Distribuciones Muestrales diferentes de las distribuciones clsicas y
en el diseo de sistemas programados para la generacin de muestras aleatorias simuladas
por el Mtodo de Monte Carlo. El estudiante y el docente resuelven problemas de
estimacin utilizando casos de estudio del mbito industrial de las empresas de Ciudad
Guayana (Venezuela). Los estudiantes de Ingeniera Industrial utilizan el Mtodo
Bootstrap para la determinacin de estndares industriales y otras cantidades de
importancia estadstica en la elaboracin de sus proyectos de grado. En los postgrados de
Operaciones y Produccin y Ciencias de los Materiales se da mayor relevancia a las
bondades de la estimacin a travs del Bootstrap como una alternativa a los mtodos
clsicos. En el Postgrado de Ciencias ambientales se muestra el Bootstrap como un mtodo
para determinar distribuciones aproximadas y estimaciones para los parmetros socioecolgicos. Hemos observado que el aprendizaje a travs de este mtodo facilita la
comprensin de los Teoremas Lmites para tratar algunos problemas de la inferencia
estadstica.

6. CONCLUSIONES
A travs de la aplicacin del Mtodo Bootstrap el estudiante puede ver como se construye
la distribucin GB del estadstico, de la misma manera puede apreciar el patrn de variacin
del estadstico T en la medida que se ejecuta el algoritmo.
Este mtodo se presenta como un modo de ensear la solucin de un problema a travs de
la experiencia vivencial y como una alternativa de inters para el desarrollo profesional.
El Mtodo Bootstrap es un modo de resolver el problema de estimacin cuando se
desconoce la distribucin de probabilidades de la variable aleatoria en la muestra, en este
sentido el alumno puede prescindir del supuesto de normalidad para construir sus
inferencias.
Las inferencias a partir de la distribucin GB garantizan la estructura de la poblacin
muestreada y permiten la comparacin con los resultados obtenidos por las distribuciones
lmites.
Podemos prescindir de un tamao de muestra especificado para realizar inferencias a travs
del Mtodo Bootstrap.
REFERENCIAS BIBLIOGRFICAS.
1. Efron, B and Tibshirani, R. (1998). An Introduction to the Bootstrap. Boca Raton:
Chapman & Hall/CRC.
2. Gumila, O y Soriano, M. (1998). Aula Mgica. Una enseanza compatible con el
cerebro. Editorial Galac: Caracas. Venezuela.
3. Paolini, J. (1993). El Mtodo Bootstrap: un paradigma en la Computacin
Estadstica. Actas de las Primeras Jornadas de Investigacin UNEG. Ciudad
Guayana. Venezuela.
4. Paolini, J. (1999a). El Mtodo Bootstrap: un paradigma en la formacin de los
ingenieros en Computacin, Informtica y Sistemas. Actas de la III Conferencia
Latinoamericana de Facultades de Ingeniera y Escuelas de Ingeniera de Sistemas y
Ciencias de la Computacin CONLATI 99. Barquisimeto. Venezuela.
5. Paolini, J. (1999b). Fundamentos del Mtodo Bootstrap. Corporacin Aluminios de
Venezuela. Tutorial CONLATI 99. Barquisimeto. Venezuela
6. Paolini, J. (2000). Caracterizacin de Poblaciones Estadsticas a travs del Mtodo
Bootstrap. Ponencia invitada de la III Asamblea del Departamento de Ciencia y
Tecnologa. Universidad Nacional Experimental de Guayana. Venezuela.
7. Santos, L. (1997). Principios y Mtodos de la Resolucin de Problemas en el
Aprendizaje de las Matemticas. . Mxico: Grupo Editorial Iberoamrica.
8. Stewart, I. (1998). De aqu al Infinito. Las matemticas de hoy. Editorial Drakontos:
Barcelona. Espaa.

You might also like