You are on page 1of 25

TEMA: MUESTREO Y DISTRIBUCIONES MUESTRALES

CURSO : ESTADISTICA II
DOCENTE : ING. LIMBER NACION RAMOS
INTEGRANTES :MACHADO GUERRA, Roitber Antonio

CICLO :V
SEMESTRE : 2017-II
GRUPO : “C”

UNIVERSIDAD DE HUANUCO
Página 1
Muestreo
En la referencia estadística se conoce como muestreo a la técnica para la
selección de una muestra a partir de una población estadística.
Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean
extrapolables a la población. Este proceso permite ahorrar recursos, y a la vez
obtener resultados parecidos a los que se alcanzarían si se realizase un estudio
de toda la población. En las investigaciones llevadas por empresarios y de la
medicina se usa muestreo extensivamente en recoger información sobre
poblaciones.
Cabe mencionar que para que el muestreo sea válido y se pueda realizar un
estudio adecuado (que consienta no solo hacer estimaciones de la población sino
estimar también los márgenes de error correspondientes a dichas estimaciones),
debe cumplir ciertos requisitos. Nunca podremos estar enteramente seguros de
que el resultado sea una muestra representativa, pero sí podemos actuar de
manera que esta condición se alcance con una probabilidad alta.
En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la
población, se puede extraer dos o más muestras de la misma población. Al
conjunto de muestras que se pueden obtener de la población se
denomina espacio muestral. La variable que asocia a cada muestra su
probabilidad de extracción, sigue la llamada distribución muestral.
En ocasiones en que no es posible o conveniente realizar un censo (analizar a
todos los elementos de una población), se selecciona una muestra, entendiendo
por tal una parte representativa de la población. El muestreo es por lo tanto una
herramienta de la investigación científica, cuya función básica es determinar que
parte de una población debe examinarse, con la finalidad de hacer inferencias
sobre dicha población. La muestra debe lograr una representación adecuada de
la población, en la que se reproduzca de la mejor manera los rasgos esenciales
de dicha población que son importantes para la investigación. Para que una
muestra sea representativa, y por lo tanto útil, debe de reflejar las similitudes y
diferencias encontradas en la población, es decir ejemplificar las características
de ésta.
Los errores más comunes que se pueden cometer son:
1.- Hacer conclusiones muy generales a partir de la observación de sólo una parte
de la Población, se denomina error de muestreo.
2.- Hacer conclusiones hacia una Población mucho más grandes de la que
originalmente se tomó la muestra. Error de Inferencia. En la estadística se usa la
palabra población para referirse no sólo a personas si no a todos los elementos
que han sido escogidos para su estudio y el término muestra se usa para describir
una porción escogida de la población.

UNIVERSIDAD DE HUANUCO
Página 2
Técnicas de muestreo estadístico
Existen dos métodos para seleccionar muestras de poblaciones: el muestreo no
aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como recurso
en el proceso de selección). Cuando este último cumple con la condición de que
todos los elementos de la población tienen alguna oportunidad de ser escogidos
en la muestra, si la probabilidad correspondiente a cada sujeto de la población es
conocida de antemano, recibe el nombre de muestreo probabilístico. Una muestra
seleccionada por muestreo de juicio puede basarse en la experiencia de alguien
con la población. Algunas veces una muestra de juicio se usa como guía o muestra
tentativa para decidir cómo tomar una muestra aleatoria más adelante.
Muestreo aleatorio simple
Forman parte de este tipo de muestreo todos aquellos métodos para los que se
puede calcular la probabilidad de extracción de cualquiera de las muestras
posibles. Este conjunto de técnicas de muestreo es el más aconsejable, aunque
en ocasiones no es posible optar por él.
Tipos
Sin reposición de los elementos:' Cada elemento extraído se descarta para la
subsiguiente extracción. Por ejemplo, si se extrae una muestra de una "población"
de bombillas para estimar la vida media de las bombillas que la integran, no será
posible medir más que una vez la bombilla seleccionada.

Con reposición de los elementos: Las observaciones se realizan con remplazo


de los individuos, de forma que la población es idéntica en todas las extracciones.
En poblaciones muy grandes, la probabilidad de repetir una extracción es tan
pequeña que el muestreo puede considerarse con reposición, aunque, realmente,
no lo sea.
Con reposición múltiple: En poblaciones muy grandes, la probabilidad de repetir
una extracción es tan pequeña que el muestreo puede considerarse con
reposición.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy útil la
extracción de números aleatorios mediante ordenadores, calculadoras o tablas
construidas al efecto.
Muestreo sistemático
Se utiliza cuando el universo o población es de gran tamaño, o ha de extenderse
en el tiempo. Primero hay que identificar las unidades y relacionarlas con el
calendario (cuando proceda). Luego hay que calcular una constante, denominada
coeficiente de elevación:

K= N/n
Donde N es el tamaño de la población y n el tamaño de la muestra.

UNIVERSIDAD DE HUANUCO
Página 3
Para determinar en qué fecha se producirá la primera extracción, hay que elegir
al azar un número entre 1 y K; de ahí en adelante tomar uno de cada K a intervalos
regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del
fenómeno.
Esto quiere decir que si tenemos un determinado número de personas que es la
población (N) y queremos escoger de esa población un número más pequeño el
cual es la muestra (n), dividimos el número de la población por el número de la
muestra que queremos tomar y el resultado de esta operación será el intervalo,
entonces escogemos un número al azar desde uno hasta el número del intervalo,
y a partir de este número escogemos los demás siguiendo el orden.
Muestreo estratificado
Consiste en la división previa de la población de estudio en grupos o clases que
se suponen homogéneos con respecto a alguna característica de las que se van
a estudiar. A cada uno de estos estratos se le asignaría una cuota que
determinaría el número de miembros del mismo que compondrán la muestra.
Dentro de cada estrato se suele usar la técnica de muestreo sistemático, una de
las técnicas de selección más usadas en la práctica.
Según la cantidad de elementos de la muestra que se han de elegir de cada uno
de los estratos, existen dos técnicas de muestreo estratificado:

 Asignación proporcional: el tamaño de la muestra dentro de cada estrato es


proporcional al tamaño del estrato dentro de la población.

 Asignación óptima: la muestra recogerá más individuos de aquellos estratos


que tengan más variabilidad. Para ello es necesario un conocimiento previo de
la población.
Por ejemplo, para un estudio de opinión, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada
uno de estos grupos, puede haber cierta homogeneidad. En la asignación
proporcional, si la población está compuesta de un 55% de mujeres y un 45 % de
hombres, se tomaría una muestra que contenga también esos mismos
porcentajes de hombres y mujeres. En la asignación óptima, si todos los hombres
piensan igual, pero las mujeres son impredecibles, se tomaría una muestra con
más del 55% de mujeres.
Para una descripción general del muestreo estratificado y los métodos de
inferencia asociados con este procedimiento, suponemos que la población está
dividida en subpoblaciones o estratos de tamaños conocidos N1, N2,..., Nh tal que
las unidades en cada estrato sean homogéneas respecto a la característica en
cuestión. La media y la varianza desconocidas para el i-pésimo estrato son
denotadas por mi y si2, respectivamente.

UNIVERSIDAD DE HUANUCO
Página 4
Muestreo por etapas múltiples
Esta técnica es la única opción cuando no se dispone de lista completa de la
población de referencia o bien cuando por medio de la técnica de muestreo simple
o estratificado se obtiene una muestra con unidades distribuidas de tal forma que
resultan de difícil acceso. En el muestreo a estudios múltiples se subdivide la
población en varios niveles ordenados que se extraen sucesivamente por medio
de un procedimiento de embudo. El muestreo se desarrolla en varias fases o
extracciones sucesivas para cada nivel.
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en
un país determinado, éstos pueden subdividirse en unidades primarias
representadas por circunscripciones didácticas y unidades secundarias que serían
los propios profesores. En primer lugar, extraemos una muestra de las unidades
primarias (para lo cual debemos tener la lista completa de estas unidades) y en
segundo lugar extraemos aleatoriamente una muestra de unidades secundarias
de cada una de las primarias seleccionadas en la primera extracción.
Muestreo por conglomerados
Se utiliza cuando la población se encuentra dividida, de manera natural, en grupos
que se supone que contienen toda la variabilidad de la población, es decir, la
representan fielmente respecto a la característica a elegir, pueden seleccionarse
sólo algunos de estos grupos o conglomerados para la realización del estudio.
Dentro de los grupos seleccionados se ubicarán las unidades elementales, por
ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición
a todas las unidades, es decir, los miembros del grupo, o sólo se le podría aplicar
a algunos de ellos, seleccionados al azar. Este método tiene la ventaja
de simplificar la recogida de información muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos
individuos para integrar la muestra, el diseño se llama muestreo bimetálico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer
método funciona mejor cuanto más homogénea es la población respecto del
estrato, aunque más diferentes son éstos entre sí. En el segundo, ocurre lo
contrario. Los conglomerados deben presentar toda la variabilidad, aunque deben
ser muy parecidos entre sí.
Homogeneidad de las poblaciones o sus subgrupos
Homogéneo significa, en el contexto de la estratificación, que no hay mucha
variabilidad. Los estratos funcionan mejor cuanto más homogéneos son cada uno
de ellos respecto a la característica a medir. Por ejemplo, si se estudia la estatura
de una población, es bueno distinguir entre los estratos mujeres y hombres porque
se espera que, dentro de ellos, haya menos variabilidad, es decir, sean menos
heterogéneos. Dicho de otro modo, no hay tantas diferencias entre unas estaturas
y otras dentro del estrato que en la población total.
Por el contrario, la heterogeneidad hace inútil la división en estratos. Si se dan las
mismas diferencias dentro del estrato que en toda la población, no hay por qué

UNIVERSIDAD DE HUANUCO
Página 5
usar este método de muestreo. En los casos en los que existan grupos que
contengan toda la variabilidad de la población, lo que se construyen son
conglomerados, que ahorran algo del trabajo que supondría analizar toda la
población. En resumen, los estratos y los conglomerados funcionan bajo principios
opuestos: los primeros son mejores cuanto más homogéneo es el grupo respecto
a la característica a estudiar y los conglomerados, si representan fielmente a la
población, esto es, contienen toda su variabilidad, o sea, son heterogéneos.
El espacio muestral es: Conjunto formado por todos los resultados posibles de un
experimento aleatorio. EJ: Al lanzar un dado no cargado el espacio muestral del
dado seria: 1-2-3-4-5-6.
Muestreo no probabilístico
Es aquel para el que no se puede calcular la probabilidad de extracción de una
determinada muestra. Por tal motivo, se busca seleccionar a individuos que tienen
un conocimiento profundo del tema bajo estudio y se considera que la información
aportada por esas personas es vital para la toma de decisiones.
Muestreo por cuotas
Es la técnica más difundida sobre todo en estudios de mercado y sondeos de
opinión. En primer lugar, es necesario dividir la población de referencia en varios
estratos definidos por algunas variables de distribución conocida (como el género
o la edad). Posteriormente se calcula el peso proporcional de cada estrato, es
decir, la parte proporcional de población que representan. Finalmente se multiplica
cada peso por el tamaño de n de la muestra para determinar la cuota precisa en
cada estrato. Se diferencia del muestreo estratificado en que una vez determinada
la cuota, el investigador es libre de elegir a los sujetos de la muestra dentro de
cada estrato.
Muestreo de bola de nieve
Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas,
pero en contacto entre sí. Consiste en identificar sujetos que se incluirán en la
muestra a partir de los propios entrevistados. Partiendo de una pequeña cantidad
de individuos que cumplen los requisitos necesarios, servirán como localizadores
de otros con características análogas.
Muestreo subjetivo por decisión razonada
En este caso las unidades de la muestra se eligen en función de algunas de sus
características de manera racional y no casual. Una variante de esta técnica es
el muestreo compensado o equilibrado, en el que se seleccionan las unidades de
tal forma que la media de la muestra para determinadas variables se acerque a la
media de la población. La cual funciona sobre la base de referencias o por
recomendación, después se reconoce por medio de la estadística.

UNIVERSIDAD DE HUANUCO
Página 6
DISTRIBUCIONES MUESTRALES

Muestreo aleatorio
Población y parámetros
Definición. Se denomina población o universo a la totalidad de personas u
objetos que tienen una o más características medibles o contables de naturaleza
cualitativa o cuantitativa.
La característica medible o contable es una variable estadística cuyo valor,
numérico o no numérico, es una observación.
Si la variable estadística a estudiar es una sola, cada elemento de la población
puede asociarse con una observación. En este sentido, se denomina población al
conjunto de valores posibles de la variable.
Si los elementos de la población se definen en forma aleatoria, entonces la
variable estadística cuantitativa es una variable aleatoria cuyos valores
constituyen
la población. En este caso, la distribución de la población es la distribución de la
variable aleatoria, por lo tanto, la media y la varianza de la variable aleatoria,
vienen a ser la media y la varianza de la población.
Si la variable aleatoria X tiene distribución fix), se puede referir a la población
fix), Por ejemplo, si X está normalmente distribuida se dice que la población está
normalmente distribuida o que se tiene una población normal.
Por el número de observaciones la población puede ser finita de tamaño N, o
infinita. Algunas poblaciones finitas son tan grandes que en teoría son asumidas
como poblaciones infinitas.
Definición. Se denominan parámetros a las medidas descriptivas que caracterizan
a la distribución de la población. Entre otros, los parámetros poblacionales son.
Media: (i
Proporción: n o p
Varianza: a
Desviación estándar: a
En diversas aplicaciones estadísticas al estudiar una población, la variable
aleatoria que la define puede tener distribución conocida o no. La distribución de
la población es conocida, si se conocen sus parámetros y su forma, es decir si se
conoce su distribución de probabilidad.
Si la distribución de la población es desconocida, podemos estar interesados en:
* Estimar sus parámetros, si se conoce su distribución, y
* Probar determinada suposición acerca de un valor determinado del
parámetro, o probar la suposición acerca del tipo de distribución de
probabilidades de la población.

Muestra aleatoria
En vez de examinar la población entera, lo cual puede resultar físicamente
imposible o no práctica, puede examinarse una muestra de la población con el
propósito de inferir los resultados encontrados.
Una muestra es un subconjunto de la población.

UNIVERSIDAD DE HUANUCO
Página 7
El proceso de selección de una muestra de n elementos de la población se
llama muestreo. Las ventajas y las razones para el muestreo son diversas, las
mismas que no explicaremos en este texto.
El proceso que consiste en inferir resultados a la población a partir de la muestra
>e denomina inferencia estadística. La confiabilidad de las conclusiones extraídas
concernientes a una población dependen de si la muestra se ha escogido
apropiadamente de manera que represente bien a la población.
Una técnica para obtener muestras representativas de la población es el muestreo
aleatorio. Se llama muestreo aleatorio a todo proceso que asegure en cualquier
momento del mismo igual probabilidad de ser incluidos en la muestra a todos los
elementos que pertenezcan a la población en dicho momento.
A las muestras aleatorias se les denomina también muestras probabilísticas
Las muestras aleatorias son de 4 tipos: Al azar simple, al azar sistemático,
estratificado y por grupos (o conglomerados).
Muestra al azar simple
Es aquella en la que los elementos se escogen del total de la población en forma
individual con una oportunidad igual e independiente. Por lo general se utiliza una
tabla de números aleatorios.
Si la población es infinita el muestreo aleatorio ocurre cuando la extracción de
el elemento de la muestra se hace con o sin reemplazo. Si la población es finita
de tamaño N, el muestreo aleatorio ocurre también si la extracción es con o sin
reemplazo. Con reemplazo, la probabilidad de cada elemento de ser extraído es
1/N. Si es, sin reemplazo, la probabilidad de cada elemento de ser elegido es 1/N
en
la primera extracción, es de 1/(N-1) en la segunda extracción, es I/(N -2) en la
tercera extracción, etc.
Por ejemplo, seleccionar una muestra al azar simple es similar a la que se
realiza en la extracción aleatoria de números en una lotería.
Muestra al azar sistemática
Una muestra aleatoria sistemática es aquella en que sus elementos se eligen de
la población a intervalos uniformes a partir de un listado ordenado. El fc-ésimo
elemento de la muestra es k=N/n, donde n es el tamaño de la muestra y N el
tamaño
de la población.
Por ejemplo, al elegir una muestra sistemática de 100 alumnos de EE.GG.CC
que tiene 3000 alumnos, k =3000/100 =30. El primero se elige en forma aleatoria
de
los 30 primeros de la lista y los demás sistemáticamente cada 30 alumnos de la
lista.

Muestreo aleatorio estratificado


Primero se clasifican a los elementos de la población en subgrupos separados
de acuerdo con una o más características importantes (estratos). Después se
obtiene
por separado una muestra aleatoria simple o sistemática en cada estrato. El
tamaño

UNIVERSIDAD DE HUANUCO
Página 8
de cada submuestra debe ser proporcional al tamaño del estrato para asegurar
representatividad.
Por ejemplo, para obtener una muestra aleatoria de 600 electores de una
población
de 600,000 electores de los cuales 300,0000 son de clase baja, 200,000 de clase
media
y 100,000 de clase alta. Se deben elegir al azar 300 de clase baja, 200 de clase
media y
100 de clase alta.

Muestreo aleatorio agrupado


Denominado también por conglomerados. Los elementos de la población se
dividen en forma natural en subgrupos. Luego se eligen al azar los subgrupos que
forman la muestra.
Por ejemplo, al estudiar las pensiones que se pagan en los colegios particulares
donde no es posible tener una lista de todas las pensiones, pero puede obtenerse
una
lista de los colegios particulares (grupos). Entonces, con esta lista puede obtener
una muestra aleatoria de colegios y así obtener las pensiones que se pagan en
estos
colegios.
El muestreo aleatorio simple, es pues el proceso de selección de una muestra
por el cual cada uno de los elementos de la población tienen una oportunidad igual
e independiente de ser incluidos en la muestra. En el muestreo aleatorio simple
cada
variable aleatoria X¡ cuyo valor es x¡, tiene la misma distribución de la población
de
la cual se obtiene. Por ejemplo, supongamos que una población consiste de 8
fichas,
dos con el número 2, cuatro con el número 5, y dos con el número 7. Si se extrae
una ficha al azar, la ficha puede tomar cualquiera de los tres valores: 2 con
probabilidad 0.25, 5 con probabilidad 0.50, y 7 con probabilidad 0.25, que viene a
ser la misma distribución de la población.

DISTRIBUCIÓN DE MUESTREO DE LA MEDIA


La distribución muestral de un estadístico es una distribución de probabilidad

UNIVERSIDAD DE HUANUCO
Página 9
constituida por cada uno de los valores que puede asumir el estadístico en todas
las muestras de tamaño n posibles de extraer sin reposición en una población de
tamaño N. Dados los valores de la población y la muestra el numero de
muestras posibles a extraer se calcula como combinación

Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una


población grande. Se calcula la media muestral X para cada muestra; la
colección de todas estas medias muestrales recibe el nombre de distribución
muestral de medias.

La distribución muestral de las medias muéstrales asume como la media el valor


del parámetro poblacional µ y la desviación típica de la distribución muestral
demedias- denominado error estándar o error típico.
El Teorema del Límite Central también nos indica que cuando se extraen
muestras de tamaño mayor a 30 o bien de cualquier tamaño pero provenientes
de una población normal, la distribución muestral de medias tiene un
comportamiento aproximadamente normal, por lo que se puede utilizar la fórmula
de la distribución normal con:

puede conocerse empíricamente, según se ha visto, efectuando dos


operaciones. A saber, extrayendo todas las muestras posibles de tamaño n de
una población de tamaño N y calculando para cada muestra la media y
probabilidad asociada.

Aplicaciones: Una aplicación muy corriente y útil de la distribución muestral es


determinar la probabilidad de que la media de una muestra caiga dentro de un
intervalo determinado. Puesto que la distribución muestral seguirá una
distribución normal (ya sea porque la muestra se toma de una distribución
normal, o porque n "

#_% _teorema del límite central garantice la normalidad en el proceso de


muestreo), se podrá utilizar la variable tipificada para obtener la información
necesaria en la toma de decisiones.
Sobre el Error Estándar:
Error estándar de la media: Es la desviación estándar de la distribución de
muestreo de la media, por lo que mide el grado en que se espera que varíen las
medias de las diferentes muestras de la media de la población, debido al error
aleatorio en el proceso de muestreo.

UNIVERSIDAD DE HUANUCO
Página 10
Distribución muestral de la media (signa) conocida y
desconocida
El comportamiento de la media muestral y ésta depende tanto del valor de la
media poblacional, como de la varianza poblacional, parece lógico pensar que si
nuestro interés radica en inferir comportamientos de la población partiendo de la
muestra parece ilógico pensar que conozcamos la varianza
De ahí la importancia de establecer una distribución para la media muestral que
la relacione únicamente con la poblacional, lo que hará que conocida la muestral
concreta podamos aventurar el comportamiento de la poblacional.
Así tendríamos:

Lo que le da lugar a :

Hemos visto sin demostrar que :

Conocemos que simplificando

tendríamos:

Una distribución muestral es una distribución de probabilidad de una estadística


muestral calculada a partir de todas las muestras posibles del tamaño “n”
elegidas al azar de una población determinada

UNIVERSIDAD DE HUANUCO
Página 11
Distribución Muestral de Medias

UNIVERSIDAD DE HUANUCO
Página 12
Si recordamos a la distribución normal, esta es una distribución continua, en
forma de campana en donde la media, la mediana y la moda tienen un mismo
valor y es simétrica.

Con esta distribución podíamos calcular la probabilidad de algún evento


relacionado con la variable aleatoria, mediante la siguiente fórmula:

En donde z es una variable estandarizada con media igual a cero y varianza


igual a uno. Con esta fórmula se pueden a hacer los cálculos de probabilidad
para cualquier ejercicio, utilizando la tabla de la distribución z.

Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien de


cualquier tamaño de una población normal, la distribución muestral de medias
tiene un comportamiento aproximadamente normal, por lo que se puede utilizar
la fórmula de la distribución normal con y , entonces la fórmula
para calcular la probabilidad del comportamiento del estadístico, en este caso la
media de la muestra, quedaría de la siguiente manera:

y para poblaciones finitas y muestro con reemplazo:

Ejemplo:

Una empresa eléctrica fabrica focos que tienen una duración que se distribuye
aproximadamente en forma normal, con media de 800 horas y desviación
estándar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de
16 focos tenga una vida promedio de menos de 775 horas.

Solución:

UNIVERSIDAD DE HUANUCO
Página 13
Este valor se busca en la tabla de z

La interpretación sería que la probabilidad de que la media de la muestra de 16


focos sea menor a 775 horas es de 0.0062.

Ejemplo:

Las estaturas de 1000 estudiantes están distribuidas aproximadamente en forma


normal con una media de 174.5 centímetros y una desviación estándar de 6.9
centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin reemplazo
de esta población, determine:

a. El número de las medias muestrales que caen entre 172.5 y 175.8


centímetros.
b. El número de medias muestrales que caen por debajo de 172
centímetros.

Solución:

Como se puede observar en este ejercicio se cuenta con una población finita y
un muestreo sin reemplazo, por lo que se tendrá que agregar el factor de
corrección. Se procederá a calcular el denominador de Z para sólo sustituirlo en
cada inciso.

a.

UNIVERSIDAD DE HUANUCO
Página 14
(0.7607)(200)=152 medias muestrales

b.

(0.0336)(200)= 7 medias muestrales

Distribución muestral de Proporciones


Existen ocasiones en las cuales no estamos interesados en la media de la
muestra, sino que queremos investigar la proporción de artículos defectuosos o
la proporción de alumnos reprobados en la muestra. La distribución muestral de
proporciones es la adecuada para dar respuesta a estas situaciones. Esta
distribución se genera de igual manera que la distribución muestral de medias, a
excepción de que al extraer las muestras de la población se calcula el
estadístico proporción (p=x/n en donde "x" es el número de éxitos u
observaciones de interés y "n" el tamaño de la muestra) en lugar del estadístico
media.

UNIVERSIDAD DE HUANUCO
Página 15
Una población binomial está estrechamente relacionada con la distribución
muestral de proporciones; una población binomial es una colección de éxitos y
fracasos, mientras que una distribución muestral de proporciones contiene las
posibilidades o proporciones de todos los números posibles de éxitos en un
experimento binomial, y como consecuencia de esta relación, las afirmaciones
probabilísticas referentes a la proporción muestral pueden evaluarse usando la
aproximación normal a la binomial, siempre que np 5 y
n(1-p) 5. Cualquier evento se puede convertir en una proporción si se divide el
número obtenido entre el número de intentos.

Generación de la Distribución Muestral de Proporciones

Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos


defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo.
Genere la distribución muestral de proporciones para el número de piezas
defectuosas.

Como se puede observar en este ejercicio la Proporción de artículos defectuosos


de esta población es 4/12=1/3. Por lo que podemos decir que el 33% de las
piezas de este lote están defectuosas.

El número posible de muestras de tamaño 5 a extraer de una población de 12


elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera:

Número de
Proporción de maneras en las
Artículos Artículos
artículos que se puede
Buenos Malos
defectuoso obtener la
muestra

1 4 4/5=0.8 8C1*4C4=8

UNIVERSIDAD DE HUANUCO
Página 16
2 3 3/5=0.6 8C2*4C3=112

3 2 2/5=0.4 8C3*4C2=336

4 1 1/5=0.2 8C4*4C1=280

5 0 0/5=0 8C5*4C0=56

Total 792

Para calcular la media de la distribución muestral de proporciones se tendría que


hacer la sumatoria de la frecuencia por el valor de la proporción muestral y
dividirla entre el número total de muestras. Esto es:

Como podemos observar la media de la distribución muestral de proporciones es


igual a la Proporción de la población.

p =P

También se puede calcular la desviación estándar de la distribución muestral de


proporciones:

La varianza de la distribución binomial es 2=npq, por lo que la varianza de la


distribución muestral de proporciones es 2 =(Pq)/n. Si se sustituyen los
p
valores en esta fórmula tenemos que:

, este valor no coincide con el de


0.1681, ya que nos falta agregar el factor de corrección para una población finita
y un muestreo sin reemplazo:

UNIVERSIDAD DE HUANUCO
Página 17
La fórmula que se utilizará para el cálculo de probabilidad en una distribución
muestral de proporciones está basada en la aproximación de la distribución
normal a la binomial. Esta fórmula nos servirá para calcular la probabilidad del
comportamiento de la proporción en la muestra.

A esta fórmula se le puede agregar el factor de corrección de si se


cumple con las condiciones necesarias.

Ejemplo:

Se ha determinado que 60% de los estudiantes de una universidad grande


fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la
probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos
sea menor que 0.55.

Solución:

Este ejercicio se puede solucionar por dos métodos. El primero puede ser con la
aproximación de la distribución normal a la binomial y el segundo utilizando la
fórmula de la distribución muestral de proporciones.

Aproximación de la distribución normal a la binomial:

Datos:

UNIVERSIDAD DE HUANUCO
Página 18
n=800 estudiantes

p=0.60

x= (.55)(800) = 440 estudiantes

p(x< 440) = ?

Media= np= (800)(0.60)= 480

p(x< 440) = 0.0017. Este valor significa que existe una probabilidad del 0.17% de
que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos.

Distribución Muestral de Proporciones

Datos:

n=800 estudiantes

P=0.60

p= 0.55

p(p< 0.55) = ?

UNIVERSIDAD DE HUANUCO
Página 19
Observe que este valor es igual al obtenido
en el método de la aproximación de la distribución normal a la binomial, por lo
que si lo buscamos en la tabla de "z" nos da la misma probabilidad de 0.0017.
También se debe de tomar en cuenta que el factor de corrección de 0.5 se esta
dividiendo entre el tamaño de la muestra, ya que estamos hablando de una
proporción.

La interpretación en esta solución, estaría enfocada a la proporción de la


muestra, por lo que diríamos que la probabilidad de que, al extraer una muestra
de 800 estudiantes de esa universidad, la proporción de estudiantes que fuman
cigarrillos sea menor al 55% es del 0.17%.

Ejemplo:

Un medicamento para malestar estomacal tiene la advertencia de que algunos


usuarios pueden presentar una reacción adversa a él, más aún, se piensa que
alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de
150 personas con malestar estomacal usa el medicamento, encuentre la
probabilidad de que la proporción de la muestra de los usuarios que realmente
presentan una reacción adversa, exceda el 4%.

a. Resolverlo mediante la aproximación de la normal a la binomial


b. Resolverlo con la distribución muestral de proporciones

a. Aproximación de la distribución normal a la binomial:

Datos:

n=150 personas

p=0.03

x= (0.04)(150) = 6 personas

p(x>6) = ?

UNIVERSIDAD DE HUANUCO
Página 20
Media = np= (150)(0.03)= 4.5

p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17%
de que al extraer una muestra de 150 personas, más de 6 presentarán
una reacción adversa.

b. Distribución Muestral de Proporciones

Datos:

n=150 personas

P=0.03

p= 0.04

p(p>0.04) = ?

UNIVERSIDAD DE HUANUCO
Página 21
Observe que este valor es igual al obtenido y la interpretación es: existe una
probabilidad del 17% de que al tomar una muestra de 150 personas se tenga
una proporción mayor de 0.04 presentando una reacción adversa.

Ejemplo:

Se sabe que la verdadera proporción de los componentes defectuosos


fabricadas por una firma es de 4%, y encuentre la probabilidad de que una
muestra aleatoria de tamaño 60 tenga:

a. Menos del 3% de los componentes defectuosos.


b. Más del 1% pero menos del 5% de partes defectuosas.

Solución:

a. Datos:

n= 60 artículos

P=0.04

p= 0.03

p(p<0.03) = ?

La probabilidad de que en una muestra de 60 artículos exista una


proporción menor de 0.03 artículos defectuosos es de 0.2327.

UNIVERSIDAD DE HUANUCO
Página 22
b. Datos:

n= 60 artículos

P=0.04

p= 0.01 y 0.05

p(0.01<p<0.05) = ?

DISTRIBUCIÓN DE LA MEDIA MUESTRAL CON VARIANZA DESCONOCIDA


En apartados anteriores estudiamos el comportamiento de la media muestral y
vimos que ésta dependía tanto del valor de la media poblacional , como de la
varianza poblacional , parece lógico pensar que si nuestro interés radica en inferir
comportamientos de la población partiendo de la muestra parece ilógico pensar
que conozcamos la varianza . De ahí la importancia de establecer una distribución
para la media muestral que la relacione únicamente con la poblacional, lo que hará
que conocida la muestral concreta podamos aventurar el comportamiento de la
poblacional.
Así tendríamos:

lo que da lugar a :

hemos visto sin demostrar que

UNIVERSIDAD DE HUANUCO
Página 23
conocemos

que luego simplificando tendríamos

expresión que relaciona ambas medias y la varianza muestral con


una distribución conocida

Distribución Muestral de Proporciones


Existen ocasiones en las cuales no estamos interesados en la media de una
muestra, sino que queremos investigar la proporción de personas con cierta
preferencia, etc en la muestra. La distribución muestral de proporciones es la
adecuada para dar respuesta a estas situaciones.
Esta distribución se genera de igual manera que la distribución muestral
demedias, a excepción de que al extraer las muestras de la población se calcula
el estadístico proporción (p=x/n en donde “x” es el número de éxitos u
observaciones de interés y “n” el tamaño de la muestra) en lugar de la media de
cada muestra que era lo que calculamos antes. La distribución muestral de
proporciones está estrechamente relacionada con la distribución binomial; una
distribución binomial es una distribución del total de éxitos en las muestras,
mientras que una distribución de proporciones es la distribución de un promedio
(media) de los éxitos.
El muestreo puede hacerse con o sin reposición, y la población de partida puede
ser infinita o finita. Una población finita en la que se efectúa muestreo con
reposición puede considerarse infinita teóricamente. También, a efectos
prácticos, una población muy grande puede considerarse como infinita. En todo
nuestro estudio vamos a limitarnos a una población de partida infinita o a
muestreo con reposición.
Consideremos todas las posibles muestras de tamaño n en una población. Para
cada muestra podemos calcular un estadístico (media, desviación típica,
proporción,) que variará de una a otra. Así obtenemos una distribución del
estadístico que se llama distribución muestral.
Las dos medidas fundamentales de esta distribución son la media y la
desviación típica, también denominada error típico.
Hay que hacer notar que si el tamaño de la muestra es lo suficientemente
grande las distribuciones muéstrales son normales y en esto se basarán todos
los resultados que alcancemos.
En numerosas ocasiones se plantea estimar una proporción o porcentaje. En

UNIVERSIDAD DE HUANUCO
Página 24
estos casos la variable aleatoria toma solamente dos valores diferentes (éxito o
fracaso), es decir sigue una distribución binomial y cuando la extensión de la
población es grande la distribución binomial B(n,p) se aproxima a la normal .
Para muestras de tamaño n>30, la distribución muestral de proporciones sigue
una distribución normal

Varianza
En teoría de probabilidad, la varianza o variancia (que suele representarse como ) de
una variable aleatoria es una medida de dispersión definida como la esperanza del cuadrado
de la desviación de dicha variable respecto a su media. O en pocas palabras, es la media de
los residuos al cuadrado.
Su unidad de medida corresponde al cuadrado de la unidad de medida de la variable: por
ejemplo, si la variable mide una distancia en metros, la varianza se expresa en metros al
cuadrado. La varianza tiene como valor mínimo 0. La desviación estándar (raíz cuadrada de
la varianza) es una medida de dispersión alternativa, expresada en las mismas unidades que
los datos de la variable objeto de estudio.
Hay que tener en cuenta que la varianza puede verse muy influida por los valores atípicos y
no se aconseja su uso cuando las distribuciones de las variables aleatorias tienen colas
pesadas. En tales casos se recomienda el uso de otras medidas de dispersión más robustas.

UNIVERSIDAD DE HUANUCO
Página 25