You are on page 1of 8

Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 1



Actividad 1:

Considere la Encuesta Permanente de Hogares y utilice las estrategias descriptivas que
considere adecuadas para responder las siguientes cuestiones de investigacin:
1. Se desean comparar la antigedad de los jefes de hogar entre varones y mujeres.
2. Se pretende estudiar si existe relacin entre el sueldo y la antigedad de los jefes de hogar. Si
sospecha que dicha relacin puede ser distinta para varones y mujeres cmo trabajara?
3. Se desea indagar si existe asociacin entre el sexo de los jefes de hogar y la categora
ocupacional (variable USTED).

1.

Medidas resumen

SEXO Variable n Media D.E. CV Mn Mx Mediana Q1 Q3
Mujer ANTIGUE 54 12,96 10,87 83,84 1,00 35,00 10,00 3,00 23,00

Varn ANTIGUE 46 9,30 8,33 89,49 0,00 36,00 7,00 3,00 14,00




Para la comparacin de la antigedad de los jefe de hogar, primeramente he obtenido las
medidas resumen de la variable antigedad en funcin del sexo (varn y mujer). Un detalle
importante es que los tamaos de muestra no son iguales, en el caso de las mujeres, n=54 y en el
caso de los hombres n=46, por lo que la medida de variabilidad ms conveniente es el
coeficiente de variacin.
Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 2

Para el caso de la antigedad en mujeres, se obtiene un CV de 0,8384 lo que indica una alta
variabilidad de los datos, teniendo en cuenta que la media hallada es de 12,96 y el desvo de 10,
87 ambas expresadas en aos.
Para el caso de la antigedad en varones, se obtiene un CV de 0,8949 lo que indica una
variabilidad un poco ms alta respecto de la variabilidad encontrada en la antigedad en
mujeres. Para dicha clasificacin, la media encontrada es de 9,30 y el desvo de 8,33, ambas
expresadas en aos. Para este conjunto de datos si se detecta a partir del boxplot la presencia de
observaciones extremas como es el caso de registrar una antigedad superior al patrn o rango
de valores ms comunes (se registra una antigedad para un trabajador de 36 aos).
En el caso de los varones, la mediana y la media son ms cercanas que en el caso de las mujeres,
lo que indicara una idea de una distribucin ms simtrica para los varones.
El rango de valores para la antigedad en mujeres es de 20 aos, mientras que para los varones
es de 10 aos.
2.

Coeficientes de correlacin


SEXO = Mujer
Correlacin de Pearson: Coeficientes\probabilidades

SUELDO ANTIGUE
SUELDO 1,00 0,03
ANTIGUE 0,29 1,00









Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 3


SEXO = Varn
Correlacin de Pearson: Coeficientes\probabilidades

SUELDO ANTIGUE
SUELDO 1,00 2,5E-03
ANTIGUE 0,44 1,00



A partir de los valores calculados se visualiza que hay una asociacin de tipo lineal dbil entre
las variables Sueldo y Antigedad para el sexo femenino, el coeficiente arroja un valor de 0,29,
mientras que para el caso de los hombres tomando las mismas variables, el coeficiente arroja un
valor de 0,44 que indica una asociacin un poco ms fuerte entre las variables.
De igual forma en ninguna de las dos relaciones obtenidas se evidencia una asociacin lineal
que sea concluyente, es decir, un ajuste lineal no sera demasiado apropiado en estos casos.
3.
Actividad 2:
De un lote que contiene 20 artculos, 4 son defectuosos. Se eligen al azar 5 artculos. Sea X el
nmero de artculos defectuosos encontrados. Indique la funcin de cuanta de X y calcule la
probabilidad de que se encuentren 3 artculos defectuosos sabiendo que:
a) Los artculos se escogen con reemplazo
Para este caso, consideremos X: Variable que cuenta el nmero de defectuosos en la muestra.
Como el muestreo se hace con reemplazo, tenemos que , luego se tiene
que la funcin de cuanta para X es:
{
(



Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 4

Con respecto a la probabilidad pedida se tiene que:

b) Los artculos se escogen sin reemplazo
Para este caso, consideremos X: Variable que cuenta el nmero de defectuosos en la muestra.
Como el muestreo se hace sin reemplazo, tenemos que , luego
se tiene que la funcin de cuanta para X es:

(

)(

)
(

)

Con respecto a la probabilidad pedida se tiene que:

Actividad 3:
Considere el lote de artculos del ejercicio anterior. Se extraen con reemplazo piezas hasta que
aparecen 3 defectuosos. Considere la variable aleatoria nmero de artculos extrados hasta
la aparicin de 3 defectuosos. Mencione la distribucin de probabilidad y calcule la
esperanza y varianza.
En este caso se tiene que por la descripcin de la variable aleatoria, la misma cuenta el nmero
de intentos previos a la obtencin de los 3 artculos defectuosos (xito), por lo que la variable
. Es decir una distribucin binomial negativa con parmetro r=3
(siendo r la cantidad de xitos que se desean obtener) y p la probabilidad de obtener un
defectuoso que en nuestro caso sera el xito.
Para este caso, se tiene que:


Actividad 4:
Se supone que el 60% de una poblacin de consumidores prefiere una marca particular de
cepillo de dientes. Cul es la probabilidad de que se tengan que entrevistar exactamente 4
personas para encontrar el primer consumidor que prefiere dicha marca?
Como X cuenta la cantidad de personas a entrevistar antes de encontrar el primer consumidor se
tiene que .
Como exactamente se realizaron 4 entrevistas antes de encontrar el primer consumidor, tenemos
que ocurrieron 5 intentos puesto que los 4 anteriores correspondieron a las entrevistas, luego la
probabilidad pedida es:
Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 5




Actividad 5:

El promedio de automviles que ingresan por un tnel es de 0,5 por minuto. Si un nmero
excesivo de vehculos entra al tnel en un perodo corto, se produce una situacin peligrosa.
Encuentre la probabilidad de que el nmero de vehculos que ingresa al tnel en un perodo de 2
minutos exceda de 3.
En este caso, la variable aleatoria , adems se sabe que , donde c es la
tasa media de ocurrencia por unidad de tiempo.
Para esta actividad nosotros debemos encontrar la probabilidad pedida en un periodo de 2
minutos, luego se tiene que .
Para este caso entonces , entonces la probabilidad buscada es:


Actividad 6:
Un estudio de las filas de clientes en las cajas registradoras de un hipermercado de la ciudad
revel que el tiempo de espera se distribuye exponencial con media de 15 minutos. Determine la
probabilidad que:
a) Un cliente tenga que esperar entre 5 y 10 minutos.
b) Un cliente tenga que esperar ms de 20 minutos.
c) Un cliente tenga que esperar ms de 20 minutos dado que ya lleva esperando ms de 10
minutos. Compare con el resultado obtenido en el inciso anterior e interprete.

Sea la variable tiempo de espera, luego
a)
b)
c)
Actividad 7:
Un estudio realizado en escuelas pblicas de nivel medio de la ciudad de Crdoba sobre cultura
general sugiere que las puntuaciones obtenidas por los alumnos siguen una distribucin normal
con media de 65 puntos y desviacin estndar de 18 puntos. Si se elige un estudiante al azar:
a) Calcular la probabilidad que tenga un puntaje superior a 87.
b) Calcular la probabilidad que tenga un puntaje inferior a 55.
c) Si se desea clasificar a los estudiantes en tres grupos (de baja cultura general, de cultura
general aceptable y de excelente cultura general) de modo que hay en el primer grupo
un 20% de estudiantes, un 65% en el segundo y un 15% en el tercero. Por debajo de
Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 6

que puntuacin se debe encontrar un alumno para estar incluido en el grupo de baja
cultura general?

Sea X variable aleatoria,
a)
b)
c) luego se tiene que , es decir que el alumno se
debe encontrar por debajo de los 50 puntos para encontrarse en el grupo de baja cultura
general.

Actividad 8:
Una fbrica de gaseosas produce entre 1000 y 2000 litros diarios. Se ha observado que la
produccin en litros sigue una distribucin Uniforme. Si se elige un da al azar, calcule:
a) La probabilidad que la produccin sea mayor a 1200 litros.
b) La proporcin de das que puede esperarse una produccin entre 1200 y 1500 litros.

Sea X: Produccin de gaseosas en litros
Por enunciado sabemos que , luego:
a)
b) Comencemos por determinar la probabilidad de que la produccin sea mayor de 1200 y
menor que 1500 litros, es decir, vamos a calcular:




Luego, en 30 das el nmero de das que se puede esperar esta produccin es una variable
aleatoria binomial .
Por lo que la cantidad de das esperados en los cuales la produccin est entre 1200 y 1500
litros es de .

Actividad 9:

Se ha observado que la cantidad de lquido dosificado por una mquina embotelladora est
distribuida normalmente con media de 380 ml y desviacin estndar de 10 ml. Se seleccionan al
azar botellas de la produccin de dicha mquina y se mide la cantidad de lquido contenido (en
ml).
a) Se elige una botella al azar: especifique la distribucin de probabilidad que
corresponde al experimento y obtenga la probabilidad de que contenga entre 355 y 405
ml.
b) Se selecciona al azar una muestra de 9 botellas y se informa el contenido promedio de
las botellas: establezca la distribucin de la variable media muestral y obtenga la
Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 7

probabilidad de que el resultado obtenido difiera del promedio poblacional en menos de
10 ml.


Sea X: Cantidad de lquido dosificado por una mquina, luego

A partir de esto en el inciso a) se pide obtener la probabilidad de que la botella contenga entre
355 y 405 ml, es decir:


El procedimiento terico sera estandarizar la variable X y luego buscar las probabilidades
acumuladas en la tabla de una normal estndar, en nuestro caso, presentaremos el procedimiento
pero las probabilidades las calcularemos directamente con Infostat:
(

)


Luego la probabilidad buscada es:



A partir de Infostat tenemos que:


Para el inciso b) se pide identificar la distribucin de la media muestral dada una muestra de
tamao , de una distribucin normal.

Para ello utilizaremos el siguiente resultado terico:

Si

es una muestra aleatoria de una

entonces



Luego como se tiene que



Luego la probabilidad pedida ser:




Actividad 10:

Una consultora piensa que el 20 % de los votantes de cierta ciudad estn a favor de la emisin
de bonos. Si 64 votantes se muestrean aleatoriamente de entre un gran nmero de electores de
esa ciudad, calcule la probabilidad de que la proporcin de votantes que estn a favor de la
emisin de bonos no difiera en ms de 0,06 (6 %) de la proporcin verdadera.

Tomando y teniendo en cuenta que ,
podemos hallar la probabilidad en cuestin en forma aproximada usando la distribucin normal:

Para ello vamos a considerar el estadstico:


Introduccin al Anlisis Estadstico 2014

Ganga, Leonel Pgina 8

Luego, la probabilidad pedida es:

| |
De donde se obtiene que:

You might also like