You are on page 1of 19

ESTIMACIÓN DE PARÁMETROS

El objetivo de muchas actividades de investigación precisa la estimación de características


numéricas de una o más poblaciones. Las estimaciones de parámetros, como el ingreso medio
por hogar o la proporción de personas con educación superior en una ciudad se hacen efectivas
usando muestras de una población.

INTERVALOS DE CONFIANZA (IC)


Es un conjunto de valore obtenidos a partir de datos muestrales en los que hay una determinada
probabilidad de que se encuentre el parámetro a estimar. A esta probabilidad se le conoce como
Nivel de confianza. Los niveles de confianza más usados son 0.90, 0.95, 0.99.

Así, un IC es un intervalo de valores que se usan para estimar el valor real de un parámetro de
la población.

α = Nivel de error

1-α = Nivel de confianza

Un intervalo de confianza del (1-∝)% es un intervalo 〈𝑎𝑎, 𝑏𝑏〉 que cumple:

𝑃𝑃(𝑎𝑎 < 𝑝𝑝𝑝𝑝𝑝𝑝á𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 < 𝑏𝑏) = 1−∝


Margen de Error (E)

Es la diferencia máxima probable (con probabilidad 1-α) entre el estadístico y el parámetro.

El margen de error E también se conoce como error máximo del estimado.

Se puede interpretar como el máximo E tal que

𝑃𝑃(|𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒 − 𝑝𝑝𝑝𝑝𝑝𝑝á𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚| ≤ 𝐸𝐸) = 1 − 𝛼𝛼

I.C. para la media poblacional µ y muestra grande (n≥30)


Sean:

𝑋𝑋�: Media muestral (estadístico)

𝜇𝜇: Media poblacional (parámetro)

𝜎𝜎: Desviación estándar

𝑠𝑠: Desviación muestral

N: Tamaño de la población
n: Tamaño de la muestra
Se usa 𝑋𝑋� como el mejor estimador para µ
Supuestos:

Error estándar de la media muestral

EE para población infinita EE para población finita (𝑛𝑛 ≥ 0.05𝑁𝑁)


𝜎𝜎
σ𝑥𝑥̅ = 𝜎𝜎𝑁𝑁 − 𝑛𝑛
√𝑛𝑛 σ𝑥𝑥̅ = �
√𝑛𝑛 𝑁𝑁 − 1

𝑁𝑁−𝑛𝑛
donde� se conoce como factor de corrección por población finita.
𝑁𝑁−1

𝑋𝑋�~𝑁𝑁(𝜇𝜇, 𝜎𝜎 2 /𝑛𝑛)
𝑥𝑥̅ − 𝜇𝜇
𝑍𝑍 = 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑍𝑍~𝑁𝑁(0,1)
σ𝑥𝑥̅

I.C.: 〈𝑎𝑎, 𝑏𝑏〉 = 〈𝑋𝑋� − 𝑍𝑍1−∝/2 𝜎𝜎𝑥𝑥̅ , 𝑋𝑋� + 𝑍𝑍1−∝/2 𝜎𝜎𝑥𝑥̅ 〉

IC para población infinita 𝜎𝜎 𝜎𝜎


〈𝑋𝑋� − 𝑍𝑍1−∝/2 , 𝑋𝑋� + 𝑍𝑍1−∝/2 〉
√𝑛𝑛 √𝑛𝑛
IC para población finita
𝑁𝑁 − 𝑛𝑛 𝜎𝜎 𝜎𝜎 𝑁𝑁 − 𝑛𝑛
� , 𝑋𝑋� + 𝑍𝑍1−∝/2
〈𝑋𝑋� − 𝑍𝑍1−∝/2 � 〉
√𝑛𝑛 𝑁𝑁 − 1 √𝑛𝑛 𝑁𝑁 − 1
Nota: Dado que la muestra es grande (𝑛𝑛 ≥ 30) se puede usar s si no se conoce 𝜎𝜎

𝑁𝑁−𝑛𝑛
Nota: Por lo general resulta aceptable eliminar el factor de corrección por población finita�
𝑁𝑁−1
(aunque esto depende en última instancia del estudio específico que se realiza) cuando la razón
del tamaño de la muestra al tamaño de la población es menor o igual a 0.05. En símbolos,
cuando,
𝑛𝑛
≤ 0.05
𝑁𝑁

Longitud del intervalo de confianza para una población infinita:


𝜎𝜎 𝜎𝜎 2𝑍𝑍1−∝/2 𝜎𝜎
𝐿𝐿 = 𝑏𝑏 − 𝑎𝑎 = (𝑋𝑋� + 𝑍𝑍1−∝/2 ) − (𝑋𝑋� − 𝑍𝑍1−∝/2 )=
√𝑛𝑛 √𝑛𝑛 √𝑛𝑛

Margen de error 𝐸𝐸 = |𝑋𝑋� − 𝜇𝜇|

𝑃𝑃(|𝑋𝑋� − 𝜇𝜇| ≤ 𝐸𝐸) = 1 − 𝛼𝛼


𝑃𝑃(−𝐸𝐸 ≤ 𝑋𝑋� − 𝜇𝜇 ≤ 𝐸𝐸) = 1 − 𝛼𝛼
−𝐸𝐸 𝐸𝐸
𝑃𝑃 � ≤ 𝑍𝑍 ≤ � = 1 − 𝛼𝛼
𝜎𝜎/√𝑛𝑛 𝜎𝜎/√𝑛𝑛
−𝐸𝐸 𝐸𝐸
𝑃𝑃 � ≤ 𝑍𝑍 ≤ � = 1 − 𝛼𝛼
𝜎𝜎/√𝑛𝑛 𝜎𝜎/√𝑛𝑛
𝐸𝐸
= 𝑍𝑍1−𝛼𝛼/2
𝜎𝜎/√𝑛𝑛

𝑍𝑍1−𝛼𝛼/2 𝜎𝜎
𝐸𝐸 =
√𝑛𝑛

Tamaño de la muestra:

Población infinita
𝑍𝑍1−𝛼𝛼/2 𝜎𝜎 2
𝑛𝑛 = � �
𝐸𝐸

Población finita de tamaño N 2


𝑍𝑍1−𝛼𝛼/2 𝜎𝜎 2 𝑁𝑁
𝑛𝑛 = 2
(𝑁𝑁 − 1)𝐸𝐸 2 + 𝑍𝑍1−𝛼𝛼/2 𝜎𝜎 2
Ejemplo 0:

El gasto promedio de los turistas que vienen a Lima sigue una distribución normal con
desviación de 100 dólares. Se desea construir un intervalo de confianza del 95% para el
gasto promedio de los turistas que visitan Lima. Para esto se encuestó a 400 turistas y
se encontró que el gasto promedio fue de $1200.

𝑋𝑋�=1200

𝜇𝜇: Gasto promedio de todos los turistas que visitan Lima

𝜎𝜎:=100

n=400
α=0.05

1-α=0.95 => 1- α/2=0.975

Z1- α/2 = Z0.975 = P[Z< Z0.975]=0.975 => Z0.975 = 1.96

I.C. del 95%

𝜎𝜎 𝜎𝜎
〈𝑋𝑋� − 𝑍𝑍1−∝/2 , 𝑋𝑋� + 𝑍𝑍1−∝/2 〉
√𝑛𝑛 √𝑛𝑛
100 100
〈1200 − 1.96 ,1200 + 1.96 〉
√400 √400
100 100
〈1200 − 1.96 ,1200 + 1.96 〉
√400 √400
〈1190.20, 1209.80〉

Con una certeza del 95%, el gasto promedio de todos los turistas que visitan Lima estará entre $1190.20 y $1209.80. Hay una

probabilidad de 5% de que esté equivocado con esta afirmación.

𝑍𝑍1−𝛼𝛼/2 𝜎𝜎 1.96×100
Error de estimación 𝐸𝐸 = = = 9.8
√𝑛𝑛 √400

La diferencia entre la media muestral y la media poblacional no pasa de $9.8


Ahora se quisiera que la diferencia entre la media muestral y la media poblacional no
sobrepase los $5 con el mismo nivel de confianza del 95%

𝑃𝑃(|𝑋𝑋� − 𝜇𝜇| ≤ 5) = 0.95


𝑃𝑃(−5 ≤ 𝑋𝑋� − 𝜇𝜇 ≤ 5) = 0.95

−5 𝑋𝑋� − 𝜇𝜇 5 𝑋𝑋� − 𝜇𝜇
𝑃𝑃 � ≤ ≤ � = 0.95 ~𝑁𝑁(0,1)
𝜎𝜎/√𝑛𝑛 𝜎𝜎/√𝑛𝑛 𝜎𝜎/√𝑛𝑛 𝜎𝜎/√𝑛𝑛

𝑃𝑃�−𝑍𝑍1−𝛼𝛼/2 ≤ 𝑍𝑍 ≤ 𝑍𝑍1−𝛼𝛼/2 � = 0.95


5 5
= 𝑍𝑍1−𝛼𝛼/2 ⇒ = 1.96 ⇒ 𝑛𝑛 = 1536.64 ≈ 1537 turistas encuestados
𝜎𝜎/√𝑛𝑛 100/√𝑛𝑛

Para encontrar el tamaño de la muestra con un error de estimación E dado podemos usar la fórmula:

𝑍𝑍1−𝛼𝛼/2 𝜎𝜎 2 1.96×100 2
𝑛𝑛 = � 𝐸𝐸
� = � � = 1536.64 ≈ 1537
5

Si el nivel de confianza fuera del 90%:

α=0.10 => α/2=0.05

1-α=0.90 => 1- α/2=1-0.05=0.95

Z0.95=1.64
100 100
〈1200 − 1.64 ,1200 + 1.64 〉
√400 √400
I.C. del 90%: [1191.8, 1208.2]
Ejemplo 1:

El gerente de personal de una empresa grande desea estimar, con una confianza de
95%, el tiempo promedio de capacitación que recibieron los empleados de la compañía
y desea que el error de la estimación no rebase los 30 minutos (0.5 horas). Con base en
resultados de estudios anteriores, estima que la desviación estándar del tiempo de
capacitación de los empleados es de 3 horas.

Sol.
Se debe determinar el tamaño de la muestra.

α=0.05 (nivel de error) => α/2=0.025

1-α=0.95 (nivel de confianza) => 1- α/2 = 1 – 0.025 = 0.975

Z1- α/2 = Z0.975 = P[Z< Z0.975]=0.975 => Z0.975 = 1.96

𝑍𝑍1−𝛼𝛼/2 𝜎𝜎 2 1.96 × 3 2
𝑛𝑛 = � � = � � = 138.30 ≈ 139
𝐸𝐸 0.5
A un nivel de confianza del 95%, si queremos que el error de estimación no sobrepase
la media hora, será necesario encuestar a 139 trabajadores.

Ejemplo 2:

Un gerente de personal de una empresa que tiene 3 000 empleados desea estimar el
tiempo promedio que le lleva a sus trabajadores trasladarse entre sus casas y la
empresa. Desea construir un intervalo de confianza de 95% y que la estimación esté
dentro de un minuto alrededor de la media verdadera; a través de una muestra piloto
se sabe que la varianza de los tiempos es de 30 minutos2. Determine el tamaño de la
muestra que se requiere para hacer la estimación.

E=1 minuto

N=3000

α=0.05

1-α=0.95 => 1- α/2=0.975

𝜇𝜇: tiempo promedio que le lleva a sus trabajadores trasladarse entre sus casas y la
empresa en minutos

𝜎𝜎 2 = 30 ⇒ 𝜎𝜎 = 5.48 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚
Población finita de tamaño N
2
𝑍𝑍1−𝛼𝛼/2 𝜎𝜎 2 𝑁𝑁 1.962 × 30 × 3000
𝑛𝑛 = 2 = = 111.02 ≈ 112
(𝑁𝑁 − 1)𝐸𝐸 2 + 𝑍𝑍1−𝛼𝛼/2 𝜎𝜎 2 (3000 − 1)12 + 1.962 × 30
Ejemplo 2.1

En una población de 3200 estudiantes de la Facultad se tomó una muestra de 300


estudiantes y se encontró que en promedio estudian 3.5 horas diarias con una
desviación de 1.2 horas. Hallara un I.C. del 95% para el tiempo promedio que emplean
los estuantes para sus estudios.

𝜇𝜇: tiempo promedio que utilizan los estudiantes de la facultad para estudiar en horas

𝑥𝑥̅ = 3.5 𝜎𝜎 = 1.2 𝑁𝑁 = 3200 𝑛𝑛 = 300


α=0.05 Nivel de error

1-α = 0.95 Nivel de confianza => 1- α/2=0.975

Z1- α/2 = Z0.975 = P[Z< Z0.975]=0.975 => Z0.975 = 1.96

EE para población finita (𝑛𝑛 ≥ 0.05𝑁𝑁)


𝜎𝜎𝑁𝑁 − 𝑛𝑛
σ𝑥𝑥̅ = �
√𝑛𝑛 𝑁𝑁 − 1

IC para población finita


𝜎𝜎 𝑁𝑁 − 𝑛𝑛 𝜎𝜎 𝑁𝑁 − 𝑛𝑛
〈𝑋𝑋� − 𝑍𝑍1−∝/2 � , 𝑋𝑋� + 𝑍𝑍1−∝/2 � 〉
√𝑛𝑛 𝑁𝑁 − 1 √𝑛𝑛 𝑁𝑁 − 1

1.2 3200 − 300


𝐸𝐸 = 1.96 � = 0.13
√300 3200 − 1

I.C. del 95% del tiempo promedio que dedican los estudiantes de la facultad a estudiar:

[3.5-0.13 , 3.5+0.13] = [3.37, 3.63]


I.C. para la media poblacional µ y muestra pequeña (n<30)
𝑠𝑠 𝑠𝑠
〈𝑋𝑋� − 𝑇𝑇1−∝/2,𝑛𝑛−1 , 𝑋𝑋� + 𝑇𝑇1−∝/2,𝑛𝑛−1 〉
√𝑛𝑛 √𝑛𝑛

I.C. para la media poblacional µ y muestra pequeña (n<30) y σ


conocido
𝜎𝜎 𝜎𝜎
〈𝑋𝑋� − 𝑍𝑍1−∝/2 , 𝑋𝑋� + 𝑍𝑍1−∝/2 〉
√𝑛𝑛 √𝑛𝑛
Condiciones Método
σ desconocida, población normalmente distribuida Use la distribución t de Student
y n < 30
σ conocida y población normalmente distribuida Use la distribución normal (z)
o
σ o s conocida y n ≥ 30
(en realidad, s se conoce pocas veces)
La población no se distribuye normalmente y n ≤ 30 Use el método de bootstrap o un
método no paramétrico

Ejemplo 3:

A continuación se listan los pesos (hectogramos o hg) de niñas seleccionadas al azar en


el momento del nacimiento, según los datos del Centro Nacional de Estadísticas de la
Salud. Los estadísticos de resumen son: n = 15 y 𝑥𝑥̅ = 30.9 hg, s = 2.9 hg. Use los datos
muestrales para construir un intervalo de confianza del 95% para el peso medio de las
niñas.

33 - 28 - 33 - 37 - 31 - 32 - 31 - 28 - 34 - 28 - 33 - 26 - 30 - 31 – 28

Sol.

𝜇𝜇: el peso promedio (en hectogramos o hg) de todas las niñas en el momento del
nacimiento

Como n es menor a 30 y no se conoce la desviación poblacional se utiliza t-student


𝑠𝑠 𝑠𝑠
〈𝑋𝑋� − 𝑇𝑇1−∝/2,𝑛𝑛−1 , 𝑋𝑋� + 𝑇𝑇1−∝/2,𝑛𝑛−1 〉
√𝑛𝑛 √𝑛𝑛
n = 15 y 𝑥𝑥̅ = 30.9 hg, s = 2.9

α=0.05 nivel de error

1-α = 0.95 => 1- α/2=0.975 nivel de confianza


t1- α/2,n-1 = t0.975,14 = P[T< t0.975,14]=0.975 => t0.975,14 = 2.145

𝑠𝑠 2.9
𝐸𝐸 = 𝑇𝑇1−∝/2,𝑛𝑛−1 = 2.145 = 1.61
√𝑛𝑛 √15
𝑠𝑠 𝑠𝑠
〈𝑋𝑋� − 𝑇𝑇1−∝/2,𝑛𝑛−1 , 𝑋𝑋� + 𝑇𝑇1−∝/2,𝑛𝑛−1 〉
√𝑛𝑛 √𝑛𝑛
〈30.9 − 1.61 ,30.9 + 1.61〉 = 〈29.29 ,32.51〉
Con un 95% de confianza, se puede afirmar que el peso promedio (en hectogramos o
hg) de todas las niñas en el momento del nacimiento está entre 29.29 hg y 32.51 hg
Ejemplo 4:

Use los mismos 15 pesos al nacer de niñas que se dieron en el ejemplo anterior, para los
cuales

n = 15 y 𝑥𝑥̅ = 30.9 hg. Construya una estimación del intervalo de confianza del 95% para
el peso promedio al nacer de todas las niñas suponiendo que se sabe que σ es 2.9 hg.

Sol.

Como aunque la muestra es pequeña, al conocer la desviación poblacional podemos usar la


distribución normal:
2.9
𝐸𝐸 = 1.96 = 1.47
√15
𝜎𝜎 𝜎𝜎 2.9 2.9
〈𝑋𝑋� − 𝑍𝑍1−∝/2 , 𝑋𝑋� + 𝑍𝑍1−∝/2 〉 = 〈30.9 − 1.96 ,30.9 + 1.96 〉
√𝑛𝑛 √𝑛𝑛 √15 √15
〈29.43 , 32.37〉

Con un 95% de confianza, se puede afirmar que el peso promedio (en hectogramos o
hg) de todas las niñas en el momento del nacimiento está entre 29.43 hg y 32.37 hg
Ejemplo 5:

Se realizó un estudio en 20 hogares elegidos aleatoriamente en una ciudad grande para


medir la cantidad de agua que utilizaba por hora. Los resultados se muestran en la tabla
siguiente.

Consumo en litros (X) Hogares (f)


50 a menos de 70 1
70 a menos de 90 1
90 a menos de 110 2
110 a menos de 130 3
130 a menos de 150 7
150 a menos de 170 6
Total 20

Haga una estimación de intervalo con un nivel de confianza de 95% para la población
total de hogares.

Sol.

𝜇𝜇: cantidad promedio en litros de agua consumida por los hogares por hora

α=0.05

1-α = 0.95 => 1- α/2=0.975

t1- α/2,n-1 = t0.975,19 = P[T< t0.975,19]=0.975 => t0.975,19 = 2.093


𝑠𝑠 28.58
𝐸𝐸 = 𝑇𝑇1−∝/2,𝑛𝑛−1 = 2.093 = 13.38
√𝑛𝑛 √20
𝑠𝑠 𝑠𝑠
〈𝑋𝑋� − 𝑇𝑇1−∝/2,𝑛𝑛−1 , 𝑋𝑋� + 𝑇𝑇1−∝/2,𝑛𝑛−1 〉
√𝑛𝑛 √𝑛𝑛
〈132 − 13.38 ,132 + 13.38〉 = 〈118.62 ,145.38〉

Con un nivel de confianza del 95% podemos afirmar que los hogares de una ciudad
consumen en promedio entre 118.62 litros y 145.38 litros por hora.
I.C. para la proporción poblacional π
Sean:

𝑝𝑝̅ : Proporción muestral (estadístico)

π: Proporción poblacional (parámetro)

N: Tamaño de la población
n: Tamaño de la muestra
Error estándar de la proporción muestral

EE para población infinita EE para población finita (𝑛𝑛 ≥ 0.05𝑁𝑁)


𝑝𝑝̅ (1 − 𝑝𝑝̅ ) 𝑝𝑝̅ (1 − 𝑝𝑝̅ ) 𝑁𝑁 − 𝑛𝑛
σ𝑝𝑝̅ = � σ𝑝𝑝̅ = � �
𝑛𝑛 𝑛𝑛 𝑁𝑁 − 1

𝑝𝑝̅ − 𝜋𝜋
𝑍𝑍 = 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑍𝑍~𝑁𝑁(0,1)
σ𝑝𝑝̅

IC para población
𝑝𝑝̅ (1 − 𝑝𝑝̅ ) 𝑝𝑝̅ (1 − 𝑝𝑝̅ )
infinita 〈𝑝𝑝̅ − 𝑍𝑍1−∝/2 � , 𝑝𝑝̅ + 𝑍𝑍1−∝/2 � 〉
𝑛𝑛 𝑛𝑛
IC para población
𝑝𝑝̅ (1 − 𝑝𝑝̅ ) 𝑁𝑁 − 𝑛𝑛 𝑝𝑝̅ (1 − 𝑝𝑝̅ ) 𝑁𝑁 − 𝑛𝑛
finita 〈𝑝𝑝̅ − 𝑍𝑍1−∝/2 � � , 𝑝𝑝̅ + 𝑍𝑍1−∝/2 � � 〉
𝑛𝑛 𝑁𝑁 − 1 𝑛𝑛 𝑁𝑁 − 1

Margen de error 𝐸𝐸 = |𝑝𝑝̅ − 𝜋𝜋|

𝑃𝑃(|𝑝𝑝̅ − 𝜋𝜋| ≤ 𝐸𝐸) = 1 − 𝛼𝛼


𝑃𝑃(−𝐸𝐸 ≤ 𝑝𝑝̅ − 𝜋𝜋 ≤ 𝐸𝐸) = 1 − 𝛼𝛼

−𝐸𝐸 𝐸𝐸
𝑃𝑃 ⎛ ≤ 𝑍𝑍 ≤ ⎞ = 1 − 𝛼𝛼
�𝑝𝑝̅ (1 − 𝑝𝑝̅ ) � 𝑝𝑝̅ (1 − 𝑝𝑝̅ )
⎝ 𝑛𝑛 𝑛𝑛 ⎠
𝐸𝐸
= 𝑍𝑍1−𝛼𝛼/2
�𝑝𝑝̅ (1 − 𝑝𝑝̅ )
𝑛𝑛
𝑝𝑝̅ (1 − 𝑝𝑝̅ )
𝐸𝐸 = 𝑍𝑍1−𝛼𝛼/2 �
𝑛𝑛

Tamaño de la muestra:

2
�𝑍𝑍1−𝛼𝛼/2 � 𝑝𝑝̅ (1 − 𝑝𝑝̅ )
𝑛𝑛 =
𝐸𝐸 2

Si no se conoce 𝑝𝑝̅ usar 𝑝𝑝̅ =0.5

Si la población es finita de tamaño N

2
�𝑍𝑍1−𝛼𝛼/2 � 𝑝𝑝̅ (1 − 𝑝𝑝̅ )𝑁𝑁
𝑛𝑛 = 2
(𝑁𝑁 − 1)𝐸𝐸 2 + �𝑍𝑍1−𝛼𝛼/2 � 𝑝𝑝̅ (1 − 𝑝𝑝̅ )
Ejemplo 3:

En una encuesta de opinión, 150 de un total de 400 personas aprueba la gestión del
presidente. Hallar un IC al nivel de confianza del 95% para estimar la proporción π de las
personas que están a favor de la gestión del presidente.

Sol.

π: Proporción de la población que aprueba la gestión presidencial (es lo que se quiere


estimar)

𝑝𝑝̅ : 150/400 = 0.375 = 37.5% Proporción que aprueba la gestión presidencial en la


muestra tomada

n = 400

α=0.05 Nivel de error

1-α = 0.95 => 1- α/2=0.975 Nivel de confianza

Z1- α/2 = Z0.975 = P[Z< Z0.975]=0.975 => Z0.975 = 1.96

IC para población
𝑝𝑝̅ (1 − 𝑝𝑝̅ ) 𝑝𝑝̅ (1 − 𝑝𝑝̅ )
infinita 〈𝑝𝑝̅ − 𝑍𝑍1−∝/2 � , 𝑝𝑝̅ + 𝑍𝑍1−∝/2 � 〉
𝑛𝑛 𝑛𝑛

0.375(1 − 0.375) 0.375(1 − 0.375)


〈0.375 − 1.96� , 0.375 + 1.96� 〉
400 400

〈0.375 − 0.047,0.375 + 0.047〉 = 〈0.328,0.422〉

Margen de error:

𝑝𝑝̅ (1 − 𝑝𝑝̅ )
𝐸𝐸 = 𝑍𝑍1−𝛼𝛼/2 �
𝑛𝑛

0.375(1−0.375)
𝐸𝐸 = 1.96� = 0.047 el margen de error es de 0.047 o 4.7 puntos
400
porcentuales

I.C. del 95% de 𝜋𝜋: 〈0.328,0.422〉

Estoy 95% seguro que la proporción de la población que aprueba la gestión


presidencial está entre el 32.8% y 42.2%
Ejemplo 4:

Se desea realizar una encuesta de mercado para estimar la proporción de amas de casa
que prefieren un nuevo producto como alternativa al producto que vende la
competencia. Se requiere que el error al estimar la proporción no sea mayor de 5 puntos
porcentuales, con un nivel de confianza del 98%. El departamento de ventas estima que
cerca del 25% de las amas de casa podrían preferir el nuevo producto. Si cuesta S/ 1500
poner en marcha la encuesta y cada entrevista cuesta S/ 12 ¿Cuál será el costo total de
la encuesta?

Sol. Se busca determinar el tamaño de la muestra

2
�𝑍𝑍1−𝛼𝛼/2 � 𝑝𝑝̅ (1 − 𝑝𝑝̅ )
𝑛𝑛 =
𝐸𝐸 2

π: Proporción de amas de casa que prefieren el nuevo producto

Margen de error (E)=0.05 (Se requiere que el error al estimar la proporción no sea mayor de 5 puntos
porcentuales)
𝑝𝑝̅ =0.25 (El departamento de ventas estima que cerca del 25% de las amas de casa podrían preferir el nuevo producto)

α=0.02 Nivel de error → α/2 = 0.01

1-α = 0.98 Nivel de confianza => 1- α/2=0.99

Z1- α/2 = Z0.99 = P[Z< Z0.99]=0.99 => Z0.99 = 2.33

(2.33)2 0.25(1 − 0.25)


𝑛𝑛 = = 407.17 ≈ 408
0.052

Si se deben encuestar a 408 amas de casa, el costo total de la encuesta es 1500+12(408)


= S/ 6396.

Ejemplo 5:

Se desea estimar el porcentaje de adultos que realizan compras en línea. Si tiene que
realizar su propia encuesta, ¿cuántos adultos deberían ser encuestados para estar 95%
seguros de que el porcentaje muestral tiene un error no mayor de tres puntos
porcentuales?
a. Suponga que una encuesta reciente mostró que 80% de los adultos realizan compras
en línea.
Se asume 𝑝𝑝̅ = 0.80
b. Suponga que no tenemos información previa que sugiera un posible valor de la
proporción poblacional.
Se asume 𝑝𝑝̅ = 0.50 por defecto al no tener información previa

I.C. para la diferencia de dos medias poblacionales


〈(𝑋𝑋�1 − 𝑋𝑋�2 ) − 𝑍𝑍1−∝/2 𝑆𝑆𝑋𝑋�1 −𝑋𝑋�2 , (𝑋𝑋�1 − 𝑋𝑋�2 ) + 𝑍𝑍1−∝/2 𝑆𝑆𝑋𝑋�1 −𝑋𝑋�2 〉
El procedimiento para construir este tipo de intervalos incluye los mismos 3 elementos que ya
utilizamos:

1. El valor del estadístico muestral, en este caso, la diferencia entre las medias de las 2 muestras.

2. El valor de z que determina el nivel de confianza.

3. El error estándar del estadístico que, en este caso es el error estándar de la diferencia entre
2 medias y que se calcula como:

𝑆𝑆12 𝑆𝑆22
𝑆𝑆𝑋𝑋�1 −𝑋𝑋�2 = � +
𝑛𝑛1 𝑛𝑛2
Ejemplo 6:

Una empresa desea estimar las horas promedio de trabajo a la semana de las áreas de
finanzas y de recursos humanos, para lo cual toma 2 muestras independientes de 130
personas de cada uno de esos departamentos. Del área de finanzas se obtuvo que las horas
de trabajo promedio a la semana son 50 con una desviación estándar de 3 horas; en el área
de recursos humanos este promedio es de 60 horas con una desviación estándar de 2 horas.
Estime la diferencia entre las horas de trabajo de las 2 áreas con un nivel de confianza de 95
por ciento.

Sol:

μ1: Horas promedio de trabajo a la semana de los empleados del área de recursos humanos

μ2: Horas promedio de trabajo a la semana de los empleados del área de finanzas

μ1 -μ2: Diferencia en las horas promedio de trabajo de las áreas

Recursos humanos finanzas


n1=130 n2=130
𝑥𝑥̅1 = 60 𝑥𝑥̅2 = 50
s1 = 2 s2 = 3

α=0.05 Nivel de error

1-α = 0.95 Nivel de confianza => 1- α/2=0.975

Z1- α/2 = Z0.975 = P[Z< Z0.975]=0.975 => Z0.975 = 1.96

I.C. 〈(𝑋𝑋�1 − 𝑋𝑋�2 ) − 𝑍𝑍1−∝/2 𝑆𝑆𝑋𝑋�1 −𝑋𝑋�2 , (𝑋𝑋�1 − 𝑋𝑋�2 ) − 𝑍𝑍1−∝/2 𝑆𝑆𝑋𝑋�1 −𝑋𝑋�2 〉

𝑆𝑆12 𝑆𝑆22
𝑆𝑆𝑋𝑋�1 −𝑋𝑋�2 = � +
𝑛𝑛1 𝑛𝑛2

I.C.

𝑆𝑆 2 𝑆𝑆 2 𝑆𝑆 2 𝑆𝑆 2
〈(𝑋𝑋�1 − 𝑋𝑋�2 ) − 𝑍𝑍1−∝/2 � 1 + 2 , (𝑋𝑋�1 − 𝑋𝑋�2 ) + 𝑍𝑍1−∝/2 � 1 + 2 〉
𝑛𝑛1 𝑛𝑛2 𝑛𝑛1 𝑛𝑛2

〈(60 − 50) − 0.6198, (60 − 50) + 0.6198〉 = 〈9.3802,10.6198〉

𝑆𝑆 2 𝑆𝑆 2 22 32
Margen de error: 𝐸𝐸 = 𝑍𝑍1−∝/2 �𝑛𝑛1 + 𝑛𝑛2 = 1.96 × �130 + 130 = 0.6198
1 2

μ1 -μ2 cae en el intervalo [9.3802, 10.6198]

Al 95% de confianza podemos afirmar que la diferencia en las horas promedio de trabajo de
las áreas está entre 9.38 y 10.62 horas.

Estoy 95% seguro que recursos humanos trabaja en promedio entre 9.38 y 10.61 horas más
que los trabajadores de finanzas
Ejemplo 7:

Un banco desea estimar la diferencia entre el promedio del monto depositado en moneda
nacional entre los clientes de 2 sucursales, toma una muestra aleatoria de 40 clientes de la
sucursal A y otra muestra de igual tamaño de la sucursal B y encuentra que en la primera
sucursal se deposita en promedio $5 000 con una varianza de $600 y, en la sucursal B, $3500
con una varianza (s2) de $700. Construya el intervalo de la diferencia real que existe entre
los depósitos de los clientes de las 2 sucursales con un nivel de confianza de 98 por ciento.

I.C. para la diferencia de dos proporciones poblacionales


〈(𝑝𝑝̅1 − 𝑝𝑝̅2 ) − 𝑍𝑍1−∝/2 × 𝑆𝑆𝑝𝑝̅1 −𝑝𝑝̅2 , (𝑝𝑝̅1 − 𝑝𝑝̅2 ) + 𝑍𝑍1−∝/2 × 𝑆𝑆𝑝𝑝̅1 −𝑝𝑝̅2 〉

Donde el error estándar del estadístico, en este caso el error estándar de la diferencia entre
dos proporciones es:

𝑝𝑝̅1 (1 − 𝑝𝑝̅1 ) 𝑝𝑝̅2 (1 − 𝑝𝑝̅2 )


𝑆𝑆𝑝𝑝̅1 −𝑝𝑝̅2 = � +
𝑛𝑛1 𝑛𝑛2

Ejemplo 8:

En una provincia se realizaron encuestas en 2 distritos, con 2 muestras aleatorias


independientes de 150 personas cada una para saber su opinión acerca de la construcción
de una obra pública; se encontró que en el distrito A, 90 personas están en favor de la obra;
en el distrito B hay 75 personas en favor. Construya los límites de confianza para la diferencia
entre las proporciones de todos los habitantes de los 2 distritos que están en favor de la
obra con un nivel de confianza de 90 por ciento.

π1: Proporción de personas del distrito A que están de acuerdo con la obra

π2: Proporción de personas del distrito B que están de acuerdo con la obra

𝑝𝑝̅1 : Proporción de personas en la muestra tomada del distrito A que están de acuerdo con
la obra

𝑝𝑝̅2 : Proporción de personas en la muestra tomada del distrito B que están de acuerdo con
la obra

π 1 - π 2: Diferencia entre la proporción de habitantes de A y B que están de acuerdo con la


obra

Distrito A Distrito B
n1=150 n2=150
𝑝𝑝̅1 = 90/150 = 0.6 𝑝𝑝̅2 = 75/150 = 0.5
s1 = 2 s2 = 3

α=0.10 (Nivel de error) => α/2=0.05

1-α = 0.90 Nivel de confianza => 1- α/2=0.95


Z1- α/2 = Z0.95 = P[Z< Z0.95]=0.95 => Z0.95 = 1.64

I.C.

〈(𝑝𝑝̅1 − 𝑝𝑝̅2 ) − 𝑍𝑍1−∝/2 × 𝑆𝑆𝑝𝑝̅1 −𝑝𝑝̅2 , (𝑝𝑝̅1 − 𝑝𝑝̅2 ) + 𝑍𝑍1−∝/2 × 𝑆𝑆𝑝𝑝̅1 −𝑝𝑝̅2 〉

Error estándar del estadístico

𝑝𝑝̅1 (1 − 𝑝𝑝̅1 ) 𝑝𝑝̅2 (1 − 𝑝𝑝̅2 )


𝑆𝑆𝑝𝑝̅1 −𝑝𝑝̅2 = � +
𝑛𝑛1 𝑛𝑛2

𝑝𝑝̅1 (1 − 𝑝𝑝̅1 ) 𝑝𝑝̅2 (1 − 𝑝𝑝̅2 ) 𝑝𝑝̅1 (1 − 𝑝𝑝̅1 ) 𝑝𝑝̅2 (1 − 𝑝𝑝̅2 )


〈(𝑝𝑝̅1 − 𝑝𝑝̅2 ) − 𝑍𝑍1−∝/2 � + , (𝑝𝑝̅1 − 𝑝𝑝̅2 ) + 𝑍𝑍1−∝/2 � + 〉
𝑛𝑛1 𝑛𝑛2 𝑛𝑛1 𝑛𝑛2

Margen de error (E)

𝑝𝑝̅1 (1 − 𝑝𝑝̅1 ) 𝑝𝑝̅2 (1 − 𝑝𝑝̅2 ) 0.6 × 0.4 0.5 × 0.5


𝐸𝐸 = 𝑍𝑍1−∝/2 � + = 1.64� + = 0.09
𝑛𝑛1 𝑛𝑛2 150 150

I.C.
〈(𝑝𝑝̅1 − 𝑝𝑝̅2 ) − 𝑍𝑍1−∝/2 × 𝑆𝑆𝑝𝑝̅1 −𝑝𝑝̅2 , (𝑝𝑝̅1 − 𝑝𝑝̅2 ) + 𝑍𝑍1−∝/2 × 𝑆𝑆𝑝𝑝̅1 −𝑝𝑝̅2 〉 = 〈0.1 − 0.09 , 01 + 0.09〉

〈0.01 , 0.19〉

La diferencia entre la proporción de persona que aprueban la obra está entre 1% y 19%, con
un nivel de seguridad del 90%

Ejemplo 9:

Un hospital especializado en cardiología quiere conocer la diferencia entre la eficiencia de 2


tratamientos medicinales y saber si realmente es significativa, por lo que toma 2 muestras
independientes, cada una de 200 pacientes; a las personas de la primera muestra les aplica
un tratamiento tradicional, mientras que a las de la segunda les aplica uno nuevo. Al cabo
de un mes, 170 pacientes de la primera muestra y 110 de la segunda tienen resultados
positivos. Construya el intervalo de la diferencia entre las proporciones de la eficiencia de
los 2 tratamientos con un nivel

de confianza de 94 por ciento.

You might also like