You are on page 1of 35

ESTIMACIÓN DE

PARÁMETROS
Introducción
La estadística se divide en DESCRIPTIVA e
INFERENCIAL

DESCRIPTIVA
ESTADISTICA Estimación
INFERENCIAL
Prueba de
Hipótesis
Estimador y estimación

Un estimador. Es una función de los valores


muestrales utilizada para estimar un
parámetro de población.

Una Estimación. Cuando hemos observado


un valor numérico específico de nuestro
estimador, nos referimos a ese valor como
una estimación.
Tipos de estimaciones
A) Estimación puntual

Un sólo número se utiliza para estimar un


parámetro desconocido. Para ser útil debe de
estar acompañado del error.

Ejemplo:
Para el próximo mes se espera que la incidencia de
influenza sea de 200 casos con un error de 10%.
CRITERIOS PARA SELECCIONAR
UN ESTIMADOR PUNTUAL: CESI.
 Consistente: si al aumentar n, el
estimador se aproxima al parámetro.
 Eficiencia: proporciona menor error
estándar que otros estimadores.
 Suficiente: utiliza mayor cantidad de la
información contenida en la muestra que
otro estimador.
 Insesgado (o imparcial): si el estimador
tiende a tomar valores por encima y por
debajo del parámetro que estima, con la
misma frecuencia.
Las estimaciones puntuales (1 población )
(A) De la media poblacional
La media muestral x estima a la media poblacional m
(B) De la varianza y la desviación estándar
S2 estima s2
S estima s
(C) De la proporción poblacional
p estima p
ESTIMACIÓN POR INTERVALOS

La estimación por intervalos consiste en encontrar en base a una muestra X1, X2, ... Xn, los
valores L y U entre los cuales se encuentra con una probabilidad conocida el verdadero valor de
parámetro “θ “ que hay que estimar, tal que:

P(L < θ < U) = 1- α.

El intervalo resultante: L θ  U.

Donde: θ: Parámetro
1- α: Coeficiente de confianza.
L: Límite inferior.
U: Límite superior.

L y U son funciones de las observaciones para muestras de tamaño "n"

INTERPRETACION: Si muchas muestras aleatorias se obtuvieran y si se calcula un


intervalo de confianza de 100 ( 1 -  ) % con respecto a θ para cada muestra, entonces el 100
( 1 -  ) % de los intervalos contendrán al verdadero valor de
El intervalo:
L ≤ Ө ≤ U. Se denomina intervalo de confianza bilateral de 100(1- )%

α/2 α/2
ˆ
L Ө U

El intervalo: L ≤Ө Se denomina intervalo de confianza unilateral inferior del 100(1-)%

α
ˆ (Nutriente)
L

Donde el límite inferior de confianza L se elige de modo que:

P (L ≤Ө) = 1- 

De manera similar.
El intervalo Ө≤ U Se denomina intervalo de confianza unilateral superior del 100(1-)%

1
α
ˆ (Grasa)
U
Donde el límite de confianza superior U se escoge de modo que:

P (Ө≤ U)=1 - 

U-L: longitud del intervalo de confianza es una medida importante de la calidad de la


información obtenida en la muestra.

El semiintervalo Ө-L ó U-Ө se conoce como precisión del estimador .

El intervalo L ≤ θ ≤ U. Se denomina Intervalo Bilateral.

El intervalo L ≤ θ. Se denomina Intervalo Unilateral Derecho.

El intervalo θ ≤ U. Se denomina Intervalo Unilateral Izquierdo


Intervalo para la media (σ conocida)
A partir de muestras grandes o pequeñas
x-m
pero Z =
s
n
-Z0 Z0

Pr Z 0  Z  Z 0   1  
 xm 
Pr  Z 0   Z0   1  
 sx 
 s s 
Pr  x  Z0  m  x  Z0   1  
 n n 

<μ>1-α : 𝑥ҧ ± Z1-α/2 σo/n


Ejemplo.
Un investigador en salud, está interesado en obtener una estimaci´n del nivel rmedio de alguna enzima
en cierta población humana, toma una muestra de 10 individuos, determina el el nivel de enzima en cada
uno y calcula una media muestral de 22. Supóngase además que la variable de interés tiene distribución
normal con una varianza de 45.Estime el verdadero promedio mediante un intervalo del 95% de
confianza.
Solución

X: nivel de enzimas en la población bajo estudio


X N(µ, 45)

Fórmula de cálculo: <μ>1-α : 𝒙 ± Z(1-α/2)σo/n


Según los datos:

𝑋 = 22
n= 10
s0 = √45 = 6.71
Z1-α/2 = Z0.975 = 1.96

Que al sustituir en la fórmula se obtiene:

<μ>95% = 22 ± (1.96)(6.71/√10)
= < 17.84; 26.16 >
INTERPRETACION.

Podemos afirmar con una confianza del 95% que el verdadero promedio de enzimas puede variar entre
17.84 y 26.16. (UI/ml).
Intervalo para la media (σ desconocida )
A partir de muestras pequeñas

Pero, x -m
t=
S
-t0 t0 n
Pr t 0  t  t 0   1  
 
 xm 
Pr  t 0   t0   1  
 S 
 n 
 s s 
Pr  x  t 0  m  x  t0   1
 n n
<μ>γ% =𝑿 ± t(1-α/2,n-1) S/n
EJEMPLO
En una muestra aleatoria de 30 pacientes se mide el nivel de glucosa en sangre en ayunas. Se obtiene =
132 mg/dl y s2=109. Construir el IC al 95% para µ ¿Qué asunción se ha hecho?
Solución
Usando la fórmula general para cuando s2 es desconocida

X ± t(1-α/2,n-1) S/n
podemos, o bien mirar a las tablas de la t (o en un programa de ordenador) el valor de t0,025 que para
29 grados de libertad (los grados de libertad son n - 1) es 1,699, o bien como n≥ 30 aproximar a la z y
usar el valor 1,96.

<μ>γ% =X ± t(1-α/2,n-1) S/n


= 132  2.04 X (10.44/5.48)
=132  3.89

<μ>95% = < 128.11; 135.89 mg/dl>

Para poder usar esta fórmula es necesario que la variable sea normal. ¿es abusiva esta asunción?

INTERPRETACION. Afirmamos con un 95% de confianza que el promedio de glucosa en la población


puede variar entre 128.11 y 135.89 mg/dl.
Intervalo para la proporción poblacional

Pero
p p
Z
sp
-Z0 Z0 donde
Pr{ Z o  Z  Z }  1   p (1  p )
sp 
p p n
Pr{ Z o   Z}  1  
s `p
Pr{ p  Zs p  p  p  Z os p }  1  

pˆ qˆ
<P>(1-α)%  p̂ ± Z1- /2 s p̂ = p̂ ± Z1- /2
n
En la población cajamarquina se desea estimar, con una confianza de 0.95, ¿Cuál es el porcentaje de madres
que han realizado “ Lactancia Materna “ a sus hijos, al menos hasta 02 meses después del parto?

Solución:

1-

/2 - / 2

p̂ - Z/2 s p̂ p̂ + Z/2 s p̂

Para ello se escoge al azar una muestra de 300 madres y se observa que hay 93 que han realizado lactancia
materna, total o parcial, al menos hasta los 02 meses de edad del recién nacido:
93
ˆ 
p  0.31 ; ˆ  0.69
luego q
300
De la tabla de la normal Z/2 para 95% de confianza es 1.96. Sustituyendo datos en fórmula, tenemos:

ˆ qˆ
p
p̂ ± Z/2
n

(0.31) * (0.69)
0.31 ± 1.96
300

0.31± 0.05233  P  0.31± 0.05233

ó equivalentemente:

< P >95% : < 0.258, 0.362 > = < 25.8 %, 36.2 % >

Interpretación.

Con un 95% de confianza el porcentaje de mujeres que han realizado la lactancia materna a sus hijos al menos
hasta los 2 meses después del parto esta entre 25.8% y 36.2%.
Intervalo de Confianza para la Varianza ( s ² )

Un estimador insesgado de s² es:


2

2
 (X  X )2 (n  1) S
S 
i
. Además para ( n≥ 2 ) , la v.a. X   X 2
n 1 g .l
n 1 s 2

Usamos esta función para determinar un intervalo de confianza ( 1 – α ) 100% para σ².

f (x )

1 -
α/2 / 2

Xα/2 X1-α/2 x
2

Sea P X XX   1   ; sustituyendo (n  1) S


2 2
 , n 1 1 ,n 1 X
 2 2  s2

 2 2

Sea P ( n  1) S ( n  1 ) S 
 X 2  s 2
   1
X  ,n1 
2
 1 2,n1 2 
USO DE LA TABLA CHI CUADRADA

Si X 𝑋 2 (26), determine

a) P(≤ 17.29)
b) P(X>38.89)

Si X 𝑋 2 ( r), determine

a) c, tal que P(X≤ c) = 0.995, si r = 20


b) c, tal que P(X< c) = 0.015, si r=8
Ejemplo
Las temperaturas en grados Celsius medidos en un experimento se consideran normales. Si se tomaron las
siguientes muestras: 10.1, 9.7, 10.3, 10.4, 9.9, 9.8, 9.9, 10.1, 10.3, 9.9
Encuentre un intervalo de confianza del 95% para la varianza poblacional (s2)
Solución
Con a = 0.05, n = 10 , = n-1 = 9 g.l. en la chi-cuadrado
X 2 2,n1 = X 2 0.025,9 = 2.70 y X 21 2,n1 = X 2 0.975,9 = 19.02
 2
- De los datos maestrales se tiene S = 0.056
- Los límites de confianza para s 2 es :
2

L
n  1 S

9(0.056)
 0.0265
X 12 2,n1 19.02
2

U
n  1 S 
9(0.056)
 0.1867
X 22,n1 2.70
σ² 95% : 0.0265 , 0.1867 

σ95% : 0.1628 , 0.432 


Intervalo de Confianza para la Razón de 02 Varianzas

2 2
Si S1 y S 2 son las varianzas de 02 muestras aleatorias independientes de tamaños n1 y n2
seleccionados respectivamente de 02 poblaciones normales con varianzas 𝜎12 y 𝜎22 , entonces la
construcción del intervalo de confianza de (1 – α ) 100% para s 1
2
se utiliza la
2
s2
distribución F(n1 -1, n2 -1) de la variable
 2
S1 F ( 1 , 2 ) ; P( F1  F  F2 ) = 1-
F 
s 12
 2
S
s 22
2

 2  2
S1
F 2 , 2 , 1 
s 2
1

S1
F1 2 , 2 , 1
 2
S
s 2
2
S
 2
2 2

1
F 2 , 2 , 1 
F1 2 , 1 , 2
f (x )

1 -
/ 2

x
F1 = F 2,1 , 2 F2= F1 2 ,V1 ,V2
Fig. Intervalo de confianza de s 1
2

s 22
USO DE LA TABLA F de Snédecor

Si X F(4, 5), determine

a) P(X≤ 7.39)
b) P(X>11.4)
c) P(X ≤ 0.0645)

Si X 𝐹 (6,10), determine el valor de c tal que

a) P(X≤ c) = 0.99
b) P(X≥ c) = 0.05
c) P(X< c) = 0.025
EJEMPLO

Se calcularon las variancias de las muestras para los


volúmenes de ventilación pulmonar (ml) de dos
grupos de pacientes que sufren del padecimiento
del tabique auricular. Los resultados y tamaños de
las muestras fueron los siguientes :

n1 = 31, s12 = 35,000


n2 = 41, s22 = 20,000

Construya el intervalo de confianza del 95 por ciento


para la razón de las dos variancias
Solución

X1 volumen de ventilac.pulmonar G1 N(µ1, s 12)


X2 volumen de ventilac.pulmonar G2 N(µ2, s 22 )
EJEMPLO

Se realizó un experimento donde se midió el tiempo requerido por el


cuerpo humano para absorber dos medicamentos, A y B. Suponga que
el tiempo necesario para que cada medicamento alcance un nivel
específico en el torrente sanguíneo se distribuye normalmente. Se
eligieron al azar a 12 personas para ensayar cada fármaco registrándose
el tiempo en minutos que tardó en alcanzar un nivel específico en la
sangre. Construir un intervalo del 90% de confianza para la razón de las
dos varianzas
Medicamento A Medicamento B

nA = 12 nB = 12

SA2= 15.57 SB2 = 17.54


INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE 2 MEDIAS POBLACIONALES (∆μ )

Consideramos dos casos:


A. Intervalo de Confianza para ∆ μ : varianzas s 12 y s 22 conocidas.
 
Sean X 1 y X 2 las medias de dos muestras aleatorias independientes de tamaños n1 y n2 seleccionadas
 
de 2 poblaciones con medias μ1 y μ2 y varianzas s 2
1 y s 2
2 supuestas conocidas. X 1 - X 2 es un estimador
puntual de μ1 - μ2

 
Si las 2 poblaciones son normales, entonces X 1 - X 2 tiene: distribución exactamente normal, es decir;
  s 12 s 22
X 1 - X 2  N (μ1 - μ2 ,  )
n1 n2
Si las poblaciones no son normales, pero n1 y n2 son suficientemente grandes ( n1≥ 30 y n2 ≥ 30 )
 
Entonces X 1 - X 2 tienen distribución aproximadamente normal, es decir;

 N (μ1 - μ2 , s 1  s 2 ),
 
2 2
X1 -X 2
n1 n2
en ambos casos:
 
X 1  X 2  ( m1  m 2 )
Z   N (0,1)
s 2
s 2
1
 2
n1 n2
Y El intervalo de confianza del (1–  ) % de μ1 - μ2, es:

 
m1  m 2 (1 )%
: X 1  X 2  Z 1 2 s 
x
Intervalo de Confianza para ∆ μ : Varianzas s 12 ys 22 desconocidas

Poblaciones No Normales. ( n1 y n2 ≥ 30 )
 
Si X 1 y X 2 son medias de muestras aleatorias independientes de
tamaños n1 y n2 seleccionadas de poblaciones cuya distribución no es
normal con s 1 y s 2 supuestas desconocidas, entonces:
2 2

El intervalo de confianza de ( 1 –α ) % para μ1 - μ2 es el valor anterior


donde s 1 y s 2 , se estiman por S1 y S2 esto es:
2 2 2 2

  2 2
S S
 ∆ µ  95% : X 1  X 2  Z1 
1 2
2
n1 n2
B2. Poblaciones Normales. ( n1 y n2 < 30 )

Varianzas desconocidas pero supuestas Iguales: s 1 = s 2 = s


2 2 2

El intervalo de confianza ( 1 –α ) % para ∆µ , se basa en la función pivotal:

   1 1
 ∆ μ  (1-α )100% : ( X 1  X 2 )  t1 2 , n1  n2  2 S c 
n1 n2
2 2
2 ( n1  1) S1  (n 2  1) S 2
donde: Sc 
n1  n 2  2
Varianzas desconocidas pero supuestas diferentes: s 12 ≠ s 22
. El intervalo de ( 1 – α ) % de confianza es:

  S12 S 22
 ∆ μ  (1-α )100 % :
( X 1  X 2 )  t1 2,  
n1 n2
2
 S12 S 22 
Con “  ” calculado por:   
   1
n n2 
2
2 2
S 1
2
 S2
2


 n1 
 
 n2 


n1  1 n2  1
1. Construya un intervalo de confianza del 94% para la diferencia real entre las duraciones de dos
marcas de focos, si una muestra de 40 focos tomada al azar de la primera marca dio una duración
media de 418 horas, y una muestra de 50 focos de otra marca dieron una duración media de 402
horas. Las desviaciones estándares de las dos poblaciones son 26 horas y 22 horas, respectivamente.

Solución.
s1 = 26
s2 = 22
El intervalo de confianza es entonces

2 2
  s s
2 2
26  22
m A  mB (1 )%
: X A  X B  Z1 2s  donde s = 
1
=2
=
x x n1 n2 40 50

Z1 2 = Z0.9700 = 1.88

Y sustituyendo datos obtenemos: 6.3 A- B 25.7

Interpretación. Podemos afirmar con un 94% de confianza que la duración de focos de la


primera marca es significativamente mayor que la duración promedio de la segunda marca.
2. Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo
humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada
medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente. Se
eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en minutos
que tardó en alcanzar un nivel específico en la sangre. Calcule un intervalo de confianza del 95%
para la diferencia del tiempo promedio. Suponga varianzas iguales.
Medicamento A Medicamento B

nA = 12 nB = 12

SA2= 15.57 SB2 = 17.54

Solución:

2.35 B - A 9.25

Con un nivel confianza del 95% se sabe que el tiempo promedio para alcanzar un nivel específico es
mayor para el medicamento B.
EJEMPLO

Se estudió la actividad total del complemento serológico ( CH50) en 20 personas aparentemente sanas y 10 personas
enfermas. Se obtuvieron los siguientes resultados:

Personas N Media s

Enfermas 10 62.6 33.8

Normales 20 47.2 10.1

Los investigadores tenían razón al pensar que las poblaciones muestreadas estaban distribuidas en forma
aproximadamente normal, pero se rehusaban a suponer que las variancias de las dos poblaciones desconocidas eran
iguales. Encuentre el intervalo de confianza del 95 por ciento para m1 - m2.
Solución

< m1 - m2˃ 95% 𝑆12 𝑆22


=( m1 - m2) t0.975,  𝑛 +
𝑛2
)
1

2
S S 
2 2 2
1142.44 102.01
 10 
 20 
1 2
 
 1
n n 2  2 = 9
   
Grados de libertad   2 = 2 2
 S12 
2
 S 22 
2 1142.44 102.01
10  20
 n1   n 2 
 11 21
n 1 n 1
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS PAREADAS

Se usa la siguiente fórmula:

𝑺𝒅
𝒅 ± 𝒕𝟏−∝,𝒏−𝟏 ; Los n pares (x, y) de observaciones deben ser independientes
𝟐 𝒏
di: estas diferencias deben tener una distribución normal

Ejemplo. Para probar si una nueva crema dental aumenta la resistencia de los dientes se toman 10 piezas
cerámicas y se parte cada en dos trozos, El primer trozo se lava varias veces con la crema mientras que el otro
no se lava. Luego las piezas son sometidas a una prueba de resistencia y los resultados son:

Con Crema 34 45 36 37 39 33 35 39 39 36
Sin crema 33 34 36 38 33 35 37 35 33 35
di 1 11 0 -1 6 -2 -2 4 6 1

Construir un intervalo de confianza para µ𝑑

Datos Sustituyendo datos en fórmula:


N = 10 2.4 ± 2.26 (4.25/ 10 )
𝑑ҧ =2.4
Sd = 4.25
𝒕𝟏−∝,𝒏−𝟏 =𝒕𝟎.𝟗𝟕𝟓,𝟗 = 2.26 -0.63 ≤ µ𝑑 ≤ 5.43
𝟐

Interpretación. Como µ𝑑 puede tomar el valor cero en el intervalo, significa que es mas probable
Que la crema dental no aumenta la resistencia de los dientes.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE 2 PROPORCIONES POBLACIONALES

Se pueden presentar los siguientes casos:

p1 = (X1/n1) y p2 = (X2/n2)

 Si n1 y n2 son muestras grandes (n1 y n2 ≥ 30)

El intervalo correspondiente para 1 p  p2   P

 p1q1 p2 q2 
 ∆P  (1-α)% =
( p1  p 2 )  Z (1 / 2)
  
 n1 n2 
 Si n1 y n2 son muestras pequeñas (n1 + n2 -2 < 30)

 p1q1 p2 q2 
 ∆P  (1-α)% = ( p1  p2 )  t (1 / 2; n1 n2 -2 )   
 n1 n2 
Ejemplo
Se cree que la osteoporosis está relacionada con el sexo. Para ello se elige una muestra de 100 hombres de
más de 50 años y una muestra de 200 mujeres en las mismas condiciones. Se obtiene que 10 hombres y 40
mujeres con algún grado de osteoporosis. ¿Qué podemos concluir con una confianza del 95 %?

Solución

Llamamos p1 a la incidencia de la osteoporosis en las mujeress de más de 50 años y p2 a la de los hombres.


Calculemos un intervalo de confianza para la diferencia (p1 −p2). Si 0 no forma parte de dicho intervalo con
una confianza del 95% podemos decir que p1 es diferente a p2 (con tal grado de confianza, por supuesto).La
estimación puntual insesgada que podemos hacer de ambos parámetros a partir de los datos muestrales son:

ˆ p1 = 40/200 = 0, 2
ˆ p2 = 10/100 = 0, 1

 p1q1 p2 q2 
 ∆P  (1-α)% =
( p1  p2 )  Z (1 / 2)   
 n1 n2 

0.2𝑥0.8 0.1𝑥0.9
= (0, 2 − 0, 1) ± 1.96 ( + )
200 100

 ∆P  (1-α)% = ( 0.02, 0.18)


EJEMPLO. En una muestra aleatoria de 400 adultos y 600 jóvenes que vieron un cierto programa de
televisión, 100 adultos y 300 jóvenes reconocieron que les había gustado. Determinar los límites de confianza
del 99% para la diferencia de proporciones de todos los adultos y jóvenes que vieron con agrado el programa.
Solución:

ADULTOS JOVENES
N1 = 400 n2 = 600
a1 = 100 a2 = 300
p1 =0.25 p2 =0.50
Q1 = 0.75 q2 = 0.50

1 - a = 0.99, luego 1- α/2; = 0.995


Como n1+ n2 - 2 > 30; entonces: Z (1 - α/2) = Z(0.995) = 2.58

Puesto que los tamaños de muestras son muy diferentes, se emplea la proporción mancomunada así:
n1 p1  n2 p 2 100  300
p = p  0.4 ; entonces:
n1  n2 400  600
 1 1   1 1 
s pˆ   p (1  p )(  )  =  0.4 * 0.6 * (  )   0.032
 n1 n2   400 600 

Según fórmula:
 ∆P  (1-α)% = ( p1  p 2 )  Z (1 / 2) * s pˆ = (0.25  0.50)  2.58 * 0.032 = (-0.33; -0.17).
Se considera un experimento para estudiar si la terapia cognitiva es mas efectiva para la
depresión que la psicoterapia psicodinamica. Se consideran dos muestras de 10 personas cada
una sobre las que se realiza cada terapia. Tras 6 semanas de terapia, la mejoria en cada paciente
se comprueba. Esta mejoria es marcada (0-10) para cada paciente como sigue:
Cognitiva 9 7 7 8 3 8 7 5 6 8
Psicodinamica 3 2 4 0 5 2 4 3 2 5
Considerando normalidad e independencia y suponiendo las varianzas iguales, estimar la
diferencia de medias en efectividad y calcular un intervalo de confianza al nivel 0.95.
Queremos comparar dos metodos rapidos para estimar la concentracion de una hormona en una solucion.
Tenemos 10 dosis preparadas en el laboratorio y vamos a medir la concentracion de cada una con los dos
metodos. Se obtienen los siguientes resultados:
Dosis 1 2 3 4 5 6 7 8 9 10
Metodo A 10.7 11.2 15.3 14.9 13.9 15 15.6 15.7 14.3 10.8
Metodo B 11.1 11.4 15 15.1 14.3 15.4 15.4 16 14.3 11.2
Calcular un intervalo de confianza al nivel 0.9 para el cociente de varianzas y la diferencia de concentraciones
medias (considerar normalidad e independencia).
Solucion: I.C.(Cociente de var ianzas)  0.3531; 3.5709
I.C.(Diferencia de medias)  1.7158;1.3558

You might also like