Professional Documents
Culture Documents
PARÁMETROS
Introducción
La estadística se divide en DESCRIPTIVA e
INFERENCIAL
DESCRIPTIVA
ESTADISTICA Estimación
INFERENCIAL
Prueba de
Hipótesis
Estimador y estimación
Ejemplo:
Para el próximo mes se espera que la incidencia de
influenza sea de 200 casos con un error de 10%.
CRITERIOS PARA SELECCIONAR
UN ESTIMADOR PUNTUAL: CESI.
Consistente: si al aumentar n, el
estimador se aproxima al parámetro.
Eficiencia: proporciona menor error
estándar que otros estimadores.
Suficiente: utiliza mayor cantidad de la
información contenida en la muestra que
otro estimador.
Insesgado (o imparcial): si el estimador
tiende a tomar valores por encima y por
debajo del parámetro que estima, con la
misma frecuencia.
Las estimaciones puntuales (1 población )
(A) De la media poblacional
La media muestral x estima a la media poblacional m
(B) De la varianza y la desviación estándar
S2 estima s2
S estima s
(C) De la proporción poblacional
p estima p
ESTIMACIÓN POR INTERVALOS
La estimación por intervalos consiste en encontrar en base a una muestra X1, X2, ... Xn, los
valores L y U entre los cuales se encuentra con una probabilidad conocida el verdadero valor de
parámetro “θ “ que hay que estimar, tal que:
El intervalo resultante: L θ U.
Donde: θ: Parámetro
1- α: Coeficiente de confianza.
L: Límite inferior.
U: Límite superior.
α/2 α/2
ˆ
L Ө U
α
ˆ (Nutriente)
L
P (L ≤Ө) = 1-
De manera similar.
El intervalo Ө≤ U Se denomina intervalo de confianza unilateral superior del 100(1-)%
1
α
ˆ (Grasa)
U
Donde el límite de confianza superior U se escoge de modo que:
P (Ө≤ U)=1 -
Pr Z 0 Z Z 0 1
xm
Pr Z 0 Z0 1
sx
s s
Pr x Z0 m x Z0 1
n n
𝑋 = 22
n= 10
s0 = √45 = 6.71
Z1-α/2 = Z0.975 = 1.96
<μ>95% = 22 ± (1.96)(6.71/√10)
= < 17.84; 26.16 >
INTERPRETACION.
Podemos afirmar con una confianza del 95% que el verdadero promedio de enzimas puede variar entre
17.84 y 26.16. (UI/ml).
Intervalo para la media (σ desconocida )
A partir de muestras pequeñas
Pero, x -m
t=
S
-t0 t0 n
Pr t 0 t t 0 1
xm
Pr t 0 t0 1
S
n
s s
Pr x t 0 m x t0 1
n n
<μ>γ% =𝑿 ± t(1-α/2,n-1) S/n
EJEMPLO
En una muestra aleatoria de 30 pacientes se mide el nivel de glucosa en sangre en ayunas. Se obtiene =
132 mg/dl y s2=109. Construir el IC al 95% para µ ¿Qué asunción se ha hecho?
Solución
Usando la fórmula general para cuando s2 es desconocida
X ± t(1-α/2,n-1) S/n
podemos, o bien mirar a las tablas de la t (o en un programa de ordenador) el valor de t0,025 que para
29 grados de libertad (los grados de libertad son n - 1) es 1,699, o bien como n≥ 30 aproximar a la z y
usar el valor 1,96.
Para poder usar esta fórmula es necesario que la variable sea normal. ¿es abusiva esta asunción?
Pero
p p
Z
sp
-Z0 Z0 donde
Pr{ Z o Z Z } 1 p (1 p )
sp
p p n
Pr{ Z o Z} 1
s `p
Pr{ p Zs p p p Z os p } 1
pˆ qˆ
<P>(1-α)% p̂ ± Z1- /2 s p̂ = p̂ ± Z1- /2
n
En la población cajamarquina se desea estimar, con una confianza de 0.95, ¿Cuál es el porcentaje de madres
que han realizado “ Lactancia Materna “ a sus hijos, al menos hasta 02 meses después del parto?
Solución:
1-
/2 - / 2
p̂ - Z/2 s p̂ p̂ + Z/2 s p̂
Para ello se escoge al azar una muestra de 300 madres y se observa que hay 93 que han realizado lactancia
materna, total o parcial, al menos hasta los 02 meses de edad del recién nacido:
93
ˆ
p 0.31 ; ˆ 0.69
luego q
300
De la tabla de la normal Z/2 para 95% de confianza es 1.96. Sustituyendo datos en fórmula, tenemos:
ˆ qˆ
p
p̂ ± Z/2
n
(0.31) * (0.69)
0.31 ± 1.96
300
ó equivalentemente:
< P >95% : < 0.258, 0.362 > = < 25.8 %, 36.2 % >
Interpretación.
Con un 95% de confianza el porcentaje de mujeres que han realizado la lactancia materna a sus hijos al menos
hasta los 2 meses después del parto esta entre 25.8% y 36.2%.
Intervalo de Confianza para la Varianza ( s ² )
Usamos esta función para determinar un intervalo de confianza ( 1 – α ) 100% para σ².
f (x )
1 -
α/2 / 2
Xα/2 X1-α/2 x
2
2 2
Sea P ( n 1) S ( n 1 ) S
X 2 s 2
1
X ,n1
2
1 2,n1 2
USO DE LA TABLA CHI CUADRADA
Si X 𝑋 2 (26), determine
a) P(≤ 17.29)
b) P(X>38.89)
Si X 𝑋 2 ( r), determine
L
n 1 S
9(0.056)
0.0265
X 12 2,n1 19.02
2
U
n 1 S
9(0.056)
0.1867
X 22,n1 2.70
σ² 95% : 0.0265 , 0.1867
2 2
Si S1 y S 2 son las varianzas de 02 muestras aleatorias independientes de tamaños n1 y n2
seleccionados respectivamente de 02 poblaciones normales con varianzas 𝜎12 y 𝜎22 , entonces la
construcción del intervalo de confianza de (1 – α ) 100% para s 1
2
se utiliza la
2
s2
distribución F(n1 -1, n2 -1) de la variable
2
S1 F ( 1 , 2 ) ; P( F1 F F2 ) = 1-
F
s 12
2
S
s 22
2
2 2
S1
F 2 , 2 , 1
s 2
1
S1
F1 2 , 2 , 1
2
S
s 2
2
S
2
2 2
1
F 2 , 2 , 1
F1 2 , 1 , 2
f (x )
1 -
/ 2
x
F1 = F 2,1 , 2 F2= F1 2 ,V1 ,V2
Fig. Intervalo de confianza de s 1
2
s 22
USO DE LA TABLA F de Snédecor
a) P(X≤ 7.39)
b) P(X>11.4)
c) P(X ≤ 0.0645)
a) P(X≤ c) = 0.99
b) P(X≥ c) = 0.05
c) P(X< c) = 0.025
EJEMPLO
nA = 12 nB = 12
Si las 2 poblaciones son normales, entonces X 1 - X 2 tiene: distribución exactamente normal, es decir;
s 12 s 22
X 1 - X 2 N (μ1 - μ2 , )
n1 n2
Si las poblaciones no son normales, pero n1 y n2 son suficientemente grandes ( n1≥ 30 y n2 ≥ 30 )
Entonces X 1 - X 2 tienen distribución aproximadamente normal, es decir;
N (μ1 - μ2 , s 1 s 2 ),
2 2
X1 -X 2
n1 n2
en ambos casos:
X 1 X 2 ( m1 m 2 )
Z N (0,1)
s 2
s 2
1
2
n1 n2
Y El intervalo de confianza del (1– ) % de μ1 - μ2, es:
m1 m 2 (1 )%
: X 1 X 2 Z 1 2 s
x
Intervalo de Confianza para ∆ μ : Varianzas s 12 ys 22 desconocidas
Poblaciones No Normales. ( n1 y n2 ≥ 30 )
Si X 1 y X 2 son medias de muestras aleatorias independientes de
tamaños n1 y n2 seleccionadas de poblaciones cuya distribución no es
normal con s 1 y s 2 supuestas desconocidas, entonces:
2 2
2 2
S S
∆ µ 95% : X 1 X 2 Z1
1 2
2
n1 n2
B2. Poblaciones Normales. ( n1 y n2 < 30 )
1 1
∆ μ (1-α )100% : ( X 1 X 2 ) t1 2 , n1 n2 2 S c
n1 n2
2 2
2 ( n1 1) S1 (n 2 1) S 2
donde: Sc
n1 n 2 2
Varianzas desconocidas pero supuestas diferentes: s 12 ≠ s 22
. El intervalo de ( 1 – α ) % de confianza es:
S12 S 22
∆ μ (1-α )100 % :
( X 1 X 2 ) t1 2,
n1 n2
2
S12 S 22
Con “ ” calculado por:
1
n n2
2
2 2
S 1
2
S2
2
n1
n2
n1 1 n2 1
1. Construya un intervalo de confianza del 94% para la diferencia real entre las duraciones de dos
marcas de focos, si una muestra de 40 focos tomada al azar de la primera marca dio una duración
media de 418 horas, y una muestra de 50 focos de otra marca dieron una duración media de 402
horas. Las desviaciones estándares de las dos poblaciones son 26 horas y 22 horas, respectivamente.
Solución.
s1 = 26
s2 = 22
El intervalo de confianza es entonces
2 2
s s
2 2
26 22
m A mB (1 )%
: X A X B Z1 2s donde s =
1
=2
=
x x n1 n2 40 50
nA = 12 nB = 12
Solución:
2.35 B - A 9.25
Con un nivel confianza del 95% se sabe que el tiempo promedio para alcanzar un nivel específico es
mayor para el medicamento B.
EJEMPLO
Se estudió la actividad total del complemento serológico ( CH50) en 20 personas aparentemente sanas y 10 personas
enfermas. Se obtuvieron los siguientes resultados:
Personas N Media s
Los investigadores tenían razón al pensar que las poblaciones muestreadas estaban distribuidas en forma
aproximadamente normal, pero se rehusaban a suponer que las variancias de las dos poblaciones desconocidas eran
iguales. Encuentre el intervalo de confianza del 95 por ciento para m1 - m2.
Solución
2
S S
2 2 2
1142.44 102.01
10
20
1 2
1
n n 2 2 = 9
Grados de libertad 2 = 2 2
S12
2
S 22
2 1142.44 102.01
10 20
n1 n 2
11 21
n 1 n 1
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS PAREADAS
𝑺𝒅
𝒅 ± 𝒕𝟏−∝,𝒏−𝟏 ; Los n pares (x, y) de observaciones deben ser independientes
𝟐 𝒏
di: estas diferencias deben tener una distribución normal
Ejemplo. Para probar si una nueva crema dental aumenta la resistencia de los dientes se toman 10 piezas
cerámicas y se parte cada en dos trozos, El primer trozo se lava varias veces con la crema mientras que el otro
no se lava. Luego las piezas son sometidas a una prueba de resistencia y los resultados son:
Con Crema 34 45 36 37 39 33 35 39 39 36
Sin crema 33 34 36 38 33 35 37 35 33 35
di 1 11 0 -1 6 -2 -2 4 6 1
Interpretación. Como µ𝑑 puede tomar el valor cero en el intervalo, significa que es mas probable
Que la crema dental no aumenta la resistencia de los dientes.
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE 2 PROPORCIONES POBLACIONALES
p1 = (X1/n1) y p2 = (X2/n2)
p1q1 p2 q2
∆P (1-α)% =
( p1 p 2 ) Z (1 / 2)
n1 n2
Si n1 y n2 son muestras pequeñas (n1 + n2 -2 < 30)
p1q1 p2 q2
∆P (1-α)% = ( p1 p2 ) t (1 / 2; n1 n2 -2 )
n1 n2
Ejemplo
Se cree que la osteoporosis está relacionada con el sexo. Para ello se elige una muestra de 100 hombres de
más de 50 años y una muestra de 200 mujeres en las mismas condiciones. Se obtiene que 10 hombres y 40
mujeres con algún grado de osteoporosis. ¿Qué podemos concluir con una confianza del 95 %?
Solución
ˆ p1 = 40/200 = 0, 2
ˆ p2 = 10/100 = 0, 1
p1q1 p2 q2
∆P (1-α)% =
( p1 p2 ) Z (1 / 2)
n1 n2
0.2𝑥0.8 0.1𝑥0.9
= (0, 2 − 0, 1) ± 1.96 ( + )
200 100
ADULTOS JOVENES
N1 = 400 n2 = 600
a1 = 100 a2 = 300
p1 =0.25 p2 =0.50
Q1 = 0.75 q2 = 0.50
Puesto que los tamaños de muestras son muy diferentes, se emplea la proporción mancomunada así:
n1 p1 n2 p 2 100 300
p = p 0.4 ; entonces:
n1 n2 400 600
1 1 1 1
s pˆ p (1 p )( ) = 0.4 * 0.6 * ( ) 0.032
n1 n2 400 600
Según fórmula:
∆P (1-α)% = ( p1 p 2 ) Z (1 / 2) * s pˆ = (0.25 0.50) 2.58 * 0.032 = (-0.33; -0.17).
Se considera un experimento para estudiar si la terapia cognitiva es mas efectiva para la
depresión que la psicoterapia psicodinamica. Se consideran dos muestras de 10 personas cada
una sobre las que se realiza cada terapia. Tras 6 semanas de terapia, la mejoria en cada paciente
se comprueba. Esta mejoria es marcada (0-10) para cada paciente como sigue:
Cognitiva 9 7 7 8 3 8 7 5 6 8
Psicodinamica 3 2 4 0 5 2 4 3 2 5
Considerando normalidad e independencia y suponiendo las varianzas iguales, estimar la
diferencia de medias en efectividad y calcular un intervalo de confianza al nivel 0.95.
Queremos comparar dos metodos rapidos para estimar la concentracion de una hormona en una solucion.
Tenemos 10 dosis preparadas en el laboratorio y vamos a medir la concentracion de cada una con los dos
metodos. Se obtienen los siguientes resultados:
Dosis 1 2 3 4 5 6 7 8 9 10
Metodo A 10.7 11.2 15.3 14.9 13.9 15 15.6 15.7 14.3 10.8
Metodo B 11.1 11.4 15 15.1 14.3 15.4 15.4 16 14.3 11.2
Calcular un intervalo de confianza al nivel 0.9 para el cociente de varianzas y la diferencia de concentraciones
medias (considerar normalidad e independencia).
Solucion: I.C.(Cociente de var ianzas) 0.3531; 3.5709
I.C.(Diferencia de medias) 1.7158;1.3558