You are on page 1of 19

INTRODUCCIN A LA INFERENCIA ESTADSTICA

- Estimacin de Parmetros

- Contraste de Hiptesis

Carmen M. Cadarso Surez.

El proceso de Inferencia Estadstica permite extraer conclusiones cientficamente vlidas acerca de la poblacin a partir de los resultados muestrales (obtenidos a travs de la estadstica descriptiva). Segn nuestros objetivos, la inferencia estadstica puede clasificarse en: a) Estimacin de parmetros. Cul es la talla media () de los varones espaoles? Cul es la prevalencia (p) del SIDA en Galicia? b) Contraste de Hiptesis. Podemos asumir que el nivel de colesterol promedio () es 200?
Ho : = 200 H1 : 200

(no diferencia)

La prevalencia (p) del Infarto de Miocardio es mayor que 0.03?


Ho : p 0.03 (no diferencia) H1 : p > 0.03

El nivel de colesterol promedio es el mismo en varones que en mujeres?


Ho : varn = mujer (no diferencia) H1 : varn = mujer

Considerando 2 tratamientos (T1,T2) para reducir la tensin, podemos decidir que T1 es mejor que T2? Si X=reduccin de la tensin y el promedio de la reduccin
Ho : T1 = T2 (no diferencia) H1 : T1 < T2
ESTIMACIN DEL PARMETRO MEDIA ()

POBLACIN Nios varones de 7 aos VARIABLE ALEATORIA X=Peso (kgs) PARMETRO = promedio de peso ??

n=50

MUESTRA ALEATORIA ESTADSTICA INFERENCIAL: Estimacin de Subconjunto ALEATORIO de 50 nios varones de 7 aos

( X 1 , X 2 ,...., X 50 )
ESTADSTICO MEDIA MUESTRAL

X=

1 ( X 1 + X 2 + .... + X 50 ) = media muestral del peso 50

UNA MUESTRA PARTICULAR ( 22, 40, 27, 21 .....,35 )

x = 25.6

MEDIA DE LA MUESTRA

ESTADSTICA DESCRIPTIVA

s = 4.63

Estimacin puntual de
En base al resultado de la muestra particular de tamao n, una estimacin puntual de sera el valor numrico que toma

en dicha muestra.

En nuestro ejemplo, a partir de una muestra de n=50 nios varones de 7 aos. daramos como estimacin del peso terico

x = 25.6 Kgs.

Inconveniente(s): -La estimacin puntual depende de la muestra particular que se obtenga. -Existe una incertidumbre total, acerca de la proximidad (lejana) del valor puntual a la media terica.

Sin embargo

Conocemos la distribucin de la medias muestrales bajo ciertas condiciones sobre la poblacin de partida.......

DISTRIBUCIN DE LA MEDIA MUESTRAL


a) Si asumimos que

X N ( , )

, conocida

Las (infinitas) medias muestrales obtenidas con muestras de tamao n se distribuyen segn una campana de Gauss:

X N ( ,

) n

Error tipico ( X ) = n

X N (0,1) n

b) Si asumimos que

X N ( , ) , desconocida

Las (infinitas) medias muestrales obtenidas con muestras de tamao n se distribuyen segn una distribucin t-student con n-1 grados de libertad (gl)

X tn 1 S n

Error tipico ( X ) = S

Estimacin por Intervalos de Confianza (IC) de


Como hemos visto, el estadstico media muestral, X , lleva asociado un error de (dado por el error tpico de dicho estadstico) lo que ha de tenerse en cuenta para valorar la precisin de una estimacin puntual. Idea Construir un intervalo, basado a)

, que contenga con alta probabilidad el parmetro

X N ( , )

, conocida

Fijado (p.e. 0.05), el nivel de confianza es (1-)


X 1 = P z z = P X z X + z n n n 2 2 2 2

IC (1 )100% para es X z , X + z n n (1 )100% 2 2

b)

X N ( , )

, desconocida

S S , X + t IC (1 )100% para es X t n n (1 )100% 2 2

EJEMPLO: Construir un IC al 95% para el promedio terico de peso en nios varones de 7 aos. Suponiendo que X = Peso N ( , = 5)

1.

En nuestra muestra de n=50,

x = 25.6 Kgs

5 5 , 25.6 + 1.96 IC 95% para es 25.6 1.96 50 50 95%

[ 25.6 1.4 ,
2.

25.6 + 1.4]95%

[ 24.2 ,

27.0]95%

Suponiendo que X = Peso N ( , ) , desconocida

En nuestra muestra de n = 50,

x = 25.6 Kgs

s = 4.63 Kgs

4.63 4.63 , 25.6 + 2.01 IC 95% para es 25.6 2.01 50 50 95%

[ 25.6 1.3 ,

25.6 + 1.3]95%

[ 24.3 ,

26.9]95%

EJEMPLO: En nuestro fichero pediatria.sav, estimar el promedio de IMC (ndice de Masa Corporal, en Kg/m2) en nias de 6 aos. Primero seleccionaremos los casos. En el SPSS se procedera as:
Datos Seleccionar casos... Si se satisface la condicin.... sexo=1 (mujer) and edad=6

Lo que nos indica que hay n=126 nias de 6 aos. Representamos el histograma del IMC, junto con la campana de Gauss.
nias de 6 aos
25 20

15

10

0 11.1 11.9 12.7 13.4 14.2 15.0 15.8 16.5 17.3 18.1 18.8 19.6 20.4

IMC (Kgs/m2)

Asumimos normalidad de la variable X=IMC. Resultados.


En el SPSS se obtendran as Analizar Explorar.... Dependiente : IMC
nias de 6 aos Estadstico 15.6805 Lmite inferior Lmite superior 15.3134 16.0476 15.6203 15.5058 4.335 2.08201 11.22 25.87 14.65 2.7845 .945 3.515 .216 .428 Error tp. .18548

IMC

Media Intervalo de confianza para la media al 95% Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis

CONTRASTE DE HIPTESIS SOBRE UNA MEDIA POBLACIONAL

Al contrario de lo que sucede en ESTIMACIN (donde existe incertidumbre acerca del parmetro de inters), en el proceso inferencial de TESTS de HIPTESIS, se desea contrastar una teora preconcebida acerca del valor (o valores) que puede tomar dicho parmetro. Si el parmetro desconocido y 0 es un valor conocido de referencia, se pueden plantear los siguientes tipos de contraste: Bilateral

H 0 : = 0 H1 : 0
Unilateral por la derecha

H 0 : 0 H1 : > 0
Unilateral por la izquierda

H 0 : 0 H1 : < 0
siendo: H0 = Hiptesis NULA (no diferencia) H1 = Hiptesis ALTERNATIVA

ERRORES DE UN CONTRASTE DE HIPTESIS En la toma de decisiones a travs de un contraste, existen dos tipos de acierto pero podemos cometer 2 tipos de error: ERROR TIPO I [ Rechazar H0 suponiendo que H0 es cierta]= =[ Aceptar H1 suponiendo que H0 es cierta] = [ H1 / H0 ] Nivel de Significacin = = P[Error tipo I]= P[ H1 / H0 ] ACIERTO TIPO I [ Aceptar H0 suponiendo que H0 es cierta] = [ H0 / H0 ] 1- = P[Acierto tipo I]= P[ H0 / H0 ] ERROR TIPO II [ Rechazar H1 suponiendo que H1 es cierta]= =[ Aceptar H0 suponiendo que H1 es cierta] = [ H0 / H1 ] = P[Error tipo II]= P[ H0 / H1 ] ACIERTO TIPO II [ Aceptar H1 suponiendo que H1 es cierta] = [ H1 / H1 ] Potencia del contraste =1 - = P[Acierto tipo II]= P[ H1 / H1 ] Decisin del Test H0 Hiptesis verdadera H0 H1 Acierto tipo I (1-) Error Tipo II () H1 Error tipo I () Acierto tipo II (1-)

CONTRASTES SOBRE

( conocida)

Se asume que X= Tensin Intraocular (mmHg) en la poblacin de personas de edad avanzada sigue una distribucin normal N(, =3). Tomamos como referencia 0=14 1. Planteamos el contraste de hiptesis (bilateral).
H 0 : = 14 H1 : 14

2. Fijamos el nivel de significacin: (0.05, 0.01,....) 3. Estadstico de contraste:

X N ( ,

3 ) n

X N (0,1) 3 n

4. Suponemos la hiptesis nula cierta. Bajo H0 :

X 0 X 14 = N (0,1) 3 n 3 n

5. Regla de decisin. Si con nuestra muestra particular a) b)


x 14 3 n

(z

, z

)
2

asumimos H0 Asumimos que =14 (n.s.)

x 14 3 n

(z

, z

Rechazamos H0 es significativamente distinto de 14 (p-value<)

Si el contraste fuese UNILATERAL POR LA DERECHA

H 0 : 14 H1 : > 14

Si

x 14 3 n

( z

, ) Rechazamos H0
es significativamente mayor que 14 (p-value<)

Si el contraste fuese

UNILATERAL POR LA IZQUIERDA

H 0 : 14 H1 : < 14

Si

x 14 3 n

( , -z )

Rechazamos H0 es significativamente menor que 14 (p-value<)

CONTRASTES SOBRE

( desconocida)

El proceso de contraste es el mismo, salvo que ahora el estadstico de contraste bajo H0 es ahora

X 0 tn 1 S n
Contraste bilateral

Contraste unilateral derecha

Contraste unilateral izquierda

EJEMPLO
Se asume que X= Tensin Intraocular (mmHg) en la poblacin de personas de edad avanzada sigue una distribucin normal N(, ). Tomamos como referencia 0=14 Se ha extraido una muestra de 20 personas de edad avanzada y los resultados fueron los siguientes:
Estadsticos descriptivos N tensin intra_ocular N vlido (segn lista) 20 20 Mnimo 10.0 Mximo 24.2 Media 15.425 Desv. tp. 3.3425

Se puede concluir a partir de estos datos que el promedio de la tensin intraocular en personas de edad avanzada es mayor que 14 mm Hg?

H 0 : 14 H1 : > 14
Estadstico de contraste:

X 0 tn 1 S n

Bajo la hiptesis nula, el estadstico de contraste vale 15.425 14 x 14 = 1.907 = 3.3425 20 S n

Concluimos que que el promedio de la tensin intraocular en personas de edad avanzada es significativamente mayor que 14 mm Hg (p-value<0.05).

p-value = P(rechazar H0 con nuestra muestra particular /H0 es cierta)

p value = p ( t19 > 1.907 ) = 0.0358

EJEMPLO En una poblacin de inters el nivel de colesterol (mgrs/dL) es N(, =50). Una muestra de 20 personas de esa poblacin, ofreci una media 200. Puede asumirse que el promedio de esta poblacin es diferente al valor normal que es 175 mgrs/dL? (=0.05)
H 0 : = 175 H1 : 175

Estadstico de contraste

X N (0,1) 50 n

Bajo H0 :

X 175 X 175 = N (0,1) 50 20 50 20 200 175 = 2.24 50 20

Con los resultados muestrales, el estadstico bajo H0 vale

2.24 (-1.96, 196) , Como concluimos que el promedio de colesterol es significativamente distinto al nivel normal de 175 (p-value<0.05).
p-value ? p-value = P(rechazar H0 con nuestra muestra particular /H0 es cierta)

p value = 2 p ( Z > 2.24 ) = 2 0.01254 = 0.02508

EJEMPLO (peso_got.sav)

1) El peso, sigue una distribucin normal? Construir un IC99% para el verdadero peso medio de los pacientes.

2) Las mediciones de GOT, siguen una distribucin normal? -Construir un IC99% para el verdadero valor medio de los pacientes. -Contrastar la hiptesis de si GOT es, en promedio, 25.

Pruebas de normalidad Kolmogorov-Smirnov Estadstico gl Sig. ,098 40 ,200* ,077 40 ,200*


a

PESO GOT

Estadstico ,976 ,975

Shapiro-Wilk gl 40 40

Sig. ,528 ,510

*. Este es un lmite inferior de la significacin verdadera. a. Correccin de la significacin de Lilliefors


100

90

80

70

60

50
N= 40

PESO 40

30

20

10
N= 40

GOT

En Estadsticos Descriptivos Explorar, obtenemos los IC99%

Descriptivos PESO Media Intervalo de confianza para la media al 99% Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Media Intervalo de confianza para la media al 99% Media recortada al 5% Mediana Varianza Desv. tp. Mnimo Mximo Rango Amplitud intercuartil Asimetra Curtosis Estadstico 73,740 69,883 77,597 73,719 73,350 81,146 9,0081 55,6 93,3 37,7 14,850 ,137 -,745 24,75 22,93 26,57 24,69 24,50 18,090 4,253 17 34 17 5,00 ,229 -,474 Error tp. 1,4243

Lmite inferior Lmite superior

GOT

,374 ,733 ,672

Lmite inferior Lmite superior

,374 ,733

Para contrastar las hiptesis :


Ho : GOT = 25 H1 : GOT 25

(no diferencia)

Analizar Comparar medias Prueba T para una muestra.

Prueba para una muestra Valor de prueba = 25 95% Intervalo de confianza para la diferencia Inferior Superior -1,70 ,50

GOT

t -1,086

gl 69

Sig. (bilateral) ,281

Diferencia de medias -,60

El promedio de GOT no difiere significativamente de 25 (p-value=0.281)

You might also like