You are on page 1of 27

LA INFERENCIA.

ESTIMACIÓN ESTADÍSTICA POR


INTERVALO DE CONFIANZA
+ PRUEBA NORMALIDAD K-S
(PRUEBA DE HIPÓTESIS)

Joan Calventus S.
http://estadis.webnode.cl
LA INFERENCIA

Supongamos una variable que a ESTADÍSTICA


nivel poblacional se distribuye INFERENCIAL
según la Ley Normal, con su
correspondiente media aritmética.

ESTADÍSTICA
De esta población extraemos al
INFERENCIAL
azar una muestra (representativa)
de n sujetos.

ESTADÍSTICA
DESCRIPTIVA Obtenemos una muestra que
también se distribuye
normalmente, con valores
estadísticos similares a los
parámetros poblacionales.
LA INFERENCIA. LA ESTIMACIÓN (puntual)

Para los efectos de generalizar


científicamente, debemos referir
los análisis estadísticos a toda la
población (con N sujetos), no sólo
a los n sujetos de la muestra.

ESTADÍSTICA
Esta muestra provino INFERENCIAL:
(representativamente) de una La estimación puntual
determinada población, cuyos nos permite inferir el
parámetros se desconocen. valor del parámetro a
partir del valor del
estadístico.

Imaginen que analizamos


estadísticamente una muestra
(de n sujetos) que se distribuye EL RIESGO QUE SE
normalmente, con ciertos ASUME CUANDO SE
estadísticos (media, desviación REALIZA LA ESTIMACIÓN
típica, centiles, etc.). PUNTUAL ES ALTÍSIMO
(P≈1)
LA INFERENCIA. LA ESTIMACIÓN (POR INTERVALO DE CONFIANZA)

Para los efectos de generalizar


científicamente, debemos referir
los análisis estadísticos a toda la
población (con N sujetos), no sólo
a los n sujetos de la muestra.

ESTADÍSTICA
INFERENCIAL:
La estimación por
Esta muestra provino intervalo de confianza
(representativamente) de una nos permite inferir el
determinada población, cuyos valor del parámetro a
parámetros se desconocen. partir del valor del
estadístico,
considerando una
cierta probabilidad de
Imaginen que analizamos que aquel se halle al
estadísticamente una muestra interior de un
(de n sujetos) que se distribuye determinado intervalo.
normalmente, con ciertos
estadísticos (media, desviación
típica, centiles, etc.).
ESTIMACIÓN POR INTERVALO DE CONFIANZA. LA DISTRIBUCIÓN MUESTRAL.

Supongamos una ESTADÍSTICA INFERENCIAL:


variable que a nivel
poblacional se distribuye Se comprueba que los
según la Ley Normal, con promedios aritméticos de las
su correspondiente k medias aritméticas se
media aritmética. distribuyen según la ley
normal y que dicha
distribución presenta una
media aritmética coincidente
De esta población extraemos al con la poblacional:
azar k muestras (muchas)
representativas de la población y
todas ellas de n sujetos.
A la desviación típica de la
distribución muestral de
medias se la denomina error
estándar y su valor responde
al siguiente cálculo:
ESTIMACIÓN POR INTERVALO DE CONFIANZA. LA DISTRIBUCIÓN MUESTRAL.

ESTADÍSTICA INFERENCIAL:
En definitiva, una distribución muestral
de medias es como su nombre indica,
una muestra de medias que se
distribuyen normalmente, con
parámetros como los indicados en las
fórmulas anteriores:
ESTIMACIÓN DE UNA MEDIA ARITMÉTICA POR INTERVALO DE CONFIANZA

ESTADÍSTICA INFERENCIAL:
En la estimación por intervalo de
confianza de una media aritmética
partimos de algunos supuestos básicos:

- La estimación por intervalo se realiza


sobre la distribución muestral de medias.

- Nuestra media aritmética observada en la


muestra representativa servirá como punto
central de la estimación.

- En la distribución muestral de medias,


alguna de las medias que la constituyen
coincidirá con la media aritmética
poblacional que deseamos conocer.
ESTIMACIÓN DE UNA MEDIA ARITMÉTICA POR INTERVALO DE CONFIANZA
ESTIMACIÓN DE UNA MEDIA ARITMÉTICA POR INTERVALO DE CONFIANZA
ESTIMACIÓN DE UNA MEDIA ARITMÉTICA POR INTERVALO DE CONFIANZA
ESTIMACIÓN DE UNA MEDIA ARITMÉTICA POR INTERVALO DE CONFIANZA
ESTIMACIÓN DE UNA MEDIA ARITMÉTICA POR INTERVALO DE CONFIANZA

Ejemplo:
Estimar la media aritmética del CI en una población donde observamos,
siguiendo la ley normal, una muestra (n=30) con los siguientes
estadísticos: m=105 y dt=10
ESTIMACIÓN DE UNA MEDIA O UNA PROPORCIÓN POR INTERVALO DE CONFIANZA

La argumentación
lógica es la misma para
ambos parámetros

Repetiremos
exactamente las
mismas diapos

Pero ahora considerando


una proporción en lugar
de una media…
ESTIMACIÓN DE UNA MEDIA O UNA PROPORCIÓN POR INTERVALO DE CONFIANZA

OJO
IMPORTANTE:

Cuando nos planteamos estimar una


variable cuantitativa… ocupamos media

Cuando nos planteamos estimar una


variable cualitativa… ocupamos proporción

RECUERDA: CUANTI – MEDIA


CUALI - PROPORCIÓN
ESTIMACIÓN DE UNA PROPORCIÓN POR INTERVALO DE CONFIANZA

ESTADÍSTICA INFERENCIAL:
En la estimación por intervalo de
confianza de una proporción partimos de
algunos supuestos básicos:

- La estimación por intervalo se realiza


sobre la distribución muestral de
proporciones.

- Nuestra proporción observada en la


muestra representativa servirá como punto
central de la estimación.

- En la distribución muestral de
proporciones, alguna de las proporciones
que la constituyen coincidirá con la
proporción poblacional que pretendemos
conocer.
ESTIMACIÓN DE UNA PROPORCIÓN POR INTERVALO DE CONFIANZA
ESTIMACIÓN DE UNA PROPORCIÓN POR INTERVALO DE CONFIANZA

Ejemplo:
Estimar la proporción de jóvenes en una población donde observamos
una muestra representativa (n=90) con 30 jóvenes.
ESTIMACIÓN DE MEDIA O PROPORCIÓN POR INTERVALO DE CONFIANZA

OJO
MUY IMPORTANTE:

HEMOS ESTADO ASUMIENDO QUE NUESTRAS


VARIABLES SE DISTRIBUYEN SEGÚN LA LEY
NORMAL !!!

PERO EL CUMPLIMIENTO DE LA
NORMALIDAD EN LA DISTRIBUCIÓN DE LOS
DATOS DEBE COMPROBARSE A TRAVÉS DE
LA PRUEBA DE KOLMOGOROV-SMIRNOV
LA PRUEBA DE KOLMOGOROV-SMIRNOV

A menudo necesitamos corroborar si


los datos de una determinada
muestra o población se acomodan a
la campana de Gauss (curva normal).
n= 100
m= 5
dt= 1
¿…?
=

¿…?
Distribución observada Distribución ideal (tª)
de los datos = de los datos

PRUEBA K-S
LA PRUEBA DE KOLMOGOROV-SMIRNOV

¿…?
=

La prueba K-S calcula una valor Z


que cuantifica la diferencia entre:

Distribución normal ideal


_ Distribución observada

Elevados valores de Z indican grandes diferencias entre ambas distribuciones…

Z muy alta  Distribución observada NO normal

Z muy baja  Distribución observada SÍ normal


LA PRUEBA DE KOLMOGOROV-SMIRNOV

¿…?
=

Valor Z de K-S = Distribución normal ideal


_ Distribución observada

Para determinar si el valor Z calculado es significativamente elevado, consultaremos


su correspondiente grado de significación (P):

Z no significativamente elevada  P>0,05  Distribución observada SÍ normal

Z significativamente elevada  P≤0,05  Distribución observada NO normal


LA PRUEBA DE KOLMOGOROV-SMIRNOV

Ejemplo: Prueba de Kolmogorov-Smirnov para una muestra

EDAD
Una de nuestras variables de estudio N 34
presenta el siguiente resultado en la Parámetros normalesa, b Media 24,97
prueba de normalidad K-S. Des viación típica
4,267

¿La variable se distribuye según la Diferencias más Abs oluta ,237


extremas Pos itiva ,237
ley normal? Negativa -,176
Z de Kolmogorov-Smirnov 1,382
Sig. asintót. (bilateral) ,044
a. La dis tribución de contras te es la Normal.
b. Se han calculado a partir de los datos .

Para determinar si el valor Z (1,38) es significativamente elevado, consultaremos su


correspondiente grado de significación (P):

Dado que P=0,04 < 0,05  existe una diferencia significativa de los datos con la
normalidad  La variable NO se distribuye según la ley normal.
Esta conclusión la asumimos considerando un nivel de confianza del 95% (0,95)
La PRUEBA K-S es una PRUEBA DE HIPÓTESIS

Toda prueba de hipótesis comprueba si una determinada diferencia o un determinado


valor estadístico es significativamente elevado o no.

Antes de realizar cualquier PRUEBA DE HIPÓTESIS, se consideran estas dos posibles


hipótesis estadísticas:

H0 (hipótesis nula): la diferencia o valor estadístico no es elevado significativamente

H1 (hipótesis alternativa): diferencia o valor estadístico sí es significativam. elevado.

En definitiva, cualquier PRUEBA DE HIPÓTESIS, deberá concluir H0 ó H1

La decisión se tomará siempre a través del grado de significación (P):

P > 0,05  H0
P ≤ 0,05  H1
La PRUEBA K-S es una PRUEBA DE HIPÓTESIS
En definitiva, cualquier PRUEBA DE HIPÓTESIS, deberá concluir H0 ó H1
La decisión se tomará siempre a través del grado de significación (P):
P > 0,05  H0
P ≤ 0,05  H1

Pero OJO IMPORTANTE:


El contraste de P con el valor 0,05 es el más común, debido a que acostumbra a
asumirse para las pruebas un nivel de confianza del 95% (o lo que es igual, un riesgo
alfa α de 0,05).

Pero en algunos casos puede exigírsenos para la PRUEBA DE HIPÓTESIS un mayor


nivel de confianza (es decir, un menor riesgo α.

Veamos este último ejemplo…


LA PRUEBA DE KOLMOGOROV-SMIRNOV

Prueba de Kolmogorov-Smirnov para una muestra


Ejemplo:
Edad del
entrevis tado
Una de nuestras variables de estudio N 1200
presenta el siguiente resultado en la Parámetros normalesa, b Media 43,02
prueba de normalidad K-S. Des viación típica
16,752

Asumiendo un riesgo de error alfa del Diferencias más Abs oluta 1,077
extremas Pos itiva 1,077
2% ¿podemos asumir que la variable
Negativa -,068
se distribuye según la ley normal? Z de Kolmogorov-Smirnov 1,675
Sig. asintót. (bilateral) ,038
a. La dis tribución de contras te es la Normal.
b. Se han calculado a partir de los datos.

Para determinar si el valor Z (1,68) es significativamente elevado, consultaremos su


correspondiente grado de significación (P):

Dado que P=0,038 > 0,02  no existe una diferencia significativa de los datos
con la normalidad  La variable SÍ se distribuye según la ley normal.
Esta conclusión la asumimos considerando un riesgo de error α del 2%.
En SÍNTESIS, para una PRUEBA DE HIPÓTESIS

A priori se establecen dos hipótesis, de las que habrá que concluir sólo una:

H0 (hipótesis nula): la diferencia o valor estadístico no es elevado significativamente

H1 (hipótesis alternativa): diferencia o valor estadístico sí es significativam. elevado.

Una vez obtenido el valor del estadístico (por ejemplo Z de K-S) se contrasta P:

P > α  H0
P ≤ α  H1
El valor de α nos indica el riesgo de error (o su complementario, nivel de confianza)
asumidos para el contraste de las hipótesis. ES IMPORTANTE INDICAR ESTE DATO
EN LAS CONCLUSIONES DE TUS ANÁLISIS.
LA INFERENCIA.
ESTIMACIÓN ESTADÍSTICA POR
INTERVALO DE CONFIANZA
+ PRUEBA NORMALIDAD K-S
(PRUEBA DE HIPÓTESIS)

Joan Calventus S.
http://estadis.webnode.cl