Clase Estadistica Normal

CONTENIDOS
• Distribución normal
• Teorema del límite central
• Nivel de significancia
• Taller práctico
¿Qué es normal, o qué se aparta de la normalidad?
• Para establecer los límites entre lo habitual y lo

raro, es necesario conocer la distribución de la
variable en estudio, en individuos normales.
• Las frecuencias de escalas de intervalos continuos se

representan gráficamente con histogramas.
• La suma de las superficies de todas las barras

equivale al 100% de las observaciones.
HISTOGRAMA
• Eje horizontal: valores

hallados para una
determinada variable
• Eje vertical: número de

casos encontrados para
cada valor o frecuencia de
aparición
• El histograma permite
obtener una primera
impresión visual sobre la
distribución de los datos
Distribución normal
La mayor parte de los fenómenos del comportamiento humano se

comportan de la siguiente manera:
• La mayoría de las puntuaciones se concentran en el centro de la

distribución
• Tanto en el extremo inferior como en el superior, encontraremos sólo

algunos casos
Ejemplo:
 Distribución del coeficiente intelectual de las personas:
 Pocas personas presentan déficit o retardo
 Pocas personas son genios
 La mayoría somos personas medianamente inteligentes
•La distancia entre la línea trazada en la media y el punto de
inflexión de la curva es igual a una desviación estándar
•La distribución queda completamente definida por el

promedio y la desviación estándar:
El promedio ± 1 D.E = 68,3% de los casos.

El promedio ± 2 D.E = 95,4% de los casos.
El promedio ± 3 D.E = 99.7% de los casos.
Gráfica de una distribución normal y significado del
área bajo la curva.
Valores de tensión arterial sistólica en una muestra de 1000 pacientes
isquémicos ingresados en UCI.
Histogramas y gráficos de probabilidad normal de los valores de
peso y edad en dos muestras de pacientes .
La importancia de la distribución normal se debe principalmente a que hay
muchas variables asociadas a fenómenos naturales que siguen el modelo
de la normal
•Caracteres morfológicos de individuos (personas, animales, plantas,...)

de una especie, p.ejm. tallas, pesos, envergaduras, diámetros,
perímetros,...
•Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un

fármaco, o de una misma cantidad de abono.
•Caracteres sociológicos, por ejemplo: consumo de cierto producto por

un mismo grupo de individuos, puntuaciones de examen.
•Caracteres psicológicos, por ejemplo: cociente intelectual, grado de

adaptación a un medio,...
•Errores cometidos al medir ciertas magnitudes.
•Valores estadísticos muéstrales, por ejemplo : la media.
•Otras distribuciones como la binomial o la de Poisson son

aproximaciones normales, ...
Cálculos de áreas bajo la curva
Probabilidad de Ocurrencia
Supongamos que frente a una determinación de glucosa en la sangre

tengamos que definir si este valor es normal o no.
Aceptemos que la glucosa sanguínea tiene una distribución normal con

promedio 83 y desviación estándar 4
Supongamos un paciente con glucosa de 90, para determinar si es habitual

tener ese valor , o superior, debemos conocer la probabilidad con que esto
ocurre
Probabilidad de Ocurrencia
• Para calcular el área bajo la curva, lo cual corresponde a la probabilidad

de ocurrencia, se han construido tablas de áreas de la normal.
• Esta tabla se trabajo, con el concepto de

curva normal estandarizada => media = 0 y S = 1
• Para poder usar estas tabulaciones es necesario transformar la variable

original en que están todos los datos de manera que su promedio y su
desviación estándar tengan esos valores.
Estandarización de las variables
• Para calcular probabilidades con variables que siguen una distribución

normal se usan tablas
• Pero sería imposible tener una tabla para cada posible distribución
normal,
• Solamente tenemos la tabla de la distribución normal estándar.
• Necesitaremos, pues, ser capaces de transformar las variables X

"normales" N(µ,s)
• En variables Z que sigan una distribución normal estándar N(0,1).
• Este proceso se llama tipificación o estandarización de la variable.

Puntaje “z”
• La variable transformada se llama variable normal

estándar y se símbolizará por “z”
• Las puntuaciones “z” son transformaciones que se

hacen a los valores observados, con el propósito de
analizar su distancia respecto a la media en unidades de
desviación estándar.
z = x – promedio
D.E.
Veamos el ejemplo de la glucosa
z = x – promedio
D.E. 90 se encuentra a
z = 90 – 83 = 7 = 1,75 1,75 S del promedio
4 4
Este valor se busca en la Tabla de puntajes “z”, para determinar la probabilidad de

encontrar glicemias iguales o superior a 90 mg por 100 ml de sangre.
El valor encontrado en la Tabla es 0,0401, lo que significa que es probable que haya
un 4,01% de individuos sanos con valores iguales o superior a 90 mg por 100 ml de
sangre.
Veamos otro ejemplo:
Valor observado: 50
Promedio: 60
Desviación estándar: 10
z = 50 – 60 = -10 = -1
10 10
Podemos decir que el valor “50” está localizado a una desviación

estándar por debajo de la media de la distribución .
El valor “30” estará a tres desviaciones estándar por debajo de la

media.
Tabla 1. Áreas bajo la curva normal estándar. Los valores de la tabla que no se muestran en negrita representan la
probabilidad de observar un valor menor o igual a z. La cifra entera y el primer decimal de z se buscan en la primera
columna, y el segundo decimal en la cabecera de la tabla.
Segunda cifra decimal del valor de z
z 0.00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 .5000 .5040 .5080 .5120 .5160 .5199 .5239 .5279 .5319 .5359
0.1 .5398 .5438 .5478 .5517 .5557 .5596 .5636 .5675 .5714 .5753
0.2 .5793 .5832 .5871 .5910 .5948 .5987 .6026 .6064 .6103 .6141
0.3 .6179 .6217 .6255 .6293 .6331 .6368 .6406 .6443 .6480 .6517
Esquema de procedimiento de la
estadística inferencial.
Inferencia de
los parámetros
RECOLECCION
RECOLECCION
DE Población
CALCULO DE mediante
LOS DATOS
DE LOS DATOS
MEDIANTE
MEDIANTE
UNA UNA
ESTADIGRAFOS
técnicas o universo
MUESTRA
MUESTRA estadísticas
apropiadas.
La estadística inferencial puede se utilizada para dos procedimientos:

 Probar hipótesis
Para estimar parámetros
Diagrama

Parámetros
Población
Muestra
Estimadores
¿Qué es una distribución muestral?
 Una distribución muestral es un conjunto de valores sobre una

estadística, calculada de todas las muestras posibles de determinado
tamaño.
 Las distribuciones muestrales de medias, son las más comunes
 Si calculáramos la media de todas las medias de las muestras

posibles, obtendríamos el valor de la media poblacional.
 Es más bien un concepto estadístico para los investigadores; lo que

comúnmente se hace es extraer una sola muestra.
¿En qué consiste la prueba de hipótesis?
 Es una proposición respecto a uno o varios parámetros.
 Lo que el investigador hace a través de la prueba de hipótesis

es determinar si la hipótesis es consistente con los datos
obtenidos en la muestra.
 Hipótesis consistente => valor aceptable

del parámetro
 Hipótesis no es consistente => se rechaza H

¿CÓMO PODREMOS SABER SÍ LA HIPÓTESIS ES
CONSISTENTE O NO LO ES?
¿Al trabajar con una sola muestra , necesitamos saber si

el estadísgrafo de esta muestra, está cerca del
estadígrafo de la distribución muestral?
Para ello , nos es útil es
Teorema del Límite central

¿QUÉ DICE EL T. L. C.?
“ Es una proposición de que aún en muestras de tamaño

moderado ( más de 100 casos) , la distribución de las muestras
será aproximadamente normal.”
“ Especifica que la distribución muestral tiene una media

igual a la de la población , una varianza igual a la varianza de
la población dividida por el tamaño de la muestra y se
distribuye normalmente, donde la varianza puede estimarse
por la desviación estándar de la muestra.”
¿PARA QUE SIRVE?
“ Para hacer estadística inferencial sobre los valores de

una población”
Por lo tanto, podemos decir que el TLC
 Cuanto mayor es el tamaño de la muestra , menos es la

variabilidad y por lo tanto más similar a la media de la
población será la media obtenida de la muestra
 Cuanto menor sea el grado de la variabilidad (σ/√n), más

ajustada a la media de la población serán las medias
que obtengamos de una muestra.
Qué hace el investigador......
 El investigador tiene que evaluar si la probabilidad de

que la media de la muestra esté cerca de la media de la
distribución muestral es grande o es pequeña.
 Si es pequeña, el investigador dudará de generalizar a

la población y viceversa
¿Qué se entiende por nivel de
significancia o nivel α ?
El nivel alfa (α) es un nivel de probabilidad de equivocarse y

se fija antes de probar hipótesis inferenciales.
¿Y con qué porcentaje tiene confianza el investigador

para generalizar?
 El nivel de significancia del 0,01
 El nivel de significancia del 0,05
Por lo tanto; el nivel de significancia es un valor de

certeza que fija el investigador “a priori”
¿Cómo se relacionan la distribución muestral y el nivel
de significancia?
La distribución muestral
El nivel de significancia se también se expresa como
expresa en términos de probabilidad
probabilidad
Área total de esta
0,05 1,0
0,01
Para ver si tenemos o no confianza al generalizar
acudimos a la distribución muestral ; ya que el nivel
de significancia lo tomamos como un área bajo la
distribución muestral.
EL NIVEL DE SIGNIFICANCIA REPRESENTA AREAS DE

RIESGO O CONFIANZA EN LA DISTRIBUCIÓN
MUESTRAL.
Aplicado el concepto de probabilidad a la distribución muestral
podemos tomar el área de ésta como “1”.
Cualquier área comprendida entre dos puntos corresponderá a la

probabilidad de la distribución.
Para probar hipótesis inferenciales respecto a la media, el

investigador debe evaluar si es alta o baja la probabilidad de que la
media de la muestra esté cerca de la media de la distribución
muestral.
Si es baja el investigador dudará de generalizar a la población.
Si es alta, el investigador podrá hacer generalizaciones.
Es aquí donde entra el nivel de significancia o nivel alfa (α) => nivel
de probabilidad de equivocarse.
¿Qué hacemos para ver si nuestra hipótesis sobre la media
poblacional es aceptada o rechazada?
Debemos recordar que:

- La distribución muestral es una distribución normal de
puntuaciones z
- Las puntuaciones z son distancias que indican áreas bajo la

distribución normal
- Área de riesgo => área de rechazo de la hipótesis

Área de confianza => área de aceptación de la hipótesis
- Se habla de una hipótesis acerca del parámetro

Si nos dieran 95 boletos de 100 para la rifa de un automóvil
¿tendríamos confianza en que el auto será nuestro?....
Lo mismo hace el investigador, obtiene una estadística en una

muestra y analiza que porcentaje tiene de confianza en que
dicha estadística se acerque al valor de la distribución muestral
(universo), busca una probabilidad elevada para inferir con
seguridad dicho resultado a la población general.
¿y con qué porcentaje tiene confianza el
investigador para generalizar?
 El nivel de significancia de 0.05, el cual implica que el

investigador tiene el 95% de seguridad para generalizar sin
equivocarse.
 El nivel de significancia de 0.01, el cual implica que el

investigador tiene el 99% para generalizar sin temor a
equivocarse y 1% en contra.
 No se acepta un nivel de 0.06 (94% a favor de la

generalización confiable), ya que se busca hacer ciencia y no
intuición)
VEAMOS EL PROCEDIMIENTO
1. Establecer una hipótesis acerca del parámetro poblacional.
2. Definir el nivel de significancia
3. Recolectar los datos en una muestra representativa
4. Estimar la desviación estándar de la distribución muestral de

la media
5. Transformar la media de la muestra en una puntuación z
6. En la tabla de áreas bajo la curva normal, buscar valor z
7. Comparo la media de mi muestra transformada a puntuación z

con el valor 1,96. ; si es menor acepto la hipótesis y si es
mayor la rechazo.
Es importante recordar:
Recordar que la distribución muestral es una

distribución normal de puntuaciones “z”, o unidades
de desviación estándar.
Las puntuaciones “z” son distancias que indican

áreas bajo la distribución normal. En este caso, áreas
de probabilidad.
El área de riesgo es tomada como el área de rechazo

de la hipótesis y el área de confianza es tomada
como el área de aceptación de la hipótesis.

Clase Estadistica Normal

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Clase Estadistica Normal

Uploaded by

Copyright:

Available Formats

CONTENIDOS

• Teorema del límite central

• Para establecer los límites entre lo habitual y lo

• Las frecuencias de escalas de intervalos continuos se

• La suma de las superficies de todas las barras

• Eje horizontal: valores

• Eje vertical: número de

La mayor parte de los fenómenos del comportamiento humano se

• La mayoría de las puntuaciones se concentran en el centro de la

• Tanto en el extremo inferior como en el superior, encontraremos sólo

•La distribución queda completamente definida por el

El promedio ± 1 D.E = 68,3% de los casos.

•Caracteres morfológicos de individuos (personas, animales, plantas,...)

•Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un

•Caracteres sociológicos, por ejemplo: consumo de cierto producto por

•Caracteres psicológicos, por ejemplo: cociente intelectual, grado de

•Errores cometidos al medir ciertas magnitudes.

•Valores estadísticos muéstrales, por ejemplo : la media.

•Otras distribuciones como la binomial o la de Poisson son

Supongamos que frente a una determinación de glucosa en la sangre

Aceptemos que la glucosa sanguínea tiene una distribución normal con

Supongamos un paciente con glucosa de 90, para determinar si es habitual

• Para calcular el área bajo la curva, lo cual corresponde a la probabilidad

• Esta tabla se trabajo, con el concepto de

• Para poder usar estas tabulaciones es necesario transformar la variable

• Para calcular probabilidades con variables que siguen una distribución

• Solamente tenemos la tabla de la distribución normal estándar.

• Necesitaremos, pues, ser capaces de transformar las variables X

• En variables Z que sigan una distribución normal estándar N(0,1).

• Este proceso se llama tipificación o estandarización de la variable.

• La variable transformada se llama variable normal

• Las puntuaciones “z” son transformaciones que se

Este valor se busca en la Tabla de puntajes “z”, para determinar la probabilidad de

Podemos decir que el valor “50” está localizado a una desviación

El valor “30” estará a tres desviaciones estándar por debajo de la

Segunda cifra decimal del valor de z

La estadística inferencial puede se utilizada para dos procedimientos:

 Una distribución muestral es un conjunto de valores sobre una

 Las distribuciones muestrales de medias, son las más comunes

 Si calculáramos la media de todas las medias de las muestras

 Es más bien un concepto estadístico para los investigadores; lo que

 Es una proposición respecto a uno o varios parámetros.

 Lo que el investigador hace a través de la prueba de hipótesis

 Hipótesis consistente => valor aceptable

 Hipótesis no es consistente => se rechaza H

¿Al trabajar con una sola muestra , necesitamos saber si

Teorema del Límite central

“ Es una proposición de que aún en muestras de tamaño

“ Especifica que la distribución muestral tiene una media

¿PARA QUE SIRVE?

“ Para hacer estadística inferencial sobre los valores de

 Cuanto mayor es el tamaño de la muestra , menos es la

 Cuanto menor sea el grado de la variabilidad (σ/√n), más

 El investigador tiene que evaluar si la probabilidad de

 Si es pequeña, el investigador dudará de generalizar a

El nivel alfa (α) es un nivel de probabilidad de equivocarse y

¿Y con qué porcentaje tiene confianza el investigador

 El nivel de significancia del 0,05

Por lo tanto; el nivel de significancia es un valor de

Área total de esta

EL NIVEL DE SIGNIFICANCIA REPRESENTA AREAS DE

Cualquier área comprendida entre dos puntos corresponderá a la

Para probar hipótesis inferenciales respecto a la media, el

Debemos recordar que: