You are on page 1of 15

DISTRIBUCIN NORMAL

En estadstica y probabilidad se llama distribucin normal, distribucin de Gauss


o distribucin gaussiana, a una de las distribuciones de probabilidad de variable continua
que con ms frecuencia aparece aproximada en fenmenos reales.

La grfica de su funcin de densidad tiene una forma acampanada y es simtrica


respecto de un determinado parmetro estadstico. Esta curva se conoce como campana de
Gauss y es el grfico de una funcin gaussiana.

La importancia de esta distribucin radica en que permite modelar numerosos


fenmenos naturales, sociales y psicolgicos. Mientras que los mecanismos que subyacen a
gran parte de este tipo de fenmenos son desconocidos, por la enorme cantidad de variables
incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse
asumiendo que cada observacin se obtiene como la suma de unas pocas causas
independientes.

De hecho, la estadstica descriptiva slo permite describir un fenmeno, sin


explicacin alguna. Para la explicacin causal es preciso el diseo experimental, de ah que
al uso de la estadstica en psicologa y sociologa sea conocido como mtodo correlacional.

La distribucin normal tambin es importante por su relacin con la estimacin por


mnimos cuadrados, uno de los mtodos de estimacin ms simples y antiguos.

Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el modelo de la


normal son:

caracteres morfolgicos de individuos como la estatura;

caracteres fisiolgicos como el efecto de un frmaco;

caracteres sociolgicos como el consumo de cierto producto por un mismo grupo de


individuos;

caracteres psicolgicos como el cociente intelectual;

nivel de ruido en telecomunicaciones;

errores cometidos al medir ciertas magnitudes;

etc.
La distribucin normal tambin aparece en muchas reas de la propia estadstica. Por
ejemplo, la distribucin muestral de las medias muestrales es aproximadamente normal,
cuando la distribucin de la poblacin de la cual se extrae la muestra no es normal. 1
Adems, la distribucin normal maximiza la entropa entre todas las distribuciones con
media y varianza conocidas, lo cual la convierte en la eleccin natural de la distribucin
subyacente a una lista de datos resumidos en trminos de media muestral y varianza. La
distribucin normal es la ms extendida en estadstica y muchos tests estadsticos estn
basados en una supuesta "normalidad".

En probabilidad, la distribucin normal aparece como el lmite de varias distribuciones de


probabilidades continuas y discretas.

Distribucin normal

La lnea verde corresponde a la distribucin normal


estndar
Funcin de densidad de probabilidad

Funcin de distribucin de probabilidad


Parmetros

Dominio

Funcin de densidad
(pdf)

Funcin de
distribucin (cdf)

Media

Mediana

Moda

Varianza

Coeficiente de
0
simetra

Curtosis 0

CAMPANA DE GAUSS
Es una representacin grfica de la distribucin normal de un grupo de datos. stos
se reparten en valores bajos, medios y altos, creando un grfico de forma acampanada y
simtrica con respecto a un determinado parmetro. Se conoce como curva o campana de
Gauss o distribucin Normal.

Historia

Aunque la campana de Gauss lleva el nombre del genio de las matemticas Carl
Friedrich Gauss , realmente la distribucin normal la descubri y publico por primera vez
Abraham Moivre (por eso en algunos libros se llama la distribucin de Moivre Gauss) en
un artculo del ao 1733, que reprodujo en la segunda edicin de su obra The Doctrine of
Chance (1738) como aproximacin de la distribucin normal para valores grandes de n.
Este resultado fue ampliado por Pierre-Simon de Laplace en su libro Teora analtica de las
probabilidades (1812).
El nombre de Gauss se ha asociado a esta distribucin porque la us con profusin
cuando analizaba datos astronmicos y algunos autores le atribuyen un descubrimiento
independiente del de De Moivre. El nombre de "campana" se lo dio Esprit Jouffret que uso
este trmino (bell surface) (superficie campana) por primera vez en 1872.

Ecuaciones

La campana de Gauss est definida por la funcin:

Propiedades

El campo de existencia es cualquier valor real, es decir, (-, +).

Es simtrica respecto a la media .

Tiene un mximo en la media .

Crece hasta la media y decrece a partir de ella.

En los puntos y + presenta puntos de inflexin.

El eje de abscisas es una asntota de la curva.

El rea del recinto determinado por la funcin y el eje de abscisas es igual a la


unidad.

Al ser simtrica respecto al eje que pasa por x = , deja un rea igual a 0.5 a la
izquierda y otra igual a 0.5 a la derecha.

La probabilidad equivale al rea encerrada bajo la curva.

p( - < X + ) = 0.6826 = 68.26 %

p( - 2 < X + 2) = 0.954 = 95.4 %

p( - 3 < X + 3) = 0.997 = 99.7 %

Aplicaciones
Una de las mayores aportaciones al clculo integral que realiz Gauss, fue la introduccin
de esta funcin. Este grfico se usa en variables asociadas a fenmenos naturales que
siguen el modelo de la normal.

Caracteres morfolgicos de individuos (personas, animales, plantas,...) de una


especie, p.ejm. tallas, pesos, envergaduras, dimetros, permetros,...

Caracteres fisiolgicos, por ejemplo: efecto de una misma dosis de un frmaco, o de


una misma cantidad de abono.

Caracteres sociolgicos, por ejemplo: consumo de cierto producto por un mismo


grupo de individuos, puntuaciones de examen.

Caracteres [Psicologa|psicolgicos]], por ejemplo: cociente intelectual, grado de


adaptacin a un medio,...

Errores cometidos al medir ciertas magnitudes.

Valores estadsticos muestrales, por ejemplo: la media.

VARIABLES CONTINAS EN LA DISTRIBUCIN


NORMAL

Se denomina variable continua a aquella que puede


tomar cualquiera de los infinitos valores existentes
dentro de un intervalo. En el caso de variable
continua la distribucin de probabilidad es la
integral de la funcin de densidad, por lo que
tenemos entonces que:

Distribucin normal.

En el caso de una variable aleatoria continua no tiene sentido plantearse


probabilidades de resultados aislados. La probabilidad de valores puntuales es cero. El
inters de estas probabilidades est en conocer la probabilidad correspondiente a un
intervalo.

Dicha probabilidad se conoce mediante una curva llamada funcin de densidad y


suponiendo que bajo dicha curva hay un rea de una unidad.

Conociendo esta curva, basta calcular el rea correspondiente para conocer la probabilidad
de un intervalo cualquiera.

CALCULO DEL REA BAJO LA CURVA


En una curva normal, el rea bajo la curva desde el extremo izquierdo hasta la media, es
decir, hasta el eje de simetra, es del 50% y, obviamente, el otro 50% est en la parte
derecha.

Una caracterstica importante de la curva normal y de los datos normalizados es que el rea
bajo la curva desde la media hasta una desviacin estndar, es decir desde z = 0 hasta z = 1,
ya sea a la izquierda o a la derecha, siempre es del 34.13% respecto del rea total que puede
haber bajo la curva. Ver parte superior de la figura 16.5.

De la misma forma, el rea bajo la curva desde la media hasta dos desviaciones estndar,
es decir desde z=0 hasta z=2 , ya sea a la izquierda o a la derecha, es del 47.72%. Ver parte
inferior de la figura 16.5.
Como la curva normal sale de graficar los datos recolectados, es
obvio que esos porcentajes de reas bajo la curva tambin lo son para
dichos datos, es decir, para una desviacin estndar, el porcentaje de
datos entre la media y z = 1 es de 34.13% aproximadamente; para dos
desviaciones estndar el porcentaje de datos entre la media y z = 2 es
tambin aproximadamente de 47.72%.

Por lo tanto, es posible obtener el porcentaje de rea bajo la curva


entre la media y cualquier valor estandarizado z, lo cual se ha
concentrado en una tabla. La tabla de la siguiente pgina expresa el
porcentaje de rea desde la media hasta cada correspondiente valor z.
Esto ltimo es muy importante: Debe tomarse en cuenta que los
valores mostrados en la tabla son siempre desde la media hasta el valor
estandarizado z.

Ejemplo 1: Al recolectar 250 datos, se obtuvo que la media es x = 7.65


y la desviacin estndar s = 2.24 . Calcular el nmero de datos
aproximados que hay entre la media y el dato nominal x = 8.1.

Solucin: En este caso el enunciado proporciona los valores de la media


y de la desviacin estndar, por lo que los incisos a) y b) del proceso
quedan sin efecto. Entonces, continuando con el inciso c), hay que
convertir a dato z el valor nominal x = 8.1. Con la frmula dada, o sea:

Se toman solamente dos decimales porque as vienen en las


tablas. A continuacin, conforme a lo establecido en el inciso d) se busca
en las tablas (ver pgina siguiente) el valor de z = 0.20 , para lo cual se
localiza en la columna z de la izquierda el valor 0.2 y en la primera fila
de la tabla el 0. La celda interseccin de lo anterior es el valor buscado
para z = 0.20 .

El valor que le corresponde de 7.93% es el porcentaje de rea bajo la


curva entre la media y el dato z = 0.20 , pero como ese porcentaje
tambin corresponde a los datos recolectados, entonces puede
obtenerse por una simple regla de tres el nmero de datos nominales
comprendidos en esa regin:
de donde el nmero de datos nd es

El nmero datos en forma calculada es nd = 19.82, pero ese valor


carece de sentido ya que los datos recolectados siempre son nmeros
enteros, porque se recolectan 200 datos, o 220 datos, o 300 datos, pero
jams 291.8. Entonces entre la media aritmtica y el dato z = 0.20 no
pueden haber 19.82 datos nominales, o hay 19 o hay 20, pero no una
fraccin de ellos. De manera que lo correcto es redondear y expresarlo
no como que es igual, sino como aproximadamente. La solucin
entonces se expresa as:

Hay aproximadamente 20 datos entre la media x = 7.65 y el dato


nominal x = 8.1

CALIFICACIN ESTNDAR Z
Puntuacin Z tambin conocido como puntuacin estndar o calificacin estndar z, es el
mtodo de clculo de cuntas desviaciones estndar en un conjunto de datos est por
encima o por debajo de la media. La distancia entre la media y una puntuacin z dada en
cada distribucin normal corta una proporcin de la superficie total por debajo de la curva.
Puntuaciones z son particularmente informativos cuando la distribucin a las que se
refieren es normal. El estndar de calificacin transformacin es til, en particular cuando
tratando de comparar las posiciones relativas de elementos de distribuciones con diferentes
medios y; o con diferentes desviaciones estndar
Z frmula de calificacin
La puntuacin estndar puede calcularse mediante la frmula siguiente

donde:
x es una puntuacin cruda para ser normalizado
es la media de la poblacin
es la desviacin estndar de la poblacin

La puntuacin cruda es por debajo de la Media cuando z es negativo. Del mismo modo la
puntuacin cruda es por encima de la Media cuando z es positivo. La cantidad representada
por puntuacin estndar z es la distancia entre la puntuacin cruda y la media de la
poblacin en trminos de desviacin estndar.

La coleccin de herramientas emplea el estudio de mtodos y procedimientos utilizados


para que recopilar, organizar y analizar datos para comprender la teora de la probabilidad y
estadstica. El conjunto de ideas que pretende ofrecer la manera de hacer la implicacin
cientfica de tales como resultado datos resumidos. En muchas aplicaciones es necesario
calcular la puntuacin estndar para un determinado conjunto de datos. Con esta norma en
lnea calculadora de puntuacin sin esfuerzo puede hacer el clculo de la puntuacin z para
conjunto de datos.
DISTRIBUCIN BINOMIAL
Distribucin de Bernoulli de parmetro p
Es la distribucin de probabilidad que se asocia a variables que slo toman dos valores, el 0
y el 1. P(X = 1) = p ; P(X = 0) = 1 - p ; 0 < p < 1

Intuitivamente, una variable dicotmica de Bernoulli aparece asociada a un experimento


xito-fracaso, donde 1 representa el xito y 0 el fracaso.

Distribuciones binomial de parmetros n y p (B(n; p))


Es la distribucin de probabilidad que se asocia a variables que toman los valores 0; 1; : : : ;
n con probabilidades

Intuitivamente, una variable binomial modeliza el recuento del nmero de xitos al repetir n
veces un experimento xito-fracaso (de Bernoulli) de parmetro p.

Lice

Ejemplo 1
Con objeto de estudiar el nmero de salmones de cierto ro que llegan vivos al mar se
marca el 20% de la camada en el lugar de nacimiento. Posteriormente, en una estacin
de seguimiento ro abajo, se registra el paso de 10 salmones de dicha camada. Cul
es la probabilidad de que se registren 3 de los marcados? Y con qu probabilidad se
registrarn 2 menos de los marcados?
X nmero de salmones marcados que se registran B(10; 0:2)

Caractersticas
Una distribucin binomial o de Bernoulli tiene las siguientes caractersticas:

1. En cada prueba del experimento slo son posibles dos resultados: xito y fracaso.

2. La probabilidad de xito es constante, es decir, que no vara de una prueba a otra. Se


representa por p.

3. La probabilidad de fracaso tambin es constante, Se representa por q, q = 1 p

3. El resultado obtenido en cada prueba es independiente de los resultados obtenidos


anteriormente.

5. La variable aleatoria binomial, X, expresa el nmero de xitos obtenidos en las n


pruebas. Por tanto, los valores que puede tomar X son: 0, 1, 2, 3, 4, ..., n.

La distribucin binomial se expresa por B(n, p)

Empleo
Clculo de probabilidades en una distribucin binomial

n es el nmero de pruebas.
k es el nmero de xitos.

p es la probabilidad de xito.

q es la probabilidad de fracaso.

El nmero combinatorio

Ejemplo

La ltima novela de un autor ha tenido un gran xito, hasta el punto de que el 80% de los
lectores ya la han ledo. Un grupo de 4 amigos son aficionados a la lectura:

1. Cul es la probabilidad de que el grupo hayan leido la novela 2 personas?

n=4

p = 0.8

q = 0.2

B(4, 0.8)

2.Y cmo mximo 2?

Formulas
Parmetros de la distribucin binomial
Media
Varianza
Desviacin tpica

Ejemplo

La probabilidad de que un artculo producido por una fbrica sea defectuoso es 0.02. Se
envi un cargamento de 10.000 artculos a unos almacenes. Hallar el nmero esperado de
artculos defectuosos, la varianza y la desviacin tpica.

DISTRIBUCIN DE POISSON
Caractersticas:
En este tipo de experimentos los xitos buscados son expresados por unidad de rea,
tiempo, pieza, etc, etc,:
- # de defectos de una tela por m2
- # de aviones que aterrizan en un aeropuerto por da, hora, minuto, etc, etc.
- # de bacterias por cm2 de cultivo
- # de llamadas telefnicas a un conmutador por hora, minuto, etc, etc.
- # de llegadas de embarcaciones a un puerto por da, mes, etc, etc.
Para determinar la probabilidad de que ocurran x xitos por unidad de tiempo, rea, o
producto, la frmula a utilizar sera:

donde:
p(x, ) = probabilidad de que ocurran x xitos, cuando el nmero promedio de ocurrencia
de ellos es
= media o promedio de xitos por unidad de tiempo, rea o producto
= 2.718
x = variable que nos denota el nmero de xitos que se desea que ocurra

Hay que hacer notar que en esta distribucin el nmero de xitos que ocurren por unidad de
tiempo, rea o producto es totalmente al azar y que cada intervalo de tiempo es
independiente de otro intervalo dado, as como cada rea es independiente de otra rea dada
y cada producto es independiente de otro producto dado.

Ejemplo:
1 Si un banco recibe en promedio 6 cheques sin fondo por da, cules son las
probabilidades de que reciba, a) cuatro cheques sin fondo en un da dado, b) 10
cheques sin fondos en cualquiera de dos das consecutivos?
2
Solucin:
a) x = variable que nos define el nmero de cheques sin fondo que llegan al banco en un
da cualquiera = 0, 1, 2, 3, ....., etc, etc.
= 6 cheques sin fondo por da
= 2.718

b) x= variable que nos define el nmero de cheques sin fondo que llegan al banco en dos
das consecutivos = 0, 1, 2, 3, ......, etc., etc.
= 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das consecutivos

Nota: siempre debe de estar en funcin de x siempre o dicho de otra forma, debe hablar
de lo mismo que x.

VARIABLES DISCRETAS
Una variable discreta es una variable que slo puede tomar algunos valores dentro
de un mnimo conjunto numerable, es decir, no acepta cualquier valor, slo aquellos que
pertenecen al conjunto. Estas variables se dan de modo coherente separaciones entre
valores observables sucesivos. Dicho con ms rigor, se define una variable discreta como la
variable que hay entre dos valores observables (potencialmente), hay por lo menos un valor
no observable (potencialmente). Como ejemplo, el nmero de animales en una granja (0, 1,
2, 3...).
Uso
La ventaja de trabajar con variables aleatorias discretas es que podemos hacer clculos que
adquieren significado sobre el comportamiento de la variable. En una variable aleatoria,
podemos calcular todos los parmetros que habamos visto en la estadstica
unidimensional: media, varianza moda, mediana, percentiles, desviaciones, etc, aunque
nosotros vamos a centrarnos en las dos primeras, la media y la varianza, (bueno o la
desviacin tpica que era la raz de la varianza si recuerdas)

Formulas y caractersticas

MEDIA: La media de una variable aleatoria se llama ESPERANZA MATEMTICA,


se representa por E(X) o por y viene a darnos el "valor esperado" de la variable al
realizar el experimento aleatorio. La frmula para calcularla es

VARIANZA: El significado es el mismo que en la estadstica. Aporta una medida sobre


la dispersin de los valores de X. Para calcularla usamos una de las dos frmulas, aunque es
ms aconsejable la segunda: