You are on page 1of 72

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

DISTRIBUCIONES DE
PROBABILIDAD

http://dxsp.sergas.es
soporte.epidat@sergas.es

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

NDICE
13.1. Clculo de probabilidades.......................................................................................................... 3
13.1.0. Conceptos generales............................................................................................................ 3
13.1.1. Distribuciones discretas ...................................................................................................... 5
13.1.1.1. Distribucin uniforme discreta (a,b)................................................................... 5
13.1.1.2. Distribucin binomial (n,p).................................................................................. 6
13.1.1.3. Distribucin hipergeomtrica (N,R,n) ................................................................ 8
13.1.1.4. Distribucin geomtrica (p) ................................................................................. 9
13.1.1.5. Distribucin binomial negativa (r,p) ................................................................ 10
13.1.1.6. Distribucin Pascal (r,p) ..................................................................................... 12
13.1.1.7. Distribucin Poisson () ..................................................................................... 13
13.1.2. Distribuciones continuas................................................................................................. 16
13.1.2.1. Distribucin uniforme o rectangular (a,b) ....................................................... 16
13.1.2.2. Distribucin normal (, ).................................................................................. 18
13.1.2.3. Distribucin lognormal (, ) ............................................................................ 20
13.1.2.4. Distribucin logstica (a, b) ................................................................................ 21
13.1.2.5. Distribucin beta (p,q) ........................................................................................ 22
13.1.2.6. Distribucin gamma (a,p) .................................................................................. 23
13.1.2.7. Distribucin exponencial ().............................................................................. 25
13.1.2.8. Distribucin ji-cuadrado (n) .............................................................................. 26
13.1.2.9. Distribucin t de Student (n) ............................................................................. 29
13.1.2.10. Distribucin F de Snedecor (n,m) ................................................................... 31
13.1.2.11. Distribucin Cauchy (, ) ............................................................................... 33
13.1.2.12. Distribucin Weibull (a, b) ............................................................................... 34
13.1.2.13. Distribucin Laplace (a, b) ............................................................................... 36
13.1.2.14. Distribucin Pareto (, x0) ................................................................................ 37
13.1.2.15. Distribucin triangular (a, c, b) ....................................................................... 39
13.2. Generacin de distribuciones .................................................................................................. 40
13.2.0. Conceptos generales.......................................................................................................... 40
13.2.1. Distribuciones discretas .................................................................................................... 41
13.2.1.1. Distribucin multinomial ................................................................................... 41
13.2.2. Distribuciones continuas................................................................................................. 44
13.2.2.1. Distribucin normal bivariante ......................................................................... 44
Bibliografa .......................................................................................................................................... 46
Anexo 1: Novedades del mdulo de distribuciones de probabilidad ........................................ 48
Anexo 2: Frmulas del mdulo de distribuciones de probabilidad............................................ 49
Anexo 3: Resumen de las distribuciones discretas ........................................................................ 71
Anexo 4: Resumen de las distribuciones continuas....................................................................... 72

http://dxsp.sergas.es
soporte.epidat@sergas.es

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

13.1. Clculo de probabilidades


13.1.0. Conceptos generales
Uno de los objetivos de la estadstica es el conocimiento cuantitativo de una determinada
parcela de la realidad. Para ello, es necesario construir un modelo de esta realidad particular
objeto de estudio, partiendo de la premisa de que lo real es siempre ms complejo y
multiforme que cualquier modelo que se pueda construir. De todas formas, la formulacin
de modelos aceptados por las instituciones responsables y por los usuarios, permite obviar la
existencia del error o distancia entre la realidad y el modelo.
Los modelos tericos a los que se hace referencia se reducen en muchos casos a (o incluyen
en su formulacin) funciones de probabilidad. La teora de la probabilidad tiene su origen en
el estudio de los juegos de azar, que impulsaron los primeros estudios sobre clculo de
probabilidades en el siglo XVI, aunque no es hasta el siglo XVIII cuando se aborda la
probabilidad desde una perspectiva matemtica con la demostracin de la ley dbil de los
grandes nmeros segn la cual, al aumentar el nmero de pruebas, la frecuencia de un
suceso tiende a aproximarse a un nmero fijo denominado probabilidad. Este enfoque,
denominado enfoque frecuentista, se modela matemticamente en el siglo XX cuando el
matemtico ruso Andrei Nikolaevich Kolmogorov (1903-1987) formula la teora axiomtica de
la probabilidad [1]. Dicha teora define la probabilidad como una funcin que asigna a cada
posible resultado de un experimento aleatorio un valor no negativo, de forma que se cumpla
la propiedad aditiva. La definicin axiomtica establece las reglas que deben cumplir las
probabilidades, aunque no asigna valores concretos.
Uno de los conceptos ms importantes de la teora de probabilidades es el de variable
aleatoria que, intuitivamente, puede definirse como cualquier caracterstica medible que
toma diferentes valores con probabilidades determinadas. Toda variable aleatoria posee una
distribucin de probabilidad que describe su comportamiento. Si la variable es discreta, es
decir, si toma valores aislados dentro de un intervalo, su distribucin de probabilidad
especifica todos los valores posibles de la variable junto con la probabilidad de que cada uno
ocurra. En el caso continuo, es decir, cuando la variable puede tomar cualquier valor de un
intervalo, la distribucin de probabilidad permite determinar las probabilidades
correspondientes a subintervalos de valores. Una forma usual de describir la distribucin de
probabilidad de una variable aleatoria es mediante la denominada funcin de densidad en el
caso de variables continuas y funcin de masa de probabilidad en el caso de variables
discretas, en tanto que lo que se conoce como funcin de distribucin representa las
probabilidades acumuladas [2][3][4][5][6][7].
Una de las preocupaciones de los cientficos ha sido construir modelos de distribuciones de
probabilidad que pudieran representar el comportamiento terico de diferentes fenmenos
aleatorios que aparecan en el mundo real. La pretensin de modelar lo observable ha
constituido siempre una necesidad bsica para el cientfico emprico, dado que a travs de
esas construcciones tericas, los modelos, poda experimentar sobre aquello que la realidad
no le permita. Por otra parte, un modelo resulta extremadamente til, siempre que se
corresponda con la realidad que pretende representar o predecir, de manera que ponga de
relieve las propiedades ms importantes del mundo que nos rodea, aunque sea a costa de la
simplificacin que implica todo modelo.
En la prctica hay unas cuantas leyes de probabilidad tericas, como son, por ejemplo, la ley
binomial o la de Poisson para variables discretas o la ley normal para variables continuas,
que sirven de modelo para representar las distribuciones empricas ms frecuentes.

http://dxsp.sergas.es
soporte.epidat@sergas.es

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


As, por ejemplo, la variable talla de un recin nacido puede tener valores entre 47 cm y 53
cm, pero no todos los valores tienen la misma probabilidad, porque las ms frecuentes son
las tallas prximas a los 50 cm. En este caso la ley normal se adapta satisfactoriamente a la
distribucin de probabilidad emprica, que se obtendra con una muestra grande de casos.
Epidat 4 ofrece, en este mdulo, procedimientos usuales para calcular probabilidades y sus
inversas, para un conjunto bastante amplio de funciones de distribucin, discretas y
continuas, que son habituales en el proceso de modelacin. Por ejemplo, el conjunto de
distribuciones pertenecientes a la familia exponencial es de uso frecuente en metodologas
como el anlisis de supervivencia o el Modelo Lineal Generalizado. Otras distribuciones son
comunes y habituales en el campo de actuacin de disciplinas tales como la economa, la
biologa, etc. La lista de distribuciones disponibles en Epidat 4 ha sido ampliada con respecto
a la versin anterior del programa.
Cuando la opcin elegida es el clculo de una probabilidad dado un punto x de la
distribucin, se presentan en todos los casos dos resultados: la probabilidad acumulada hasta
ese punto, dicho de otra manera, la probabilidad de que la variable tome valores inferiores o
iguales a x (cola izquierda); y la probabilidad de que la variable tome valores superiores a x
(cola derecha), es decir, el complementario de la cola izquierda. En el caso discreto, a
mayores se presenta la probabilidad de que la variable sea igual al punto x; este resultado no
tiene sentido cuando estamos ante una distribucin continua ya que la probabilidad de que
la variable sea igual a un punto es igual a cero, lo que hace que la inclusin o exclusin del
punto x no influya en el clculo de las colas. Para ciertas distribuciones continuas simtricas
(normal, logstica y t de Student) el programa tambin presenta la probabilidad de dos colas,
es decir, la probabilidad que queda a ambos lados del intervalo (-x, x) (x, -x) segn el punto
sea positivo o negativo, respectivamente. Epidat 4 permite calcular probabilidades para
varios puntos a la vez.
La otra opcin permitida en Epidat consiste en calcular un punto a partir de una
probabilidad, bien sea la probabilidad de la cola izquierda, de la cola derecha o de las dos
colas, siempre que sea posible.
Asimismo, los resultados de Epidat 4 incluyen la media, la varianza, la asimetra y la curtosis
de la correspondiente distribucin, as como la mediana y la moda en el caso de las
distribuciones continuas.
Epidat 4 tambin ofrece la posibilidad de representar grficamente la funcin de distribucin
y la funcin de densidad, o de masa de probabilidad, de cada una de las distribuciones. Estas
grficas pueden ser personalizadas por medio de un editor de grficos que se inicia cada vez
que se genera una grfica.
Aunque cada distribucin fue estudiada de forma independiente, en general el programa
representa las funciones en el intervalo 3 , 3 , que puede ser ampliado por el
usuario hasta 10 , 10 desde el editor. La justificacin para elegir estos intervalos
se basa en la desigualdad de Chebyshev, que establece que [8]:

PrX r

1
r2

donde X es una variable aleatoria de media y varianza 2, y r es un nmero positivo.


Teniendo en cuenta esta desigualdad, se obtiene que en el intervalo 3 , 3 queda
sin representar una probabilidad de 0,11, que se reduce a 0,01 para el intervalo
10 , 10 .
http://dxsp.sergas.es
soporte.epidat@sergas.es

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


13.1.1. Distribuciones discretas
Las distribuciones discretas incluidas en el mdulo de Clculo de probabilidades son:
-

Uniforme discreta

Binomial negativa

Binomial

Pascal

Hipergeomtrica

Poisson

Geomtrica

En el Anexo 3 se incluye una tabla que resume las caractersticas de estas distribuciones.
13.1.1.1. Distribucin uniforme discreta (a,b)
La distribucin uniforme discreta describe el comportamiento de una variable discreta que
puede tomar n valores distintos con la misma probabilidad cada uno de ellos. Un caso
particular de esta distribucin, que es la que se incluye en este mdulo de Epidat 4, ocurre
cuando los valores son enteros consecutivos. Esta distribucin asigna igual probabilidad a
todos los valores enteros entre el lmite inferior y el lmite superior que definen el recorrido
de la variable. Si la variable puede tomar valores entre a y b, debe ocurrir que b sea mayor
que a, y la variable toma los valores enteros empezando por a, a+1, a+2, etc. hasta el valor
mximo b. Por ejemplo, cuando se observa el nmero obtenido tras el lanzamiento de un
dado perfecto, los valores posibles siguen una distribucin uniforme discreta en {1, 2, 3, 4, 5,
6}, y la probabilidad de cada cara es 1/6.
Valores:
k: a, a+1, a+2, ..., b, nmeros enteros
Parmetros:
a: mnimo, a entero
b: mximo, b entero con a < b
Ejemplo
El temario de un examen para un proceso selectivo contiene 50 temas, de los cuales se elegir
uno por sorteo. Si una persona no ha estudiado los 15 ltimos temas cul es la probabilidad
de que salga un tema que haya estudiado?
La variable que representa el nmero del tema seleccionado para el examen sigue una
distribucin uniforme con parmetros a = 1 y b = 50. La persona ha estudiado los temas del 1
al 35; por tanto, la probabilidad que se pide es la cola a la izquierda de 35. Para obtener los
resultados en Epidat 4 basta con proporcionarle los parmetros de la distribucin, y
seleccionar la opcin de calcular probabilidades para el punto 35.

http://dxsp.sergas.es
soporte.epidat@sergas.es

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Resultados con Epidat 4:

La persona tiene una probabilidad del 70% de que el tema elegido sea uno de los que haya
estudiado.

13.1.1.2. Distribucin binomial (n,p)


La distribucin binomial es una distribucin discreta muy importante que surge en muchas
aplicaciones bioestadsticas. Fue obtenida por Jakob Bernoulli (1654-1705) y publicada en su
obra pstuma Ars Conjectandi en 1713.
Esta distribucin aparece de forma natural al realizar repeticiones independientes de un
experimento que tenga respuesta binaria, generalmente clasificada como xito o fracaso;
este experimento recibe el nombre de experimento de Bernoulli. Ejemplos de respuesta
binaria pueden ser el hbito de fumar (s/no), si un paciente hospitalizado desarrolla o no
una infeccin, o si un artculo de un lote es o no defectuoso. La variable discreta que cuenta
el nmero de xitos en n pruebas independientes de ese experimento, cada una de ellas con
la misma probabilidad de xito igual a p, sigue una distribucin binomial de parmetros n
y p, que se denota por (Bi(n,p)). Este modelo se aplica a poblaciones finitas de las que se
toman elementos al azar con reemplazo, y tambin a poblaciones conceptualmente infinitas,
como por ejemplo las piezas que produce una mquina, siempre que el proceso de
produccin sea estable (la proporcin de piezas defectuosas se mantiene constante a largo
plazo) y sin memoria (el resultado de cada pieza no depende de las anteriores).
Un ejemplo de variable binomial puede ser el nmero de pacientes con cncer de pulmn
ingresados en una unidad hospitalaria.
Un caso particular se tiene cuando n=1, que da lugar a la distribucin de Bernoulli.
En Epidat 4 el nmero de pruebas de la distribucin binomial est limitado a 1.000; para
valores superiores no es posible realizar el clculo. Esta restriccin no debe ser considerada
un inconveniente dado que, cuando se tiene un nmero de pruebas grande, la distribucin
binomial se aproxima a una distribucin normal de media np y varianza np(1-p) [8].

http://dxsp.sergas.es
soporte.epidat@sergas.es

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Valores:
k: 0, 1, 2, ..., n
Parmetros:
n: nmero de pruebas, n 1 entero
p: probabilidad de xito, 0 < p < 1
Ejemplo
En un examen formado por 20 preguntas, cada una de las cuales se responde declarando
verdadero o falso, el alumno sabe que, histricamente, en el 75% de los casos la
respuesta correcta es verdadero y decide responder al examen tirando dos monedas: pone
falso si ambas monedas muestran una cara y verdadero si al menos hay una cruz. Se
desea saber cual es la probabilidad de que tenga ms de 14 aciertos.
Hay que proporcionarle a Epidat 4 los parmetros de la distribucin binomial y el punto k a
partir del cual se calcular la probabilidad. En este caso n = 20, p = 0,75 y el punto k = 14.
Resultados con Epidat 4:

La probabilidad de que el alumno tenga ms de 14 aciertos es del 62%.


El programa, adems de calcular probabilidades, proporciona los valores caractersticos de la
distribucin (media, varianza, asimetra y curtosis) como informacin complementaria. Esta
informacin depende solo de los parmetros de la distribucin, no se ve influida por la
opcin elegida a la hora de realizar el clculo (probabilidades o puntos) ni por el punto o
probabilidad sobre el que se realiza dicho clculo.
En este ejemplo, la media indica que 15 es el nmero medio de aciertos mediante la tcnica
de tirar dos monedas.

http://dxsp.sergas.es
soporte.epidat@sergas.es

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


13.1.1.3. Distribucin hipergeomtrica (N,R,n)
La distribucin hipergeomtrica suele aparecer en procesos muestrales sin reemplazo, en los
que se investiga la presencia o ausencia de cierta caracterstica. Pinsese, por ejemplo, en un
procedimiento de control de calidad en una empresa farmacutica, durante el cual se extraen
muestras de las cpsulas fabricadas y se someten a anlisis para determinar su composicin.
Durante las pruebas, las cpsulas son destruidas y no pueden ser devueltas al lote del que
provienen. En esta situacin, la variable que cuenta el nmero de cpsulas que no cumplen
los criterios de calidad establecidos sigue una distribucin hipergeomtrica. Por tanto, esta
distribucin es la equivalente a la binomial, pero cuando el muestreo se hace sin reemplazo,
de forma que la probabilidad de xito no permanece constante a lo largo de las n pruebas, a
diferencia de la distribucin binomial.
Esta distribucin se puede ilustrar del modo siguiente: se tiene una poblacin finita con N
elementos, de los cuales R tienen una determinada caracterstica que se llama xito
(diabetes, obesidad, hbito de fumar, etc.). El nmero de xitos en una muestra aleatoria
de tamao n, extrada sin reemplazo de la poblacin, es una variable aleatoria con
distribucin hipergeomtrica de parmetros N, R y n.
Cuando el tamao de la poblacin es grande, los muestreos con y sin reemplazo son
equivalentes, por lo que la distribucin hipergeomtrica se aproxima en tal caso a la
binomial.
En el caso de esta distribucin, Epidat 4 limita el clculo a valores del tamao de poblacin
(N) menores o iguales que 1.000.
Valores:
k: max{0,n-(N-R)}, ..., min{R,n}, donde max{0,n-(N-R)} indica el valor mximo entre 0 y n(N-R) y min{R,n} indica el valor mnimo entre R y n.
Parmetros:
N: tamao de la poblacin, N 1 entero
R: nmero de xitos en la poblacin; 1 R N, N entero
n: nmero de pruebas; 1 n N, n entero
Ejemplo
Se sabe que el 7% de los tiles quirrgicos en un lote de 100 no cumplen ciertas
especificaciones de calidad. Tomada una muestra al azar de 10 unidades sin reemplazo,
interesa conocer la probabilidad de que no ms de dos sean defectuosas.
El nmero de tiles defectuosos en el lote es R = 0,07100 = 7. Para un tamao muestral de
n= 10, la probabilidad buscada es P{nmero de defectuosos 2}.

http://dxsp.sergas.es
soporte.epidat@sergas.es

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Resultados con Epidat 4:

La probabilidad de que, a lo sumo, haya dos tiles defectuosos en el lote es


aproximadamente 0,98. Adems, puede decirse que la media y la varianza de la distribucin
hipergeomtrica (100, 7, 10) son 0,7 y 0,59, respectivamente; en este caso, la media de tiles
quirrgicos defectuosos en 10 pruebas es de 0,7 y la varianza de 0,59.

13.1.1.4. Distribucin geomtrica (p)


Supngase que se efecta repetidamente un experimento o prueba, que las repeticiones son
independientes y que se est interesado en la ocurrencia o no de un suceso al que se refiere
como xito, siendo la probabilidad de este suceso p. La distribucin geomtrica permite
calcular la probabilidad de que tenga que realizarse un nmero k de repeticiones antes de
obtener un xito por primera vez; esta probabilidad decrece a medida que aumenta k con lo
que la funcin de masa de probabilidad es siempre decreciente. As pues, se diferencia de la
distribucin binomial en que el nmero de repeticiones no est predeterminado, sino que es
la variable aleatoria que se mide y, por otra parte, el conjunto de valores posibles de la
variable es ilimitado.
Para ilustrar el empleo de esta distribucin, se supone que cierto medicamento opera
exitosamente ante la enfermedad para la cual fue concebido en el 80% de los casos a los que
se aplica; la variable aleatoria intentos fallidos en la aplicacin del medicamento antes del
primer xito sigue una distribucin geomtrica de parmetro p = 0,8. Otro ejemplo de
variable geomtrica es el nmero de hijos hasta el nacimiento de la primera nia.
La distribucin geomtrica se utiliza en la distribucin de tiempos de espera, de manera que
si los ensayos se realizan a intervalos regulares de tiempo, esta variable aleatoria
proporciona el tiempo transcurrido hasta el primer xito.
Esta distribucin presenta la propiedad denominada falta de memoria, que implica que la
probabilidad de tener que esperar un tiempo t no depende del tiempo que ya haya
transcurrido.

http://dxsp.sergas.es
soporte.epidat@sergas.es

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Valores:
k: 0, 1, 2, ...
Parmetros:
p: probabilidad de xito, 0 < p < 1
Ejemplo
La probabilidad de que cierto examen mdico d lugar a una reaccin positiva es igual a
0,8, cul es la probabilidad de que ocurran menos de 5 reacciones negativas antes de la
primera positiva?
La variable aleatoria nmero de reacciones negativas antes de la primera positiva sigue
una distribucin geomtrica con parmetro p = 0,8.
Resultados con Epidat 4:

La probabilidad de que ocurran menos de 5 reacciones negativas antes de la primera


positiva es casi 1 (0,9997).

13.1.1.5. Distribucin binomial negativa (r,p)


Una generalizacin obvia de la distribucin geomtrica aparece si se supone que un
experimento se contina hasta que un determinado suceso, de probabilidad p, ocurre por rsima vez. La variable aleatoria que proporciona la probabilidad de que se produzcan k
fracasos antes de obtener el r-simo xito sigue una distribucin binomial negativa de
parmetros r y p, BN(r,p). La distribucin geomtrica corresponde al caso particular en que
r= 1. Un ejemplo es el nmero de lanzamientos fallidos de un dado antes de obtener un 6 en
tres ocasiones, que sigue una BN(3,1/6).
En el caso de que los sucesos ocurran a intervalos regulares de tiempo, esta variable
proporciona el tiempo total hasta que ocurren r xitos, por lo que tambin se denomina
distribucin binomial de tiempo de espera.
La distribucin binomial negativa aparece en un estudio de Pierre Rmond de Montmort
(1678-1719) sobre los juegos de azar en 1714, pero aos antes ya haba sido descrita por Blaise
Pascal (1623-1662). Ms adelante, esta distribucin fue propuesta como una alternativa a la
distribucin de Poisson para modelar el nmero de ocurrencias de un suceso cuando los
datos presentan lo que se conoce como variacin extra-Poisson o sobredispersin. En estas
http://dxsp.sergas.es
soporte.epidat@sergas.es

10

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


situaciones, la varianza es mayor que la media, por lo que se incumple la propiedad que
caracteriza a una distribucin de Poisson, segn la cual la media es igual a la varianza. La
primera aplicacin en bioestadstica la realiz Student (William Sealy Gosset (1876-1937)) a
principios de siglo cuando propuso esta distribucin para modelar el nmero de glbulos
rojos en una gota de sangre. En este caso, la variabilidad extra se debe al hecho de que esas
clulas no estn uniformemente distribuidas en la gota, es decir, la tasa de intensidad no es
homognea.
La distribucin binomial negativa es ms adecuada que la de Poisson para modelar, por
ejemplo, el nmero de accidentes laborales ocurridos en un determinado lapso. La
distribucin de Poisson asume que todos los individuos tienen la misma probabilidad de
sufrir un accidente y que sta permanece constante durante el perodo de estudio; sin
embargo, es ms plausible la hiptesis de que los individuos tienen probabilidades
constantes en el tiempo, pero que varan de unos sujetos a otros; esto es lo que se conoce en
la literatura como la propensin a los accidentes (accident proneness) [9][10]. Esta hiptesis
se traduce en una distribucin de Poisson mixta, o de efectos aleatorios, en la que se supone
que las probabilidades varan entre individuos de acuerdo a una distribucin gamma y esto
resulta en una distribucin binomial negativa para el nmero de accidentes.
El nmero mximo de xitos permitidos en Epidat 4, para realizar clculos de la distribucin
binomial negativa, es 1.000.
Valores:
k: 0, 1, 2, ...
Parmetros:
r: nmero de xitos, r 1 entero
p: probabilidad de xito, 0 < p < 1
Ejemplo
Se sabe que, en promedio, una de cada 100 placas de rayos X que se realizan es defectuosa.
Cul es el nmero medio de placas tiles que se producen entre 10 defectuosas?
Si se considera el primer fallo como punto de inicio, hay que considerar la variable nmero
de placas tiles antes de 9 defectuosas, que sigue una distribucin binomial negativa de
parmetros r = 9 y p = 0,01.
Es necesario hacer notar que, cuando se est interesado en obtener alguno de los valores
caractersticos de la distribucin objeto de estudio (en este ejemplo, nmero medio de placas
tiles), es indiferente calcular probabilidades o puntos, ya que el programa presenta los
valores caractersticos de la distribucin en ambos casos. En este ejemplo, se seleccion la
opcin de calcular la probabilidad del punto 1, aunque se trata de un dato irrelevante en el
clculo del nmero medio de placas tiles. Se puede comprobar fcilmente que la
modificacin del punto o de la opcin de clculo no influyen en los valores caractersticos.

http://dxsp.sergas.es
soporte.epidat@sergas.es

11

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Resultados con Epidat 4:

Entre 10 placas defectuosas se producen, en promedio, unas 891 placas tiles.

13.1.1.6. Distribucin Pascal (r,p)


La distribucin de Pascal debe su nombre al matemtico francs Blaise Pascal (1623-1662),
uno de los matemticos que cre las bases de la teora de la probabilidad.
El nmero de pruebas necesarias para obtener r xitos, siendo p la probabilidad de xito, es
una variable aleatoria que sigue una distribucin Pascal de parmetros r y p. Por tanto, esta
distribucin est relacionada con la binomial negativa de idnticos parmetros del modo
siguiente[11]:
Pascal(r,p) = BN(r,p)+r
Teniendo en cuenta esta relacin, podramos decir que el nmero de lanzamientos de un
dado realizados antes de obtener un 6 en tres ocasiones sigue una Pascal(3,1/6).
De la misma manera que ocurre en la distribucin binomial negativa, Epidat 4 slo permite
realizar el clculo cuando el nmero de xitos considerados es igual o inferior a 1.000.
Valores:
k: r, r+1, r+2, ...
Parmetros:
r: nmero de xitos, r 1 entero
p: probabilidad de xito, 0 < p < 1
Ejemplo
Siguiendo con el ejemplo de la distribucin binomial negativa, si en promedio una de cada
100 placas de rayos X que se realizan es defectuosa, cul es el nmero medio de placas
realizadas entre 10 defectuosas?
Si se considera el primer fallo como punto de inicio, hay que considerar la variable nmero
de placas realizadas antes de 9 defectuosas, que sigue una distribucin de Pascal de
parmetros r = 9 y p = 0,01.

http://dxsp.sergas.es
soporte.epidat@sergas.es

12

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Resultados con Epidat 4:

El nmero medio de placas realizadas entre 10 defectuosas es de 900.

13.1.1.7. Distribucin Poisson ()


La distribucin de Poisson debe su nombre al matemtico francs Simen Denis Poisson
(1781-1840), aunque ya haba sido introducida en 1718 por Abraham De Moivre (1667-1754)
como una forma lmite de la distribucin binomial que surge cuando se observa un evento
raro despus de un nmero grande de repeticiones [12]. En general, la distribucin de
Poisson de parmetro se puede utilizar como una aproximacin de la binomial, Bin(n, p), si
el nmero de pruebas n es grande, pero la probabilidad de xito p es pequea, siendo = np;
podemos considerar que la aproximacin Poisson-binomial es buena si n 20 y p 0,05 y
muy buena si n 100 y p 0,01.
La distribucin de Poisson tambin surge cuando un evento o suceso raro ocurre
aleatoriamente en el espacio o el tiempo. La variable asociada es el nmero de ocurrencias
del evento en un intervalo o espacio continuo, por tanto, es una variable aleatoria discreta
que toma valores enteros de 0 en adelante (0, 1, 2,...). As, el nmero de pacientes que llegan a
un consultorio en un lapso dado, el nmero de llamadas que recibe un servicio de atencin a
urgencias durante 1 hora, el nmero de clulas anormales en una superficie histolgica o el
nmero de glbulos blancos en un milmetro cbico de sangre son ejemplos de variables que
siguen una distribucin de Poisson. En general, es una distribucin muy utilizada en
diversas reas de la investigacin mdica y, en particular, en epidemiologa.
El concepto de evento raro o poco frecuente debe ser entendido en el sentido de que la
probabilidad de observar k eventos decrece rpidamente a medida que k aumenta.
Supngase, por ejemplo, que el nmero de reacciones adversas tras la administracin de un
frmaco sigue una distribucin de Poisson de media = 2. Si se administra este frmaco a
1.000 individuos, la probabilidad de que se produzca una reaccin adversa (k = 1) es 0,27; los
valores de dicha probabilidad para k = 2, 3, 4, 5, 6 reacciones, respectivamente, son: 0,27;
0,18; 0,09; 0,03 y 0,01. Para k = 10 o mayor, la probabilidad es virtualmente 0. El rpido
descenso de la probabilidad de que se produzcan k reacciones adversas a medida que k
aumenta puede observarse claramente en el grfico de la funcin de masa de probabilidad
obtenido con Epidat 4:

http://dxsp.sergas.es
soporte.epidat@sergas.es

13

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Para que una variable recuento siga una distribucin de Poisson deben cumplirse varias
condiciones:
1. En un intervalo muy pequeo (p. e. de un milisegundo) la probabilidad de que
ocurra un evento es proporcional al tamao del intervalo.
2. La probabilidad de que ocurran dos o ms eventos en un intervalo muy pequeo es
tan reducida que, a efectos prcticos, se puede considerar nula.
3. El nmero de ocurrencias en un intervalo pequeo no depende de lo que ocurra en
cualquier otro intervalo pequeo que no se solape con aqul.
Estas propiedades pueden resumirse en que el proceso que genera una distribucin de
Poisson es estable (produce, a largo plazo, un nmero medio de sucesos constante por
unidad de observacin) y no tiene memoria (conocer el nmero de sucesos en un intervalo
no ayuda a predecir el nmero de sucesos en el siguiente).
El parmetro de la distribucin, , representa el nmero promedio de eventos esperados por
unidad de tiempo o de espacio, por lo que tambin se suele hablar de como la tasa de
ocurrencia del fenmeno que se observa.
A veces se usan variables de Poisson con "intervalos" que no son espaciales ni temporales,
sino de otro tipo. Por ejemplo, para medir la frecuencia de una enfermedad se puede contar,
en un perodo dado, el nmero de enfermos en cierta poblacin dividida en "intervalos" de,
por ejemplo, 10.000 habitantes. Al nmero de personas enfermas en una poblacin de
tamao prefijado, en un instante dado, se le denomina prevalencia de la enfermedad en ese
instante y es una variable que sigue una distribucin de Poisson. Otra medida para la
frecuencia de una enfermedad es la incidencia, que es el nmero de personas que enferman
en una poblacin en un periodo determinado. En este caso, el intervalo es de personastiempo, generalmente personas-ao, y es tambin una variable con distribucin de Poisson.
Habitualmente, ambas medidas se expresan para intervalos de tamao unidad o, dicho de
otro modo, en lugar de la variable nmero de enfermos, se usa el parmetro .
La distribucin de Poisson tiene iguales la media y la varianza. Si la variacin de los casos
observados en una poblacin excede a la variacin esperada por la Poisson, se est ante la
presencia de un problema conocido como sobredispersin y, en tal caso, la distribucin
binomial negativa es ms adecuada.
http://dxsp.sergas.es
soporte.epidat@sergas.es

14

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Para valores de mayores de 20 la distribucin de Poisson se aproxima a una distribucin
normal de media y varianza iguales a . Por este motivo no se debe considerar una
limitacin la restriccin que tiene Epidat 4 de no realizar el clculo para valores de
superiores a 50.
Valores:
k: 0, 1, 2, ...
Parmetros:
: tasa de ocurrencia, > 0
Ejemplo
El nmero de enfermos que solicitan atencin de urgencia en un hospital durante un periodo
de 24 horas tiene una media de 43,2 pacientes. Se sabe que el servicio se colapsar si el
nmero de enfermos excede de 50. Cul es la probabilidad de que se colapse el servicio de
urgencias del hospital? Representar la funcin de masa de probabilidad.
Para calcular la probabilidad pedida y, adems, representar la funcin de masa de
probabilidad hay que marcar el cuadro situado en la parte inferior derecha de la pantalla:
Obtener las funciones de distribucin y densidad.
Resultados con Epidat 4:

La probabilidad de que el servicio colapse est cerca de 0,13.

http://dxsp.sergas.es
soporte.epidat@sergas.es

15

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


13.1.2. Distribuciones continuas
Las distribuciones continuas incluidas en el mdulo de Clculo de probabilidades son:
-

Uniforme o rectangular

t de Student

Normal

F de Snedecor

Lognormal

Cauchy

Logstica

Weibull

Beta

Laplace

Gamma

Pareto

Exponencial

Triangular

Ji-cuadrado

En el Anexo 4 se incluye una tabla que resume las caractersticas de estas distribuciones.

13.1.2.1. Distribucin uniforme o rectangular (a,b)


La distribucin uniforme es til para describir una variable aleatoria con probabilidad
constante sobre el intervalo (a,b) en el que est definida y se denota por U(a,b). Tambin es
conocida con el nombre de distribucin rectangular por el aspecto de su funcin de
densidad.
Una peculiaridad importante de esta distribucin es que la probabilidad de un suceso
depende exclusivamente de la amplitud del intervalo considerado y no de su posicin en el
campo de variacin de la variable.
Cualquiera que sea la distribucin F de cierta variable X, la variable transformada Y = F(X)
sigue una distribucin uniforme en el intervalo (0,1). Esta propiedad es fundamental por ser
la base para la generacin de nmeros aleatorios de cualquier distribucin en las tcnicas de
simulacin, y recibe el nombre de mtodo de inversin.
Campo de variacin:
a<x<b
Parmetros:
a: mnimo, - < a <
b: mximo, - < b < con a < b
Ejemplo 1
Supngase una variable que se distribuye uniformemente entre 380 y 1.200. Determnese:
1. La probabilidad de que el valor de la variable sea superior a mil.
2. La media y la desviacin estndar de dicha variable.
A Epidat se le proporcionar el lmite superior e inferior del campo de variacin de la
variable [380, 1.200] y, adems, el punto a partir del cual se quiere calcular la probabilidad.

http://dxsp.sergas.es
soporte.epidat@sergas.es

16

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Resultados con Epidat 4:

La probabilidad de que la variable sea superior a mil se sita en un entorno de 0,24, la media
es 790 y la desviacin estndar, raz cuadrada de la varianza, es aproximadamente 237.
Ejemplo 2
Un contratista A est preparando una oferta sobre un nuevo proyecto de construccin. La
oferta sigue una distribucin uniforme entre 55 y 75 miles de euros. Determnese:
1. La probabilidad de que la oferta sea superior a 60 mil euros.
2. La media y la desviacin estndar de la oferta.
A Epidat se le proporcionar el lmite superior e inferior del campo de variacin de la
variable [55, 75] y, adems, el punto a partir del cual se quiere calcular la probabilidad.
Resultados con Epidat 4:

La probabilidad de que la oferta sea superior a 60 mil euros se sita en un entorno de 0,75, y
la media es 65.

http://dxsp.sergas.es
soporte.epidat@sergas.es

17

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


13.1.2.2. Distribucin normal (, )
La distribucin normal es, sin duda, la distribucin de probabilidad ms importante del
Clculo de probabilidades y de la Estadstica. Fue descubierta, como aproximacin de la
distribucin binomial, por Abraham De Moivre (1667-1754) y publicada en 1733 en su libro
The Doctrine of Chances; estos resultados fueron ampliados por Pierre-Simon Laplace (17491827), quin tambin realiz aportaciones importantes. En 1809, Carl Friedrich Gauss (17771855) public un libro sobre el movimiento de los cuerpos celestes donde asuma errores
normales, por este motivo esta distribucin tambin es conocida como distribucin
Gaussiana.
La importancia de la distribucin normal queda totalmente consolidada por ser la
distribucin lmite de numerosas variables aleatorias, discretas y continuas, como se
demuestra a travs de los teoremas centrales del lmite. Las consecuencias de estos teoremas
implican la casi universal presencia de la distribucin normal en todos los campos de las
ciencias empricas: biologa, medicina, psicologa, fsica, economa, etc. En particular, muchas
medidas de datos continuos en medicina y en biologa (talla, presin arterial, etc.) se
aproximan a la distribucin normal.
Junto a lo anterior, no es menos importante el inters que supone la simplicidad de sus
caractersticas y de que de ella derivan, entre otras, tres distribuciones (ji-cuadrado, t de
Student y F de Snedecor) que se mencionarn ms adelante, de importancia clave en el
campo de la contrastacin de hiptesis estadsticas.
La distribucin normal queda totalmente definida mediante dos parmetros: la media ( ) y
la desviacin estndar o desviacin tpica (). Su funcin de densidad es simtrica respecto a
la media y la desviacin estndar nos indica el mayor o menor grado de apertura de la curva
que, por su aspecto, se suele llamar campana de Gauss. Esta distribucin se denota por
N(,).
Cuando la distribucin normal tiene como parmetros = 0 y = 1 recibe el nombre de
distribucin normal estndar. Cualquier variable X que siga una distribucin normal de
parmetros y se puede transformar en otra variable Y= (X-)/ que sigue una
distribucin normal estndar; este proceso se denomina estandarizacin, tipificacin o
normalizacin.
Campo de variacin:
- < x <
Parmetros:
: media, - < <
: desviacin estndar, > 0
Ejemplo
Se supone que el nivel de colesterol de los enfermos de un hospital sigue una distribucin
normal con una media de 179,1 mg/dL y una desviacin estndar de 28,2 mg/dL.
1. Cul es el porcentaje de enfermos con un nivel de colesterol inferior a 169 mg/dL?
2. Cul ser el valor del nivel de colesterol a partir del cual se encuentra el 10% de los
enfermos del hospital con los niveles ms altos?
3. Representar la funcin de densidad.
Para responder a estas preguntas habr que ejecutar Epidat 4 dos veces: en el primer caso
para calcular una probabilidad, en el segundo caso el dato de entrada es una probabilidad,
http://dxsp.sergas.es
soporte.epidat@sergas.es

18

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


concretamente la cola de la derecha, lo que permitir obtener el punto. En ambas ejecuciones
se ofrece, de manera opcional, la funcin de densidad del nivel de colesterol.
1. Resultados con Epidat 4:

El porcentaje de enfermos con un nivel de colesterol inferior a 169 mg/dL es 36%.


2. Resultados con Epidat 4:

A partir de 215,24 mg/dL se encuentran los valores de colesterol del 10% de los enfermos
que tienen los valores ms altos.

http://dxsp.sergas.es
soporte.epidat@sergas.es

19

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


3. Resultados con Epidat 4:

13.1.2.3. Distribucin lognormal (, )


La variable resultante de aplicar la funcin exponencial a una variable que se distribuye
normal con media y desviacin estndar , sigue una distribucin lognormal con
parmetros (escala) y (forma). Dicho de otro modo, si una variable X sigue una
distribucin lognormal entonces la variable lnX se distribuye normalmente. Esta variable
aleatoria fue propuesta por Francis Galton (1822-1911) en 1879, como consecuencia del
estudio de la media geomtrica de n variables aleatorias independientes.
La distribucin lognormal es til para modelar datos de numerosos estudios mdicos tales
como el perodo de incubacin de una enfermedad, los ttulos de anticuerpo a un virus, el
tiempo de supervivencia en pacientes con cncer o SIDA, el tiempo hasta la seroconversin
de VIH+, etc.
Epidat 4 limita los clculos para esta distribucin a valores del parmetro entre -5 y 5,
ambos inclusive, y a valores del parmetro menores o iguales que 5.
Campo de variacin:
0<x<
Parmetros:
: escala, - < <
: forma, > 0
Ejemplo
Supngase que la supervivencia, en aos, luego de una intervencin quirrgica (tiempo que
pasa hasta que ocurre la muerte del enfermo) en una cierta poblacin sigue una distribucin
lognormal de parmetro de escala 2,32 y de forma 0,20. Calcular la probabilidad de
supervivencia a los 12 aos y la mediana de supervivencia.

http://dxsp.sergas.es
soporte.epidat@sergas.es

20

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Resultados con Epidat 4:

La probabilidad de supervivencia a los 12 aos es prxima a 0,20.


A la vista de los resultados tambin se puede decir que el nmero medio de aos de
supervivencia de un paciente tras una intervencin quirrgica es de, aproximadamente, 10
aos y medio.

13.1.2.4. Distribucin logstica (a, b)


Pierre Franois Verhulst (1804-1849) describi por primera vez la curva logstica en un
trabajo, publicado en 1845, que versaba sobre las investigaciones matemticas en las leyes
que gobiernan el crecimiento de la poblacin.
La distribucin logstica se utiliza en el estudio del crecimiento temporal de variables, en
particular, demogrficas. En biologa se ha aplicado, por ejemplo, para modelar el
crecimiento de clulas de levadura, y para representar curvas de dosis-respuesta en
bioensayos.
La ms conocida y generalizada aplicacin de la distribucin logstica en Ciencias de la Salud
se fundamenta en la siguiente propiedad: si U es una variable uniformemente distribuida en
U
el intervalo (0,1), entonces la variable X ln
sigue una distribucin logstica. Esta
1 U
transformacin, denominada logit, se utiliza para modelar datos de respuesta binaria,
especialmente en el contexto de la regresin logstica.
Los parmetros asociados a esta distribucin son situacin (a) y escala (b). Su funcin de
densidad es simtrica respecto al parmetro a y presenta un perfil ms apuntado que el de la
distribucin normal con la misma media y desviacin estndar (distribucin leptocrtica).
Campo de variacin:
- < x <
Parmetros:
a: situacin, - < a <
b: escala, b > 0

http://dxsp.sergas.es
soporte.epidat@sergas.es

21

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Ejemplo
El crecimiento relativo anual (%) de la poblacin de un determinado pas sigue una
distribucin logstica de parmetro de posicin 1 y de escala 2. Calcular la probabilidad de
que el crecimiento en un ao determinado sea superior al 5% y representar la funcin de
densidad.
Resultados con Epidat 4:

La probabilidad de que la poblacin tenga un crecimiento superior al 5% es del orden de


0,12.

13.1.2.5. Distribucin beta (p,q)


La distribucin beta es adecuada para variables aleatorias continuas que toman valores en el
intervalo (0,1), lo que la hace muy apropiada para modelar proporciones. En la inferencia
bayesiana, por ejemplo, es muy utilizada como distribucin a priori cuando las
observaciones tienen una distribucin binomial.
Uno de los principales recursos de esta distribucin es el ajuste a una gran variedad de
distribuciones empricas, pues adopta formas muy diversas dependiendo de cules sean los
valores de los parmetros de forma p y q, mediante los que viene definida la distribucin,
denotada por Beta(p,q).

http://dxsp.sergas.es
soporte.epidat@sergas.es

22

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Un caso particular de la distribucin beta es la distribucin uniforme en (0,1), que se
corresponde con una beta de parmetros p = 1 y q = 1.
La limitacin que impone Epidat 4 a los valores que pueden tomar sus parmetros es que no
deben ser mayores que 100 para poder realizar los clculos.
Campo de variacin:
0<x<1
Parmetros:
p: forma, p > 0
q: forma, q > 0
Ejemplo
En el presupuesto familiar, la porcin que se dedica a salud sigue una distribucin beta(2,2).
1. Cul es la probabilidad de que se gaste ms del 25% del presupuesto familiar en
salud?
2. Cul ser el porcentaje medio que las familias dedican a la compra de productos y
servicios de salud?
Resultados con Epidat 4:

Teniendo en cuenta la distribucin beta, la probabilidad de que se gaste ms de la cuarta


parte del presupuesto en salud ser 0,84 y el porcentaje medio que las familias dedican a la
compra de productos y servicios de salud ser el 50%.

13.1.2.6. Distribucin gamma (a,p)


La distribucin gamma se puede caracterizar del modo siguiente: si se est interesado en la
ocurrencia de un evento generado por un proceso de Poisson de media , la variable que
mide el tiempo transcurrido hasta obtener n ocurrencias del evento sigue una distribucin
gamma con parmetros a = n (escala) y p = n (forma). Se denota por Gamma(a,p).
Por ejemplo, la distribucin gamma aparece cuando se realiza el estudio de la duracin de
elementos fsicos (tiempo de vida).

http://dxsp.sergas.es
soporte.epidat@sergas.es

23

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Cuando p es un nmero entero positivo se tiene un caso particular de la distribucin gamma
que se denomina distribucin de Erlang. Otros casos particulares de la distribucin gamma,
que se comentarn con detalle ms adelante, son la distribucin exponencial (Gamma(,1)) y
la distribucin ji-cuadrado (Gamma(1/2,n/2)).
Segn los valores que tome el parmetro de forma, p, la funcin de densidad presenta
perfiles muy diversos. Con valores de p menores o iguales que 1, la funcin de densidad
muestra un perfil decreciente; en cambio, si p es mayor que la unidad, la funcin de densidad
crece hasta el valor x= (p-1)/a y decrece a partir de este valor.
Epidat 4 limita los clculos a valores de los parmetros menores o iguales que 25.
Campo de variacin:
0<x<
Parmetros:
a: escala, a > 0
p: forma, p > 0
Ejemplo 1
El nmero de pacientes que llegan a la consulta de un mdico sigue una distribucin de
Poisson de media 3 pacientes por hora. Calcular la probabilidad de que transcurra menos de
una hora hasta la llegada del segundo paciente.
Debe tenerse en cuenta que la variable aleatoria tiempo que transcurre hasta la llegada del
segundo paciente sigue una distribucin Gamma (6, 2).
Resultados con Epidat 4:

La probabilidad de que transcurra menos de una hora hasta que llegue el segundo paciente
es 0,98.
Ejemplo 2
Suponiendo que el tiempo de supervivencia, en aos, de pacientes que son sometidos a una
cierta intervencin quirrgica en un hospital sigue una distribucin gamma con parmetros
a = 0,81 y p = 7,81, interesa saber:

http://dxsp.sergas.es
soporte.epidat@sergas.es

24

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


1. El tiempo medio de supervivencia.
2. Los aos a partir de los cuales la probabilidad de supervivencia es menor que 0,1.
Resultados con Epidat 4:

El tiempo medio de supervivencia es de, aproximadamente, 10 aos, y a partir de 14,2 aos,


la probabilidad de supervivencia es menor de 0,1.

13.1.2.7. Distribucin exponencial ()


La distribucin exponencial es un caso particular de la distribucin gamma y el equivalente
continuo de la distribucin geomtrica discreta. Esta ley de distribucin describe procesos en
los que interesa saber el tiempo hasta que ocurre determinado evento; en particular, se
utiliza para modelar tiempos de supervivencia. Un ejemplo es el tiempo que tarda una
partcula radiactiva en desintegrarse. El conocimiento de la ley que sigue este evento se
utiliza, por ejemplo, para la datacin de fsiles o cualquier materia orgnica mediante la
tcnica del carbono 14.
Una caracterstica importante de esta distribucin es la propiedad conocida como falta de
memoria. Esto significa, por ejemplo, que la probabilidad de que un individuo de edad t
sobreviva x aos ms, hasta la edad x+t, es la misma que tiene un recin nacido de sobrevivir
hasta la edad x. Dicho de manera ms general, el tiempo transcurrido desde cualquier
instante dado t0 hasta que ocurre el evento, no depende de lo que haya ocurrido antes del
instante t0.
Se cumple que variable aleatoria que tome valores positivos y que verifique la propiedad de
falta de memoria sigue una distribucin exponencial [8].
Esta distribucin se puede caracterizar como la distribucin del tiempo entre sucesos
consecutivos generados por un proceso de Poisson; por ejemplo, el tiempo que transcurre
entre dos heridas graves sufridas por una persona. La media de la distribucin de Poisson, ,
que representa la tasa de ocurrencia del evento por unidad de tiempo, es el parmetro de la
distribucin exponencial, y su inversa es el valor medio de la distribucin.

http://dxsp.sergas.es
soporte.epidat@sergas.es

25

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


El uso de la distribucin exponencial ha sido limitado en bioestadstica, debido a que la
propiedad de falta de memoria la hace demasiado restrictiva para la mayora de los
problemas.
Epidat 4 permite realizar clculos de esta distribucin siempre y cuando el parmetro sea
menor o igual que 100.
Campo de variacin:
0<x<
Parmetros:
: tasa, > 0
Ejemplo
Se ha comprobado que el tiempo de vida de cierto tipo de marcapasos sigue una distribucin
exponencial con media de 14 aos. Cul es la probabilidad de que a una persona a la que se
le ha implantado este marcapasos se le deba reimplantar otro antes de 20 aos? Si el
marcapasos lleva funcionando correctamente 5 aos en un paciente, cul es la probabilidad
de que haya que cambiarlo antes de 25 aos?
La variable aleatoria tiempo de vida del marcapasos sigue una distribucin exponencial de
parmetro = 1/14 0,07
Resultados con Epidat 4:

La probabilidad de que se le tenga que implantar otro marcapasos antes de los 20 aos se
sita en un entorno de 0,75.
Teniendo en cuenta la propiedad de falta de memoria de la exponencial, la probabilidad
de tener que cambiar antes de 25 aos un marcapasos que lleva funcionando 5 es igual a la
probabilidad de cambio a los 20 aos, es decir, P(X < 25/X > 5) = P(X < 20) = 0,75.

13.1.2.8. Distribucin ji-cuadrado (n)


Un caso especial y muy importante de la distribucin gamma se obtiene cuando a = 1/2 y
p=n/2, y es conocida por el nombre de distribucin ji-cuadrado de Pearson con n grados de
libertad (se denota por 2n ). Es la distribucin que sigue la suma de los cuadrados de n
variables independientes e idnticamente distribuidas segn una distribucin normal
estndar, N(0,1).
http://dxsp.sergas.es
soporte.epidat@sergas.es

26

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Esta distribucin, que debe su nombre al matemtico ingls Karl Pearson (1857-1936), es
fundamental en inferencia estadstica y en los tests estadsticos de bondad de ajuste. Se
emplea, entre otras muchas aplicaciones, para realizar la prueba de hiptesis de
homogeneidad, de independencia o la prueba de bondad de ajuste (todas ellas denominadas
pruebas ji-cuadrado) y para determinar los lmites de confianza de la varianza muestral de
una poblacin normal.
Si X sigue una distribucin ji-cuadrado con n grados de libertad, para valores de n grandes (n
> 100), entonces la variable Y
media

2X sigue aproximadamente una distribucin normal de

2n 1 y desviacin estndar 1.

Epidat 4 realiza los clculos de esta distribucin para valores de n menores o iguales que 150.
Campo de variacin:
0<x<
Parmetros:
n: grados de libertad, n 1 entero
Ejemplo
Para estudiar la relacin entre la edad de las mujeres y su aceptacin de una ley sobre
interrupcin del embarazo se ha llevado a cabo una encuesta sobre 400 mujeres cuyos
resultados se recogen en la siguiente tabla:
Aceptacin
Edad

Baja

Media

Alta

0-18

21

34

25

18-35

24

31

25

36-50

30

30

20

51-65

37

30

13

> 65

40

30

10

Como resultado de aplicar la prueba ji-cuadrado de Pearson se obtuvo como valor del
estadstico 2=19,2828. Este valor por si solo no permite extraer ninguna conclusin; debe
compararse con el valor de la distribucin ji-cuadrado de (5-1)*(3-1)=8 grados de libertad que
deja un 5% de probabilidad a su derecha, fijado un nivel de significacin del 5% o,
equivalentemente, un nivel de confianza del 95%. Este valor, llamado punto crtico, delimita
la zona de rechazo de la hiptesis nula de no asociacin entre las variables.
1. Calcular el valor de la ji-cuadrado con 8 grados de libertad que deja a su derecha un
rea bajo la curva igual a 0,05.
2. Representar la funcin de densidad y marcar en ella el valor del estadstico y el punto
crtico, qu puede concluirse acerca de la relacin entre las dos variables?
3. Calcular el valor p del estadstico, es decir, la probabilidad a la derecha del valor del
estadstico 2=19,2828.

http://dxsp.sergas.es
soporte.epidat@sergas.es

27

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


1. Resultados con Epidat 4:

El valor 15,5073 es el punto crtico del test para un nivel de significacin del 5%, ya que deja
a su derecha una cola de probabilidad 0,05.
2. Resultados con Epidat 4:

A la vista de este grfico se puede observar como el valor del estadstico (lnea negra) es
superior al punto crtico del test para un nivel de significacin del 5% y, por lo tanto, est en
la zona de rechazo. Esto significa que hay evidencia de asociacin entre el grado de
aceptacin del aborto y la edad de las mujeres.

http://dxsp.sergas.es
soporte.epidat@sergas.es

28

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


3. Resultados con Epidat 4:

El valor p del estadstico es 0,0134 y se corresponde con el rea bajo la curva a la derecha del
valor del estadstico. Si este valor es menor que 0,05, como as ocurre, se rechaza la hiptesis
nula de no asociacin entre las dos variables.

13.1.2.9. Distribucin t de Student (n)


Esta distribucin fue propuesta y tabulada por William Sealy Gosset (1876-1937), ms
conocido por el seudnimo de Student, como resultado de un estudio sobre la estimacin de
la media cuando el tamao de muestra es pequeo, estos resultados fueron publicados en
1908 en el artculo The Probable Error of a Mean [13].
La distribucin t de Student queda completamente definida por medio de sus grados de
libertad, n, y se denota por tn. Surge cuando se plantea estudiar el cociente entre una variable
aleatoria con distribucin normal estndar y la raz cuadrada del cociente entre una variable
aleatoria con distribucin ji-cuadrado y sus grados de libertad (n), siendo las dos variables
independientes. Esta distribucin desempea un papel muy importante en la inferencia
estadstica asociada a la teora de muestras pequeas y es usada habitualmente en el
contraste de hiptesis para la media de una poblacin o para comparar medias de dos
poblaciones.
En cuanto a la forma que presenta su funcin de densidad cabe destacar las similitudes que
mantiene con la funcin de densidad de la distribucin normal estndar: forma acampanada,
simtrica y centrada en el origen; la nica diferencia existente entre ambas distribuciones es
que la funcin de densidad de la t de Student presenta unas colas ms pesadas (mayor
dispersin) que la normal.
Cabe destacar que el programa slo permite realizar el clculo para una distribucin t de
Student con 150 grados de libertad o menos. Esto no supone una limitacin ya que, a medida
que aumentan los grados de libertad, esta distribucin se va aproximando a la normal
estndar, de forma que a partir de ese valor de n pueden considerarse prcticamente
idnticas.
La distribucin t de Student con 1 grado de libertad coincide con la distribucin de Cauchy
estndar.

http://dxsp.sergas.es
soporte.epidat@sergas.es

29

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Campo de variacin:
- < x <
Parmetros:
n: grados de libertad, n 1 entero
Ejemplo
La distribucin t de Student se aproxima a la normal a medida que aumentan los grados de
libertad.
1. Calcular, para una distribucin N(0,1), el punto que deja a la derecha una cola de
probabilidad 0,05.
2. Calcular, para una distribucin t de Student, la probabilidad de que la variable tome
un valor a la derecha de ese punto. Tomar como grados de libertad sucesivamente n =
10 y n = 150.
Para el primer apartado hay que seleccionar en la lista de distribuciones la normal de
parmetros = 0 y = 1.
1. Resultados con Epidat 4:

En el segundo apartado se ejecutar dos veces Epidat 4: la primera vez para una distribucin
t de Student con 10 grados de libertad y la segunda vez con 150 grados de libertad.

http://dxsp.sergas.es
soporte.epidat@sergas.es

30

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


2. Resultados con Epidat 4:

Se aprecia claramente que, al aumentar los grados de libertad de la t de Student, la


probabilidad se acerca a la calculada con la distribucin normal.

13.1.2.10. Distribucin F de Snedecor (n,m)


Otra de las distribuciones importantes asociadas a la normal es la que se define como el
cociente de dos variables aleatorias independientes con distribucin ji-cuadrado divididas
entre sus respectivos grados de libertad, n y m; la variable aleatoria resultante sigue una
distribucin F de Snedecor de parmetros n y m (denotada por Fn,m). Hay muchas
aplicaciones de la F en estadstica y, en particular, tiene un papel importante en las tcnicas
del anlisis de la varianza (ANOVA) y del diseo de experimentos. Debe su nombre al
matemtico y estadstico americano George Waddel Snedecor (1881-1974).
Al igual que en la distribucin ji-cuadrado y t de Student, el programa limita los grados de
libertad, tanto del numerador como del denominador, no pudiendo exceder el valor 150 para
poder realizar los clculos.
Campo de variacin:
0<x<
Parmetros:
n: grados de libertad del numerador, n 1 entero
m: grados de libertad del denominador, m 1 entero
http://dxsp.sergas.es
soporte.epidat@sergas.es

31

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Ejemplo
En un laboratorio se efectuaron ciertas mediciones y se comprob que seguan una
distribucin F con 10 grados de libertad en el numerador y 12 grados de libertad en el
denominador.
1. Calcule el valor que deja a la derecha el 5% del rea bajo la curva de densidad.
2. Cul es la probabilidad de que la medicin sea superior a 4,30?
3. Represente la funcin de distribucin y de densidad de las medidas.
1. Resultados con Epidat 4:

El valor que deja a la derecha una probabilidad de 0,05 es 2,75.


2. Resultados con Epidat 4:

La probabilidad que deja a la derecha 4,30 es 0,01.

http://dxsp.sergas.es
soporte.epidat@sergas.es

32

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


3. Las funciones de densidad y distribucin de las medidas efectuadas se presentan a
continuacin:

13.1.2.11. Distribucin Cauchy (, )


Esta distribucin fue introducida por Simen Denis Poisson (1781-1840) en 1824, aunque
debe su nombre al matemtico francs Augustin Louis Cauchy (1789-1857) quien la
reintrodujo en 1853 [14]. En el mbito de la fsica tambin es conocida con el nombre de
distribucin de Lorentz o distribucin de Breit-Wigner.
La distribucin de Cauchy depende de dos parmetros: escala () y situacin (); en el caso
particular de que = 1 y = 0, recibe el nombre de distribucin de Cauchy estndar.
Una caracterstica destacable de esta distribucin es que carece de momentos, por lo que no
existen la media, varianza, asimetra y curtosis de esta distribucin. Su funcin de densidad
es simtrica respecto al parmetro de situacin .
Epidat 4 limita los clculos de esta distribucin a valores del parmetro de escala menores o
iguales que 30.
Campo de variacin:
- < x <
Parmetros:
: escala, > 0
: situacin, - < <
Ejemplo
Considere la distribucin Cauchy de parmetros = 0,75 y = 5.
1. Qu proporcin del rea bajo la curva se ubica a la derecha de 9,21?
2. Qu valor de la variable asla el 10% superior de la distribucin?

http://dxsp.sergas.es
soporte.epidat@sergas.es

33

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


1. Resultados con Epidat 4:

El 5,6% del rea bajo la curva se ubica a la derecha de 9,21.


2. Resultados con Epidat 4:

El valor 7,3083 divide a la distribucin en dos partes: el 90% de sta queda a la izquierda de
dicho punto y el 10% a la derecha.

13.1.2.12. Distribucin Weibull (a, b)


Esta distribucin debe su nombre al fsico sueco Waloddi Weibull (1887-1979) quien la us en
un artculo publicado en 1939 sobre resistencia de los materiales (A Statistical Theory of the
Strength of Materials), aunque ya era conocida de aos antes.
Esta distribucin se utiliza para modelar situaciones del tipo tiempo-fallo, modelar tiempos
de vida o en el anlisis de supervivencia, a parte de otros usos como, por ejemplo,
caracterizar el comportamiento climtico de la lluvia en un ao determinado.

http://dxsp.sergas.es
soporte.epidat@sergas.es

34

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


La distribucin Weibull queda totalmente definida mediante dos parmetros, forma (a) y
escala (b). En el caso particular de que a=1, se tiene la distribucin exponencial, y si a = 2 y b
=

2 recibe el nombre de distribucin de Rayleigh.

El perfil de la funcin de densidad presenta formas muy variadas dependiendo del valor que
tome su parmetro de forma, a. Si a es menor o igual que 1, la funcin de densidad es
siempre decreciente; en caso de tomar valores mayores que la unidad su funcin de
densidad muestra una forma ms acampanada, pero no simtrica, de forma que crece hasta
alcanzar el mximo y luego decrece.
En este caso, Epidat 4 limita ambos parmetros inferiormente por el valor 0,2 y
superiormente por 200.
Campo de variacin:
0<x<
Parmetros:
a: forma, a > 0
b: escala, b > 0
Ejemplo
La vida til, en aos, de cierto tipo de instrumental mdico quirrgico sigue una distribucin
de Weibull con parmetros a= 2 y b= 1,75.
1. Cul es la probabilidad de que el instrumental dure menos de 3 aos?
2. Representar la funcin de densidad y de distribucin de su vida til.
1. Resultados con Epidat 4:

La probabilidad de que el instrumental dure menos de 3 aos, es decir que dure 2 aos o
menos, es 0,73.

http://dxsp.sergas.es
soporte.epidat@sergas.es

35

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


2. Resultados con Epidat 4:
Las funciones de densidad y distribucin de la vida til del instrumental mdico son:

13.1.2.13. Distribucin Laplace (a, b)


Fue descubierta en 1774 por Pierre-Simon Laplace (1749-1827), a quien debe su nombre,
aunque tambin es conocida por el nombre de distribucin doble exponencial.
Esta distribucin viene determinada por dos parmetros, uno de situacin (a) y otro de escala
(b).
Su funcin de densidad es simtrica y el parmetro de situacin determina su eje de simetra,
adems de ser el punto donde la funcin alcanza su valor mximo en forma de pico afilado.
Independientemente de los valores que tomen sus parmetros, es una distribucin
leptocrtica, lo que quiere decir que su funcin de densidad es ms apuntada que la funcin
de densidad de la normal con la misma media y desviacin estndar.
Campo de variacin:
- < x <
Parmetros:
a: situacin, - < a <
b: escala, b > 0
Ejemplo
Una distribucin es leptocrtica si la funcin de densidad presenta un grado de
apuntamiento mayor que el de la distribucin normal con la misma media y varianza, lo que
se traduce en un coeficiente de curtosis positivo. Comprobar grficamente el carcter
leptocrtico de la distribucin de Laplace para el caso particular en que a= 2 y b= 3.

http://dxsp.sergas.es
soporte.epidat@sergas.es

36

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


En primer lugar hay que calcular la media y varianza de esta distribucin para luego
representar la funcin de densidad de la distribucin normal correspondiente.
Resultados con Epidat 4:

La distribucin de Laplace(2,3) se debe comparar grficamente con la distribucin normal de


media 2 y varianza 18 (desviacin tpica 4,24).
Veamos a continuacin la representacin de ambas funciones de densidad:

A la vista de las grficas se aprecia claramente que la funcin de densidad de la distribucin


Laplace(2,3) es ms apuntada que la funcin de densidad de la normal con su misma media
y desviacin tpica, tal como indicaba el valor del coeficiente de curtosis (3).

13.1.2.14. Distribucin Pareto (, x0)


La distribucin de Pareto fue introducida por el economista italiano Vilfredo Pareto (18481923) como un modelo para explicar la distribucin de las rentas de los individuos de una
poblacin, siempre y cuando se partiera de dos supuestos, la existencia de un umbral inferior
(x0) de forma que no haya rentas inferiores a dicho umbral y el decrecimiento de manera
http://dxsp.sergas.es
soporte.epidat@sergas.es

37

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


potencial del porcentaje de individuos con una renta superior o igual a un cierto valor de
renta a medida que dicho valor de renta crece [8]. El uso de esta distribucin se ha ido
ampliando a diferentes mbitos de estudio.
Se trata de una distribucin biparamtrica, con parmetros de forma () y de situacin (x0).
El parmetro x0 es un indicador de posicin (valor mnimo) que, en trminos econmicos,
puede interpretarse como el ingreso mnimo de la poblacin. El parmetro est asociado
con la dispersin, donde a mayor valor se obtienen densidades de Pareto ms concentradas
en las proximidades de x0, es decir, menos dispersas.
Epidat 4 permite valores del parmetro de forma comprendidos entre 0,5 y 100, y valores del
parmetro de situacin entre 0,1 y 1.000.
Campo de variacin:
x0 x <
Parmetros:
: forma, > 0
x0: situacin, x0 > 0
Ejemplo
Los salarios mensuales, en euros, de una determinada empresa siguen una distribucin de
Pareto de parmetros = 2,75 y x0= 900 Qu porcentaje de individuos tienen un salario
superior a 2.000 euros? Y a 3.000 euros?
Resultados con Epidat 4:

Aproximadamente el 11% de los empleados de la empresa tienen un sueldo superior de


2.000 euros, mientras que un 3,7% de los empleados perciben un ingreso mensual superior a
3.000 euros.

http://dxsp.sergas.es
soporte.epidat@sergas.es

38

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


13.1.2.15. Distribucin triangular (a, c, b)
El nombre de esta distribucin viene dado por la forma de su funcin de densidad. Este
modelo proporciona una primera aproximacin cuando hay poca informacin disponible, de
forma que slo se necesita conocer el mnimo (valor pesimista), el mximo (valor optimista)
y la moda (valor ms probable). Estos tres valores son los parmetros que caracterizan a la
distribucin triangular y se denotan por a, b y c, respectivamente.
Un ejemplo del uso de esta distribucin se encuentra en el anlisis del riesgo, donde la
distribucin ms apropiada es la beta pero dada su complejidad, tanto en la su comprensin
como en la estimacin de sus parmetros, se utiliza la distribucin triangular como proxy
para la beta [15].
Campo de variacin:
axb
Parmetros:
a: mnimo, - < a <
c: moda, - < c < con a c b
b: mximo, - < b < con a < b
Ejemplo
Uno de los problemas de salud que afectan en mayor medida a la poblacin en los meses de
verano son los golpes de calor; por ese motivo, es necesario llevar un control de la
temperatura atmosfrica que alerta, entre otros indicadores, de la presencia de una ola de
calor.
Durante el mes de Agosto del ao 2010, en Santiago de Compostela, las temperaturas
mnima y mxima absolutas fueron de 12,2 C y 35,8C, respectivamente, y el valor ms
probable fue de 19,8C. Si se asume que la temperatura sigue una distribucin triangular de
parmetros a=12,2, c=19,8 y b=35,8, cul es la probabilidad de que supere los 30C?
Resultados con Epidat 4:

La probabilidad de que la temperatura supere los 30 grados es de 0,089.

http://dxsp.sergas.es
soporte.epidat@sergas.es

39

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

13.2. Generacin de distribuciones


13.2.0. Conceptos generales
Epidat 4 ofrece procedimientos para generar muestras de variables aleatorias que se ajusten a
determinadas distribuciones, tanto continuas como discretas. Adems de las distribuciones
disponibles en el submdulo de Clculo de probabilidades, en el presente se incluyen la
multinomial, en las discretas, y la normal bivariante, en las continuas.
Este submdulo puede ser til para realizar ejercicios de simulacin (principalmente en
estudios de investigacin) y, adems, para calcular probabilidades asociadas a variables
obtenidas a partir de otras cuyas distribuciones sean conocidas, aun cuando la variable
resultante tenga distribucin desconocida.
El empleo de la simulacin para verificar un resultado terico es, hoy en da, una prctica
regular gracias al desarrollo de los ordenadores que permiten obtener, rpida y fcilmente,
nmeros aleatorios de cualquier distribucin. Esto ha supuesto una autntica revolucin en
el campo de la estadstica y, en particular, en los mtodos bayesianos.
Ms que nmeros aleatorios estrictamente, los algoritmos de simulacin generan lo que se ha
denominado como nmeros pseudo-aleatorios a travs de frmulas recursivas que parten de
un valor inicial llamado semilla. Existen diferentes mtodos de generacin que permiten
obtener una secuencia de nmeros aleatorios para una distribucin dada, pero la mayora de
estos mtodos se basan en la generacin de observaciones independientes de una
distribucin uniforme en [0,1]. El generador congruencial, propuesto por Lehmer [16], es uno
de los ms utilizados para obtener nmeros aleatorios uniformes. Una recomendacin muy
extendida en la literatura es la de combinar varios generadores de nmeros aleatorios para
obtener un generador con mejores caractersticas.
Para generar valores de una distribucin discreta, uno de los mtodos ms conocidos es el
mtodo de la transformacin cuantil o mtodo de inversin generalizada, que se basa en el
siguiente resultado: si X es una variable aleatoria con funcin de distribucin F y funcin
cuantil Q y U es una variable aleatoria con distribucin uniforme (0,1), entonces la variable
Q(U) tiene la misma distribucin que X.
La funcin cuantil de una distribucin continua con funcin de distribucin invertible
coincide con la inversa de dicha funcin. Por eso, en este caso, el mtodo de la
transformacin cuantil recibe el nombre de mtodo de inversin, que es uno de los mtodos
ms importantes en la generacin de distribuciones continuas [17]. Su algoritmo se describe
de la siguiente manera:
Paso 1: Generar valores de una variable con distribucin uniforme (0,1).
Paso 2: Devolver X=F-1(U), siendo F una funcin de distribucin invertible.
De esta forma se generan valores de la variable X con funcin de distribucin F.
Existe otro mtodo adecuado para los casos en que se desconoce la expresin explcita de la
funcin de distribucin pero s se conoce su funcin de densidad. Este mtodo se denomina
mtodo de aceptacin-rechazo.
Los mtodos de simulacin se denominan, de modo general, tcnicas de Monte Carlo. Estos
mtodos se utilizan en la resolucin de diferentes problemas en los que la solucin analtica
exacta es difcil de obtener o consume mucho tiempo. En esos casos, se busca una solucin
aproximada mediante la simulacin. El trmino Monte Carlo no hace referencia a un
algoritmo concreto de simulacin, sino ms bien al hecho de que se ha aplicado un mtodo
http://dxsp.sergas.es
soporte.epidat@sergas.es

40

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


de ese tipo. Una aplicacin de estas tcnicas se da, por ejemplo, en el campo de la inferencia.
El procedimiento se puede describir, de modo general, como sigue: se ajusta un modelo a los
datos empricos y se utiliza este modelo ajustado para simular muestras aleatorias que, a su
vez, se usan para estimar los parmetros de la distribucin terica. Este procedimiento
general se denomina bootstrap paramtrico.

13.2.1. Distribuciones discretas


Las distribuciones discretas incluidas en el submdulo de Generacin de distribuciones
son:
-

Uniforme discreta

Geomtrica

Binomial

Binomial negativa

Multinomial

Pascal

Hipergeomtrica

Poisson

Con excepcin de la multinomial, todas fueron descritas en el submdulo precedente


(Clculo de probabilidades), de modo que ahora slo se explicar dicha distribucin.

13.2.1.1. Distribucin multinomial


Como ya se coment anteriormente, la distribucin binomial aparece de forma natural al
realizar repeticiones independientes de un experimento que tenga respuesta binaria, es decir,
dos posibles resultados, clasificados generalmente como xito o fracaso. La distribucin
multinomial generaliza esta distribucin al caso en que la poblacin se divide en m > 2
grupos mutuamente excluyentes y exhaustivos o, equivalentemente, a experimentos con m
resultados.
Se supone un proceso estable y sin memoria que genera elementos que pueden clasificarse
en m grupos distintos o, dicho de otro modo, un experimento que tiene m posibles
resultados. Supngase que se toma una muestra de n elementos, o que el experimento se
repite n veces de forma independiente, y se definen m variables aleatorias Xi = nmero de
elementos del grupo i (i = 1, ..., m), entonces el vector de m-variables (X1, X2, , Xm) es una
nueva variable aleatoria m-dimensional que sigue una distribucin multinomial de
parmetros n, p1, ..., pm, donde pi (i = 1, ..., m) es la probabilidad del grupo i.
Vase un ejemplo: de acuerdo con la teora de la gentica, un cierto cruce de conejillo de
indias resultar en una descendencia roja, negra y blanca en la relacin 8:4:4. Si se tienen 6
descendientes, el vector de variables (X1, X2, X3) donde:
X1 = Nmero de descendientes rojos
X2 = Nmero de descendientes negros
X3 = Nmero de descendientes blancos
sigue una distribucin multinomial con parmetros n = 6; p1 = 8/16 = 0,5; p2 = 4/16 = 0,25 y
p3 = 4/16 = 0,25.
Una situacin muy comn en la prctica se da cuando se conoce el tamao de muestra n y se
quieren estimar las probabilidades pi a partir de los valores observados. Pero tambin hay
situaciones en las que se debe estimar el tamao de muestra n, adems de las probabilidades
http://dxsp.sergas.es
soporte.epidat@sergas.es

41

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


pi. Esto ocurre, por ejemplo, en el mtodo de captura-recaptura, que fue desarrollado por
zologos para estimar poblaciones animales y que ha sido aplicado a poblaciones humanas
en estudios epidemiolgicos.
Valores:
xi = 0, 1, 2, ... (i = 1, ..., m)
Parmetros:
n: nmero de pruebas, n 1 entero
m: nmero de resultados posibles, m 3 entero
m

pi: probabilidad del suceso i, 0 < pi < 1 (i = 1, ..., m), donde

p
i 1

Ejemplo
Volviendo al ejemplo de los conejillos de indias, supngase que se est interesado en simular
una muestra de tamao 10 de una distribucin multinomial con parmetros n = 6; p1 = 0,5; p2
= 0,25 y p3 = 0,25.
Los resultados de Epidat indican que en la primera simulacin los 6 conejitos de indias se
organizaron de la siguiente manera: tres de ellos fueron descendientes rojos, un descendiente
negro y dos descendientes blancos. En la segunda simulacin, 4 de los conejitos fueron rojos,
uno negro y otro blanco. Y as sucesivamente hasta llegar a la dcima simulacin donde tres
de los conejitos fueron descendientes rojos, dos negros y uno blanco.

http://dxsp.sergas.es
soporte.epidat@sergas.es

42

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


Resultados con Epidat 4:

http://dxsp.sergas.es
soporte.epidat@sergas.es

43

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


13.2.2. Distribuciones continuas
Las distribuciones continuas incluidas en el mdulo de Generacin de distribuciones son:
-

Uniforme

Ji-cuadrado

Normal

t de Student

Normal bivariante

F de Snedecor

Lognormal

Cauchy

Logstica

Weibull

Beta

Laplace

Gamma

Pareto

Exponencial

Triangular

Con excepcin de la normal bivariante, todas fueron descritas en el submdulo precedente


(Clculo de probabilidades), de modo que ahora slo se explicar dicha distribucin.

13.2.2.1. Distribucin normal bivariante


Fue introducida por Carl Friedrich Gauss (1777-1855) a principios del siglo XIX en su estudio
de errores de medida en las observaciones astronmicas y de clculo de rbitas de cuerpos
celestes, y se trata de la primera distribucin continua multivariante estudiada. Como
modelo de distribucin terico continuo, se adapta con gran aproximacin a fenmenos
reales en diversos campos de las ciencias sociales y la astronoma.
De igual modo que la distribucin normal univariante est especificada por su media, , y su
desviacin estndar, , la funcin de densidad de la variable aleatoria normal bivariante
X=(X1, X2), est determinada por el vector de medias = (1, 2), el vector de desviaciones
estndar = (1, 2) y el coeficiente de correlacin entre las variables X1 y X2.
Si las variables aleatorias X1 y X2 son independientes, el coeficiente de correlacin lineal es
nulo y por tanto = 0.
Por otro lado, al igual que para la distribucin normal se tiene el caso particular de la
distribucin normal estndar, en el caso de la distribucin normal bivariante se obtiene la
normal bivariante estndar cuando las variables X1 y X2 son independientes e idnticamente
distribuidas siguiendo una distribucin N(0,1).
Campo de variacin:
- < x1 <
- < x2 <
Parmetros:
= (1, 2): vector de medias, - < 1 < , - < 2 <
= (1, 2): vector de desviaciones estndar, 1 > 0, 2 > 0
: coeficiente de correlacin, -1 1
Aqu, a diferencia de los restantes mdulos, no se pondrn ejemplos pues no tiene mayor
sentido, ya que la estructura de las aplicaciones siempre es la misma. No obstante, para
http://dxsp.sergas.es
soporte.epidat@sergas.es

44

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


ilustrar la solucin de un problema prctico por va de la simulacin, se considera el
siguiente ejemplo en el que se aplica la distribucin normal bivariante.
Ejemplo
Suponga que la distribucin de la variable peso de una poblacin de jvenes sigue una
distribucin normal de media = 65 kg y desviacin estndar = 15 kg. Suponga, adems,
que la variable altura en dicha poblacin sigue una distribucin normal de media = 1,68 m
y desviacin estndar = 0,20 m. La correlacin entre las dos variables es alta, de un 0,75.
Con estos datos estimar el porcentaje de obesos en la poblacin teniendo en cuenta que la
obesidad est definida por un ndice de masa corporal (IMC = peso/talla2) superior a 30
kg/m2.
Para calcular el porcentaje hay que simular los valores de la variable IMC, pues no se
dispone de la distribucin terica. Los pasos a seguir sern los siguientes:
1. Simular 1.000 valores de la distribucin normal bivariante con los siguientes
parmetros: media y desviacin estndar del peso, media y desviacin estndar de la
talla, y el coeficiente de correlacin entre la talla y el peso.
2. Llevar los valores de la variable simulada a una hoja de clculo (por ejemplo) y
efectuar el cociente IMC = peso/talla2.
3. Contar el nmero de valores de la variable IMC que superan el umbral 30 kg/m2
(condicin de obesidad).
Resultados con Epidat 4:

Con los 1.000 valores simulados se obtiene un porcentaje de sujetos con un IMC superior a 30
kg/m2 del 5,7%.
Nota: Cada vez que se realiza una nueva simulacin se obtienen valores
diferentes, aunque se mantenga la misma distribucin, el valor de sus
parmetros y el tamao de la muestra.

http://dxsp.sergas.es
soporte.epidat@sergas.es

45

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Bibliografa
1
Kolmogorov AN. Grundbegriffe der wahrscheinlichtkeitsrechnung. Berlin: SpringerVerlag; 1933. (Traducido al ingls: Morrison N. Foundations of the theory of probability.
New York: Chelsea; 1956).
2
Pea D. Modelos y mtodos. 1. Fundamentos. Madrid: Alianza Universidad Textos;
1993.
3
Meyer PL. Probabilidad y aplicaciones estadsticas. 2 ed. Bgota: Fondo Educativo
Interamericano; 1973.
4
Martn-Pliego J, Ruiz-Maya L. Estadstica I: probabilidad. 2 ed. Madrid: Thomson;
2004.
5
Katz DL. Epidemiology, biostatistics and preventive medicine review. USA: W.B.
Saunders Company; 1997.
6
Hospital Ramn y Cajal [pgina en Internet]. Material docente de la unidad de
bioestadstica clnica. Disponible en: http://www.hrc.es/bioest/M_docente.html
7

Domnech JM. Mtodos estadsticos en ciencias de la salud. Barcelona: Signo; 1997.

8
Fernndez-Abascal H, Guijarro MM, Rojo JL, Sanz JA. Clculo de probabilidades y
estadstica. Barcelona: Editorial Ariel; 1994.
9
Kemp AW, Kemp CD. Accident proneness. En: Armitage P, Colton T, editores.
Encyclopedia of Biostatistics Vol. 1. Chichester: John Wiley & Sons; 1998. pp. 35-7.
10 Biggeri A. Negative binomial distribution. En: Armitage P, Colton T, editores.
Encyclopedia of Biostatistics Vol. 4. Chichester: John Wiley & Sons; 1998. pp. 2962-7.
11 Canavos GC. Probabilidad y estadstica: aplicaciones y mtodos. Mxico: McGraw-Hill;
1988.
12 Palmgren J. Poisson distribution. En: Armitage P, Colton T, editores. Encyclopedia of
Biostatistics Vol. 4. Chichester: John Wiley & Sons; 1998. pp. 3398-402.
13

Student. The probable error of a mean. Biometrika. 1908;6:1-25.

14 John Aldrich. University of Southampton [pgina en Internet]. Figures from the history
of
probability
and
statistics.
Disponible
en:
http://www.economics.soton.ac.uk/staff/aldrich/Figures.htm
15 Johnson D. The triangular distribution as a Proxy for the beta distribution in risk
analysis. The Statistician. 1997;46(3):387-98.
16 Lehmer DH. Mathematical methods in large-scale computing units. En: Proceedings of
the second symposium on large scale digital computing units machinery. Cambridge, Mass.:
Harvard University Press; 1951. pp. 141-6.

http://dxsp.sergas.es
soporte.epidat@sergas.es

46

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.


17 Cao Abad R. Introduccin a la simulacin y a la teora de colas. A Corua: Netbiblo;
2002.

http://dxsp.sergas.es
soporte.epidat@sergas.es

47

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 1: novedades

Anexo 1: Novedades del mdulo de distribuciones de probabilidad


Novedades de la versin 4.0 con respecto a la versin 3.1:
-

Se aadi una distribucin discreta: Pascal

Se aadieron las siguientes distribuciones continuas:


-

Cauchy

Weibull

Laplace

Pareto

Triangular

Es posible calcular probabilidades para ms de un punto a la vez.

Los grficos generados para las funciones de distribucin y densidad pueden


personalizarse mediante el editor de grficos.

http://dxsp.sergas.es
soporte.epidat@sergas.es

48

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

Anexo 2: Frmulas del mdulo de distribuciones de probabilidad


Esquema del mdulo

1. Clculo de probabilidades
1.1. Distribuciones discretas
1.2. Distribuciones continuas
2. Generacin de distribuciones
2.1. Distribuciones discretas
2.2. Distribuciones continuas

http://dxsp.sergas.es
soporte.epidat@sergas.es

49

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

1.- DISTRIBUCIONES DISCRETAS


1. Uniforme discreta
2. Binomial
3. Multinomial
4. Hipergeomtrica
5. Geomtrica
6. Binomial negativa
7. Pascal
8. Poisson

1.1.- Uniforme discreta en (a,b) [Fernndez-Abascal (1994, p. 388-391); Weissten]


X= Nmero entero seleccionado aleatoriamente entre a y b
Parmetros de la distribucin:

a: Mnimo (entero 1; en Epidat: a 1)

b: Mximo (entero 2, a < b; en Epidat: b 2)

Funcin de masa de probabilidad:

f k

1
, a k b, k entero
N

Valores caractersticos:

Media:

ab
2

N2 1
Varianza:
12
Asimetra: 0

Curtosis:

6(N 2 1)
5(N 2 1)

Donde N=b-a+1 es el nmero de enteros entre a y b.


http://dxsp.sergas.es
soporte.epidat@sergas.es

50

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

1.2.- Binomial (n,p) [Canavos (1988, p. 89-99)]


X= Nmero de xitos en n pruebas independientes
Parmetros de la distribucin:

n: Nmero de pruebas (entero 1; en Epidat: 1 n 1.000)

p: Probabilidad de xito (0 < p < 1; en Epidat: 0 < p < 1)

Funcin de masa de probabilidad:

n
f k p k 1 pn k , 0 k n, k entero, siendo
k

n
n!

k k! n k !

Valores caractersticos:
Media: np
Varianza: np(1-p)

Asimetra:

Curtosis:

1 2p
np(1 p)

1 6p(1 p)
np(1 p)

1.3.- Multinomial (n, p1, p2, ..., pm) [Martn-Pliego y Ruiz-Maya (2004, p. 379-382)]
X = (X1, X2, , Xm) = Nmero de veces que ocurren m sucesos disjuntos en n pruebas
independientes
Parmetros de la distribucin:

n: Nmero de pruebas (entero 1; en Epidat: n 1)

m: Nmero de resultados posibles (entero 3; en Epidat: m 3)

pi: Probabilidad del suceso i, i=1, , m (0 < pi < 1 y

pi 1 ; en Epidat: 0 < pi <

i 1

1)

http://dxsp.sergas.es
soporte.epidat@sergas.es

51

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

Funcin de masa de probabilidad:

f k 1 , k 2 ,..., k m

n!
p k1 p k 2 ...p kmm , ki {0, 1, ..., n} y
k 1 ! k 2 !...k m ! 1 2

ki n
i 1

Valores caractersticos:
Vector de medias: (np1 np2 npm)

Matriz de dispersin: Cov Xi , X j

i , j 1,.., m

Cov X i , X j npi p j si ij

Cov X i , X i Var X i npi 1 pi

1.4.- Hipergeomtrica (N, R, n) [Canavos (1988, p. 108-115)]


X= Nmero de xitos en n elementos extrados, sin reposicin, de una poblacin de tamao
N que contiene R xitos.
Parmetros de la distribucin:

N: Tamao de la poblacin (entero 1; en Epidat: 1 N 1.000)

R: Nmero de xitos en la poblacin (entero, 1 R N; en Epidat: 1 R N)

n: Nmero de pruebas (entero, 1 n N; en Epidat: 1 n N)

Funcin de masa de probabilidad:

R N R

k n k

f k
, max(0,n-N+R) k min(R, n), k entero
N

n
Valores caractersticos:
Media: np
Varianza: np1 p

Nn
N 1

http://dxsp.sergas.es
soporte.epidat@sergas.es

52

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

N 2n
(1 2p)
Asimetra: N 2
Nn
np(1 p)
N 1
Curtosis: A

BC
3
np(1 p)

Donde:

R
N

3(N 1)( N 6)
(N 2)( N 3)

(N 1)N(N 1)
(N n )( N 2)( N 3)

Nn

6N p(1 p) n

N2

C 1
N 1

1.5.- Geomtrica (p) [Fernndez-Abascal (1994, p. 403-407); Weissten]


X= Nmero de fracasos antes del primer xito
Parmetros de la distribucin:

p: Probabilidad de xito (0 < p < 1; en Epidat: 0 < p < 1)

Nota: Geomtrica (p) = Binomial negativa (1, p)


Funcin de masa de probabilidad:

fk p1 pk , k 0, k entero
Valores caractersticos:
Media:

1 p
p

http://dxsp.sergas.es
soporte.epidat@sergas.es

53

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Varianza:

1 p
p2

2p
1 p

Asimetra:

Curtosis:

Anexo 2: frmulas

p 2 6p 6
1 p

1.6.- Binomial negativa (r, p) [Canavos (1988, p. 115-121)]


X= Nmero de fracasos antes de obtener r xitos
Parmetros de la distribucin:

r: Nmero de xitos (entero 1; en Epidat: 1 r 1.000)

p: Probabilidad de xito (0 < p < 1; en Epidat: 0 < p < 1)

Funcin de masa de probabilidad:

k r 1 r
p 1 pk , k 0, k entero
f k
r

Valores caractersticos:
Media:

r1 p
p
r 1 p

Varianza:

p2

Asimetra:

Curtosis:

2p
r(1 p)

p 2 6p 6
r(1 p)

http://dxsp.sergas.es
soporte.epidat@sergas.es

54

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

1.7.- Pascal (r,p) [Meyer (1994, p. 178-179) ; Canavos (1988, p. 115-121)]


X= Nmero de pruebas necesarias para obtener r xitos
Parmetros de la distribucin:

r: Nmero de xitos (entero 1; en Epidat: 1 r 1.000)

p: Probabilidad de xito (0 < p < 1; en Epidat: 0 < p < 1)

Nota: Pascalr , p BNr , p r


Funcin de masa de probabilidad:

k 1 r
p (1 p)k r , k r, k entero
f(k )
r 1
Valores caractersticos:
Media:

r
p

Varianza:

Asimetra:

r 1 p
p2

2p
r(1 p)

p 2 6p 6
Curtosis:
r(1 p)

1.8.- Poisson () [Canavos (1988, p. 100-108)]


X= Nmero de ocurrencias de un evento raro en un intervalo continuo de tiempo o
espacio
Parmetros de la distribucin:

: Tasa de ocurrencia ( > 0; en Epidat: 0 < 50)

http://dxsp.sergas.es
soporte.epidat@sergas.es

55

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

Funcin de masa de probabilidad:

f k

k e
, k 0, k entero
k!

Valores caractersticos:
Media=Varianza:

Asimetra:

Curtosis:

2.- DISTRIBUCIONES CONTINUAS


1. Uniforme o rectangular
2. Normal
3. Normal bivariante
4. Lognormal
5. Logstica
6. Beta
7. Gamma
8. Exponencial
9. Ji-cuadrado
10. t de Student
11. F de Snedecor
12. Cauchy
13. Weibull
14. Laplace
15. Pareto
16. Triangular

http://dxsp.sergas.es
soporte.epidat@sergas.es

56

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

2.1.- Uniforme (a, b) o rectangular (a, b) [Canavos (1988, p. 143-147)]


Parmetros de la distribucin:

a: Mnimo (- < a < ; en Epidat: - < a < )

b: Mximo (- < b < , a < b; en Epidat: - < b < )

Funcin de densidad:

f x

1
,a<x<b
ba

Valores caractersticos:

Media = Mediana:

ab
2

Moda: intervalo (a, b)

Varianza:

b a 2
12

Asimetra: 0
Curtosis: -6/5

2.2.- Normal (, ) [Canavos (1988, p. 130-143)]


Parmetros de la distribucin:

: Media (- < < ; en Epidat: - < < )

: Desviacin estndar ( > 0; en Epidat: > 0)

Funcin de densidad:

1 x 2
1
f x
exp
, - < x <
2
2
Valores caractersticos:
Media = Mediana = Moda:
http://dxsp.sergas.es
soporte.epidat@sergas.es

57

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

Varianza: 2
Asimetra: 0
Curtosis: 0
Nota: con =0 y =1 se tiene la distribucin normal estndar, N(0,1).

2.3.- Normal bivariante (, , ) [Martn-Pliego y Ruiz-Maya (2004, p. 459-460)]


Parmetros de la distribucin:

=(x y): Vector de medias (- < x, y < ; en Epidat: - < x, y < )

=(x y): Vector de desviaciones estndar (x, y > 0; en Epidat: x, y > 0)

: Coeficiente de correlacin (-1 1; en Epidat: -1 1)

Funcin de densidad:

f x , y

1
2 x y

exp
2
1 2
1

x 2 x x y y
y y
x

2
xy
2 2y
2 x

- < x, y <
Valores caractersticos:
Vector de medias: =(x y)

2x x y

Matriz de dispersin:
2

x y y

2.4.- Lognormal (, ) [Fernndez-Abascal (1994, p. 445-448); Weissten]


Parmetros de la distribucin:

: Escala (- < < ; en Epidat: -5 5)

: Forma ( > 0; en Epidat: 0 < 5)

Nota: Si X Lognormal (, ) Ln(X) Normal (, )


http://dxsp.sergas.es
soporte.epidat@sergas.es

58

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

Funcin de densidad:

f x

1 ln x 2
exp
,x>0

x 2

2
1

Valores caractersticos:
Media: e

2
2

Mediana: e
Moda: e

Varianza: e 2 e 1
2

Asimetra:

1 e 2
2

4
2e 3 3e 2 6
Curtosis: e
2

2.5.- Logstica (a, b) [Fernndez-Abascal (1994, p. 464-466); Weissten]


Parmetros de la distribucin:

a: Situacin (- < a < ; en Epidat: - < a < )

b: Escala (b > 0; en Epidat: b > 0)

Funcin de densidad:

1 e ( xa ) b
f x
b 1 e ( xa ) b

, - < x <

Valores caractersticos:
Media = Mediana = Moda: a

2 2
b
Varianza:
3

http://dxsp.sergas.es
soporte.epidat@sergas.es

59

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

Asimetra: 0

Curtosis:

6
5

2.6.- Beta (p, q) [Canavos (1988, p. 147-151); Weissten]


Parmetros de la distribucin:

p: Forma (p > 0; en Epidat: 0 < p 100)

q: Forma (q > 0; en Epidat: 0 < q 100)

Funcin de densidad:

f x

x p1 1 x q1
,0<x<1
p, q
1

donde es la funcin beta: p , q t p1 1 t q 1 dt .

Valores caractersticos:

Media:

p
pq

Mediana: no tiene expresin explcita

Moda:

p 1
para p > 1 y q > 1
pq2

Varianza:

pq

p q 1 p q

Asimetra:

Curtosis: 6

2(q p) p q 1

p q 2

pq

p(p 1)( p 2q ) q(q 1)( q 2p)


pq(p q 2)( p q 3)

http://dxsp.sergas.es
soporte.epidat@sergas.es

60

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

2.7.- Gamma (a, p) [Fernndez-Abascal (1994, p. 448-452); Weissten]


Parmetros de la distribucin:

a: Escala (a > 0; en Epidat: 0 < a 25)

p: Forma (p > 0; en Epidat: 0 < p 25)

Funcin de densidad:

f x

a p ax p1
e x ,x>0
p

donde es la funcin gamma: z t z 1e t dt , y si n es un entero: n n 1!

Valores caractersticos:

Media:

p
a

Mediana: no tiene expresin explcita

Moda:

p 1
para p > 1
a
p

Varianza:

a2

Asimetra:

Curtosis:

2
p

6
p

http://dxsp.sergas.es
soporte.epidat@sergas.es

61

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

2.8.- Exponencial () [Fernndez-Abascal (1994, p. 452-455); Weissten]


Parmetros de la distribucin:

: Tasa ( > 0; en Epidat: 0 < 100)

Nota: Exponencial () = Gamma (, 1).


Funcin de densidad:

f x e x , x > 0
Valores caractersticos:

Media:

Mediana:

ln 2

Moda: no definida

Varianza:

1
2

Asimetra: 2
Curtosis: 6

2.9.- Ji-cuadrado (n) [Fernndez-Abascal (1994, p. 473-478); Weissten]


Parmetros de la distribucin:

n: Grados de libertad (entero 1; en Epidat: 1 n 150)

Nota: Ji-cuadrado (n) = Gamma (1/2, n/2).

http://dxsp.sergas.es
soporte.epidat@sergas.es

62

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

Funcin de densidad:

f x

n 1 x
2 e 2

n

2

,x>0

donde es la funcin gamma: z t z 1e t dt , y si n es un entero: n n 1!

Valores caractersticos:
Media: n
Mediana: no tiene expresin explcita
Moda: n-2 para n > 2
Varianza: 2n

Asimetra:

Curtosis:

8
n

12
n

2.10.- t-Student (n) [Fernndez-Abascal (1994, p. 478-481); Weissten]


Parmetros de la distribucin:

n: Grados de libertad (entero 1; en Epidat: 1 n 150)

Funcin de densidad:

n 1
n 1


2
2
x
2
1

f x
, - < x <

n
n

n
2
Valores caractersticos:
Media = Mediana = Moda: 0
http://dxsp.sergas.es
soporte.epidat@sergas.es

63

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

n
para n > 2
n2

Varianza:

Asimetra: 0

Curtosis:

6
para n > 4
n4

2.11.- F-Snedecor (n, m) [Fernndez-Abascal (1994, p. 482-486);Weissten]


Parmetros de la distribucin:

n: Grados de libertad del numerador (entero 1; en Epidat: 1 n 150)

m: Grados de libertad del denominador (entero 1; en Epidat: 1 m 150)

Funcin de densidad:
n

n m n 2 n 2 2

x
2 m

,x>0
f x
n m nx n m 2
1

2 2
m
Valores caractersticos:

Media:

m
para m > 2
m2

Mediana: no tiene expresin explcita

Moda:

m n 2
para n > 2
n m 2

Varianza:

Asimetra:

2m 2 n m 2
para m > 4
nm 22 m 4

2n m 2 8m 4
m 6 nn m 2

http://dxsp.sergas.es
soporte.epidat@sergas.es

para m > 6

64

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

12 (m 2) 2 (m 4) n( n m 2)(5m 22)
Curtosis:
para m > 8
n(m 6)(m 8)(n m 2)

2.12.- Cauchy (, ) [Fernndez-Abascal (1994, p. 461-463)]


Parmetros de la distribucin:

: Escala ( > 0; en Epidat: 0 < 30)

: Situacin (- < < ; en Epidat: - < < )

Funcin de densidad:

f( x)

1
, - < x <
2
( ( x ) 2 )

Valores caractersticos:
Media: no definida
Mediana = Moda:
Varianza: no definida
Asimetra: no definida
Curtosis: no definida
Nota: Con =1 y =0 se tiene la distribucin de Cauchy estndar.

2.13.- Weibull (a, b) [Canavos (1988, p. 159-163)]


Parmetros de la distribucin:

a: Forma (a > 0; en Epidat: 0,2 a 200)

b: Escala (b > 0; en Epidat: 0,2 b 200)

http://dxsp.sergas.es
soporte.epidat@sergas.es

65

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

Funcin de densidad:

f( x)

ax

bb

a 1

x a
exp , x > 0
b

Valores caractersticos:

1
1
a

Media: b

Mediana:

bln 2

a 1
Moda: b

para a > 1

2 1 2
1 1
a a

Varianza: b 2

1
1 2
3
2 3 1 3 1 1 1
a
a a
a
Asimetra:
3
2
2
2 1

a
a

Curtosis:

1
1 2
2
1 3
4
6 4 1 12 2 1 1 3 2 1 4 1 1 1
a
a a
a
a a
a
2

2 1
a 1 a 1

2.14.- Laplace (a, b) [Weissten]


Parmetros de la distribucin:

a: Situacin (- < a < ; en Epidat: - < a < )

b: Escala (b > 0; en Epidat: b > 0)

http://dxsp.sergas.es
soporte.epidat@sergas.es

66

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

Funcin de densidad:

f( x)

xa
1
exp
2b
b

, - < x <

Valores caractersticos:
Media = Mediana = Moda: a
Varianza: 2b 2
Asimetra: 0
Curtosis: 3

2.15.- Pareto (, x0) [Fernndez-Abascal (1994, p. 459-461); Weissten]


Parmetros de la distribucin:

: Forma ( > 0; en Epidat: 0,5 100)

x0: Situacin (x0 > 0; en Epidat: 0,1 x0 1.000)

Funcin de densidad:

f( x)

x 0

x 1

, x x0

Valores caractersticos:

Media:

x 0
para > 1
1

Mediana: x 0 2

Moda: x 0

Varianza:

x 02
( 2)( 1) 2

http://dxsp.sergas.es
soporte.epidat@sergas.es

para > 2

67

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Asimetra:

Curtosis:

Anexo 2: frmulas

2(1 ) 2
para > 3
3

6( 3 2 6 2)
para > 4
( 3)( 4)

2.16.- Triangular (a, c, b) [Herreras y Palacios (2007, p. 5-6)]


Parmetros de la distribucin:

a: Mnimo (- < a < ; en Epidat: - < a < )

c: Moda (- < c < , a c b; en Epidat: - < c < )

b: Mximo (- < b < , a < b; en Epidat: - < b < )

Funcin de densidad:

f( x)

2x a
para a x c
b a c a

f( x)

2b x
para c x b
b a b c

Valores caractersticos:

Media:

abc
3

( b a)(b c)
ab
si c
b
2
2

Mediana:

a ( b a)(c a) si c a b

2
2
Moda: c

( b c) 2 ( c a) 2 ( b c)( c a)
Varianza:
18

http://dxsp.sergas.es
soporte.epidat@sergas.es

68

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

2 (a b 2c)(b c 2a)(2b c a)

Asimetra:

5 ( b a) 2 (c a)(b c)
Curtosis:

Anexo 2: frmulas

3
5

http://dxsp.sergas.es
soporte.epidat@sergas.es

69

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 2: frmulas

Bibliografa
- Canavos GC. Probabilidad y estadstica: aplicaciones y mtodos. Madrid: McGraw-Hill;
1988.
- Fernndez-Abascal H, Guijarro MM, Rojo JL, Sanz JA. Clculo de probabilidades y
estadstica. Barcelona: Editorial Ariel; 1994.
- Herreras Pleguezuelo R, Palacios Gonzlez F. Curso de inferencia estadstica y del modelo
lineal simple. Madrid: Delta, Publicaciones Universitarias; 2007.
- Martn-Pliego J, Ruiz-Maya L. Estadstica I: Probabilidad. 2 ed. Madrid: Thomson; 2004.
- Meyer PL. Probabilidad y aplicaciones estadsticas. 2 ed. Bogot: Fondo Educativo
Interamericano; 1973.
- Weisstein EW. From MathWorld-A Wolfram Web Resource [pgina en internet]. Statistical
Distribution. Disponible en:
http://mathworld.wolfram.com/topics/StatisticalDistributions.html

http://dxsp.sergas.es
soporte.epidat@sergas.es

70

Epidat 4: Ayuda de Distribuciones de probabilidad. Octubre 2014.

Anexo 3: resumen discretas

Anexo 3: Resumen de las distribuciones discretas


Distribucin

Valores

Uniforme discreta

a, a+1, a+2, ,b

Parmetros

Definicin de la variable

a: mnimo

Variable que puede tomar n valores distintos


con la misma probabilidad cada uno de ellos

b: mximo
n: nmero de pruebas

Binomial

0, 1, 2, , n
p: probabilidad de xito
n: nmero de pruebas
Xi: 0, 1, 2,
(i= 1, , m)

Multinomial

m: n de resultados posibles

Observaciones

Esta distribucin se aplica a poblaciones finitas


Nmero
de
xitos
en
n
pruebas
cuando los elementos se toman al azar y con
independientes de un experimento con
reemplazo, y a poblaciones conceptualmente
probabilidad de xito constante
infinitas cuando el proceso es estable y sin
memoria
Nmero de veces que ocurren m sucesos Se aplica cuando se tiene un proceso estable y sin
disjuntos en n pruebas independientes
memoria

pi: probabilidad del suceso i


N: tamao de la poblacin
Hipergeomtrica

de max{0,n-(N-R)}
a min{R,n}

R: nmero de xitos
n: nmero de pruebas

Geomtrica

0, 1, 2,

Binomial negativa

0, 1, 2,

Pascal

r, r+1, r+2,

p: probabilidad de xito
r: nmero de xitos
p: probabilidad de xito
r: nmero de xitos

Poisson

0, 1, 2,

http://dxsp.sergas.es
soporte.epidat@sergas.es

p: probabilidad de xito

tasa de ocurrencia

Es equivalente a la distribucin binomial cuando


Nmero de xitos en una muestra de tamao
el muestreo se hace sin reemplazo. Si el tamao
n, extrada sin reemplazo de una poblacin
de la poblacin es grande ambas distribuciones se
de tamao N que contiene R xitos
pueden considerar prcticamente iguales
Nmero de fracasos antes de obtener un Se utiliza en la distribucin de tiempos de espera
xito por primera vez
y tiene la propiedad de falta de memoria
Nmero de fracasos antes de obtener el rCuando r=1 se obtiene la distribucin geomtrica
simo xito
Nmero de pruebas necesarias para obtener r Se relaciona con la binomial negativa de la
xitos
siguiente manera: Pascal(r,p)=BN(r,p)+r
El proceso que genera una distribucin de
Nmero de ocurrencias de un evento "raro" o
Poisson es estable y no tiene memoria.
poco frecuente en un intervalo o espacio
La distribucin binomial se aproxima por la
continuo de tiempo
Poisson si n es grande y p pequea, siendo =np

71

Epidat 4: Ayuda de Distribuciones de probabilidad. Oct 2014.

Anexo 4: resumen continuas

Anexo 4: Resumen de las distribuciones continuas


Distribucin

Campo de
Parmetros
variacin

Uniforme

(a, b)

a: mnimo
b: mximo
: media

Normal

(-, )
: desviacin estndar
X1(-, )

Normal bivariante

X2(-, )

Observaciones
Distribucin clave en la generacin de
distribuciones
Si =0 y =1 se denomina distribucin
normal estndar
De ella derivan las distribuciones ji-cuadrado,
t de Student y F de Snedecor

=(1, 2): media


=(1, 2): desviacin estndar
: coeficiente de correlacin
: escala

Lognormal

(0, )

Logstica

(-, )

Beta

(0, 1)

Gamma

(0, )

Exponencial

(0, )

tasa

Ji-cuadrado

(0, )

n: grados de libertad

t de Student

(-, )

n: grados de libertad

F de Snedecor

(0, )

Cauchy

(-, )

Weibull

(0, )

Laplace

(-, )

Pareto

[x0, )

: forma
a: situacin
b: escala
p: forma
q: forma
a: escala
p: forma

n: grados de libertad

Si X sigue una distribucin lognormal


entonces su logaritmo neperiano sigue una
distribucin normal
Si U sigue una distribucin uniforme en el
intervalo (0, 1) entonces X=ln(U/(1-U)) sigue
una distribucin logstica
Es adecuada para modelar proporciones
Si p=q=1 se obtiene la distribucin uniforme
en (0, 1)
Es adecuada para modelar tiempos de vida
Si p es un n entero se denomina distribucin
de Erlang
Equivalente continuo de la distribucin
geomtrica, tambin posee la propiedad de
falta de memoria

Distribuciones
importantes
en
contrastacin de hiptesis estadsticas

la

m: grados de libertad
: escala
: situacin
a: forma
b: escala

Si =1 y =0 se denomina distribucin de
Cauchy estndar
Si a=1 se tiene la distribucin exponencial
Otro caso particular es la distribucin de
Rayleigh

a: situacin
b: escala
: forma
x0: situacin
a: mnimo

Triangular

[a, b]

c: moda

Se emplea cuando hay poca informacin


disponible de la variable

b: mximo

http://dxsp.sergas.es
soporte.epidat@sergas.es

72