You are on page 1of 18

Bioestadística

2 Parte: Probabilidades
Dra. Alexandra Torres A. MD. Bioestadística
• Probabilidad Estadística

I. Introducción

La estadística descriptiva nos sirve para organizar y resumir un conjunto de


datos, también podríamos estar interesados en investigar cómo emplear la
información contenida en la muestra, para inferir las características de la
población de la cual se tomó, esto se fundamenta en la teoría de las
probabilidades.

Hay dos maneras principales de entender la probabilidad:

Frecuentista (objetiva): Probabilidad de un suceso es la frecuencia relativa (%)


de veces que ocurriría el suceso al realizar un experimento repetidas veces.

Subjetiva (bayesiana): Grado de certeza que se posee sobre un suceso. Es


personal

Experimentos aleatorios

Diremos que un experimento es aleatorio si se verifican las siguientes


condiciones:
1. Se puede repetir indefinidamente, siempre en las mismas condiciones;
2. Antes de realizarlo, no se puede predecir el resultado que se va a obtener;
3. El resultado que se obtenga, e, pertenece a un conjunto conocido
previamente de resultados posibles. A este conjunto, de resultados posibles, lo
denominaremos espacio muestral y lo denotaremos normalmente mediante la
letra E.

. Operaciones con eventos y probabilidades.


Evento = elemento básico al cual se puede aplicar la probabilidad. Es el
resultado de una observación o experimento, o la descripción de un resultado
potencial.
Ejemplo: El evento de que una mujer de 30 años llegue hasta los 70 años. Otro
evento de que a la misma mujer se le diagnostique cáncer cervical antes de
cumplir 40 años.
Un evento sucede o no sucede, en probabilidad se representan con letras
mayúsculas, como A, B y C.

17
Operaciones con eventos:

1.La Intersección de dos eventos A y B, denotada A B, se define como el


evento “ A y B”.
Ejemplo: Sea A el evento de que una mujer de 30 años llegue viva a los 70
años, y B el evento de que su esposo de 30 años aún viva a los 70 años. La
intersección de A y B sería el evento de que tanto la mujer como su esposo se
encuentren vivos a los 70 años.

2.La unión de A y B denotada A B, es el evento “A o B o A y B”. En el ejemplo


anterior la unión de A y B sería el evento de que la mujer de 30 años o su
esposo, vivan hasta los 70, o que ambos vivan hasta cumplir 70 años de edad.

3.Diferencia:
Dados dos sucesos aleatorios A,B E, se llama suceso diferencia de A y B, y se
representa mediante A\B, o bien A − B, al suceso aleatorio
formado por todos los sucesos elementales que pertenecen a A, pero no a B:

El complemento de un evento A, denotado por A o A, es el evento no A.


Como consecuencia, A es el evento de que la mujer de 30 años muera antes de
cumplir los 70 años

Probabilidad Condicionada

Se llama probabilidad de A condicionada a B, o probabilidad de A sabiendo que


pasa B

El valor numérico de una probabilidad se encuentra entre 0 y 1, o un número


entre 0 y 1

Cualquier problema de probabilidad puede resolverse en teoría mediante


aplicación de los axiomas. Sin embargo, es más cómodo conocer algunas
reglas de cálculo:

P(A’) = 1 - P(A)
P(AUB) = P(A) + P(B) - P(AB)
P(AB) = P(A) P(B|A)=P(B) P(A|B)
Prob. de que pasen A y B es la prob. de A y que también pase B
sabiendo que pasó A.

17
Dos sucesos son independientes si la el que ocurra uno no añade información
sobre el otro. En lenguaje probabilístico:
A indep. B  P(A|B) = P(A)
Dicho de otra forma:
A indep. B  P(AB) = P(A) P(B)

Ejemplo:

 En un estudio hecho en el Hospital Calvo Mackenna sobre frecuencia de


parásitos en niños se encuentra:
22 casos de áscaris
178 casos sin áscaris
200 casos estudiados
Si se elige al azar uno de estos 200 niños. ¿Cual es la probabilidad que él esté
infectado?

Simbología:
n = número de niños examinados = número de casos posibles = número de
puntos en el espacio muestral.
mA = número de niños con hecho A cuya probabilidad se estudia = número de
casos favorables
PA = probabilidad de ocurrencia de A

Entonces : P(A) = mA/n = 22/200 = 0.11 o bien 11 %. Representa la frecuencia


relativa con que ocurre un determinado hecho si este se repite
indefinidamente.
 El modelo aplicado se caracteriza porque se asigna igual probabilidad a
todos los puntos.
 En consecuencia la probabilidad que no ocurra A es:
 P( A) = 1- P(A) = 1-0.11 = 0.89

Entonces = P(A) + P (A) = 1

Si en el total de 200 niños no hubiera ningún infectado la P (A) =0


Si todos estuvieran infectados P (A) = 1

P = 0 imposibilidad de ocurrencia
P = 1 certeza de ocurrencia

. Regla de Probabilidades:
Notación:
P denota una probabilidad, A, B, C denotan sucesos específicos.
P (A) denota la probabilidad de que ocurra el suceso A.

 Regla 1= Aproximación de probabilidad por frecuencia relativa

Si se realiza un experimento un gran número de veces y se cuenta las veces


que ocurre el suceso A. Entonces, P(A) se estima de la siguiente forma:

17
P(A) = número de veces que ocurrió A
número de veces que se repitió el experimento
Se aplica a resultados no igualmente probables.

 Ejemplo regla 1:
En un año reciente, 371 personas fueron alcanzadas por un rayo, en una
población de 260 millones. Calcular la probabilidad de que una persona
seleccionada aleatoriamente sea alcanzada por un rayo este año.
371 = 1 / 701.0000
260.000.000

Aplicación regla 1 porque:


 El espacio de muestra consiste en dos sucesos simples : alcanzadas o
no.
 Los sucesos no son igualmente probables
 Podemos investigar los hechos del pasado

Regla de la suma:

Notación: P (A o B)= P( ocurre el suceso A u ocurre el suceso B o ambos


ocurren)
Regla formal de la suma: P (A o B)= P (A)+ P (B)- P (A y B) donde P( A y B)
denota la probabilidad de que ocurran tanto A como B, al mismo tiempo como
resultado de un experimento.

Cuando dos eventos son mutuamente excluyentes, la propiedad aditiva de la


probabilidad indica que la probabilidad de que cualquiera de los dos eventos
ocurra es igual a la probabilidad de los eventos individuales es decir:

P (A U B)= P ( A) + P (B)

Esta propiedad puede extenderse al caso de tres o más eventos mutuamente


excluyentes.
Si loe eventos no son mutuamente excluyentes, la probabilidad de que
cualquiera de los sucesos ocurra es :

P (A U B)= P (A) + P (B) – P (A Ω B)

Teorema de adición de probabilidades


A menudo interesa la ocurrencia de más de un hecho = P ( A o B), la
probabilidad de que ocurra el suceso A o de que ocurra el suceso B ( o de que
ambos ocurran ) como único resultado de un experimento.

17
 En el ejemplo anterior, se investigó la existencia de otro parásito, la lamblia, con los
resultados siguientes
Infestación porInfestación por lamblia
áscaris
si no total
Si 10 12 22
No 82 96 178
total 92 108 200
 Originalmente teníamos dos probabilidades: que un niño elegido tuviera
áscaris P (A)= 0.11 o que no los tuviera = P (A) = 0.89 ambas suman 1.

 Denominemos el hecho de tener áscaris por A y el de tener lamblia B.


 La certeza actual =1 está constituida por la suma de las siguientes
probabilidades
o P (AB) = probabilidad de tener áscaris y no tener lamblia = 12/200 =
0.06
o P (AB) = probabilidad de tener lamblias y no tener áscaris =
82/200 = 0.41
o P (AB) = probabilidad de tener lamblias y tener áscaris = 10/200 = 0.05
o P ( AB) = probabilidad de no tener lamblias ni áscaris = 96/200= 0.48
o Total = 1
 En resumen :
 la probabilidad de que ocurra por lo menos uno de los hechos A o B es la
suma de las probabilidades simples de ocurrencia de cada uno de ello,
menos la probabilidad de que ambos ocurran simultáneamente.
 En el ejemplo:
P (A o B)= 22/200+92/200-10/200= 0.52

En Resumen Regla de la suma:


Son A y B mutuamente excluyente

Si = P (A o B) = P(A) + P(B)

No = P (A o B) = P(A ) + P (B) – P (A y B)

Regla de la multiplicación

La probabilidad de que dos eventos A y B ocurran , es igual a la probabilidad de


A multiplicada por la probabilidad de B, puesto que A ya ocurrió.

P (A B) = P (A)* P (B/ A)

Dos sucesos son independientes si la ocurrencia de uno no afecta la ocurrencia


del otro. Varios sucesos son independientes si la ocurrencia de cualquiera no

17
afecta las probabilidades de ocurrencia de los otros) .Si A y B no son
independientes, se dice que son dependientes.

Regla formal de la multiplicación:


P ( A y B)= P (A)* P (B) si A y b son independientes
P (A y B) = P (A) * P (B/ A) si A y b son dependientes

Sucesos independientes
 Dos sucesos son independientes si :
P ( B/A) = P (B) o P (A y B) = P (A)* P (B)
Ejemplo: si P ( B/A) = 0.2 y P (B) = 0.2 entonces P ( B/A) = P (B) y podemos
concluir que A y B son sucesos independientes, concluimos que la ocurrencia
del suceso A no afectó la probabilidad del suceso B.

 Dos sucesos son dependientes si :


P ( B/A) = P (B) o P (A y B) = P (A) * P (B)
Ejemplo: si P ( B/A) = 0.5 y P (B) = 0.6 entonces concluimos que A y B son
sucesos dependientes, la ocurrencia del suceso A afecta la probabilidad del
suceso B

Ejemplo Sucesos independientes y no independientes


 En una escuela se examina a 1500 alumnos para establecer su estado
nutritivo en relación al sexo.
 Se define: A = hombre A = Mujer B = desnutrición B = ausencia de
desnutrición
 Si el resultado es:
Número de Alumnos Desnutridos
Nª %
Hombres 1000 100 10
Mujeres 500 50 10
Total 1500 150 10
 A y B son independientes:
 P ( B/A) = 100 / 1000 = 0.10
 P (B) = 150 / 1500 = 0.10 A y B son independientes
 La probabilidad de que un niño de la escuela sea hombre y desnutrido
es:
 P (AB) = P (A) * P (B) = (1000/1500) * (150/1500) = 0.067
Ejemplo Sucesos dependientes
 P = (B/A) = 50 / 1000 = 0.05.
 P (B) = 100 /1500= 0.067
 A y B son dependientes ( la presencia de uno afecto al otro), la
desnutrición depende del sexo.
 P (A/B) = P (A)* P (B/A) = (1000/1500)* (50/1000) = 50/1500=0.033
 Dos sucesos son dependiente si P(B/A) es distinto P (B)
 o P(A y B) es distinta a P (A)* P(B)
N º Alumnos Desnutridos
Nª %

17
Hombres 1000 50 5
Mujeres 500 50 10
Total 1500 100 6.7

Teorema de Bayes
 Es la probabilidad de que ocurra un hecho cuando se establece como
condición que previamente haya ocurrido otro hecho. En símbolos se
representa por : P (A/B) = probabilidad de que ocurra A habiendo
ocurrido B.

 P ( Ai/B)= P (Ai)*P (B/A)


P (A1) *P (B/A1) +………+P(An)*P(B/An)

Probabilidad Conjunta

Bibliografía :
Susan Milton Estadísticas para las Ciencias de la salud. 3º edición. Ed. MC
GRAW – HILL
Erica Taucher Bioestadística Ed. Universitaria
Daniel . Estadistica base para el análisis de las ciencias..

• Distribución de Probabilidades

Cualquier característica que pueda medirse o clasificarse se denomina


Variable.
Si una variable toma valores tales que cualquier resultado particular se deba al
azar, se trata de variable aleatoria. Resultados numéricos

Las v. a. se representan con letras mayúsculas, como X, Y, Z

Una variable discreta solo toma una cantidad finita o contables de resultados.
Ejemplo: estado civil: soltero, viudo, casado.; nº de otitis en un año

17
Una variable aleatoria continua como el peso o altura puede tomar cualquier
valor en un intervalo específico = continuo

Distribución de Probabilidades:

Toda variable aleatoria posee una distribución de probabilidad correspondiente.


Una distribución de probabilidad aplica la teoría de probabilidades para
describir el comportamiento de la v. a.

En el caso discreto especifica todos los valores posibles de la v.a junto a la


probabilidad de que ocurra= Función de probabilidad

Función de densidad.
En el caso continuo, nos permite determinar las probabilidades asociadas con
intervalos de valores específicos. Una variable aleatoria continua como el
peso o altura puede tomar cualquier valor en un intervalo específico =
continuo

¡Para qué sirve la función de densidad?


 Muchos procesos aleatorios vienen descritos por variables de forma que
son conocidas las probabilidades en intervalos.
 La integral definida de la función de densidad en dichos intervalos
coincide con la probabilidad de los mismos.
 Es decir, identificamos la probabilidad de un intervalo con el área bajo la
función de densidad.

Función de distribución
.Es la función que asocia a cada valor de una
variable, la probabilidad acumulada
de los valores inferiores o iguales.

Piénsalo como la generalización de las


frecuencias acumuladas. Diagrama integral.
A los valores extremadamente bajos les corresponden valores de la función de
distribución cercanos a cero.
A los valores extremadamente altos les corresponden valores de la función de
distribución cercanos a uno.
Lo encontraremos en los artículos y aplicaciones en forma de “p-valor”,
significación,

Para que sirve la función de distribución


Contrastar lo anómalo de una observación concreta.

Sé que una persona de altura 210cm es “anómala” porque la función de


distribución en 210 es muy alta.
Sé que una persona adulta que mida menos de 140cm es “anómala” porque la
función de distribución es muy baja para 140cm.
Sé que una persona que mida 170cm no posee una altura nada extraña pues
su función de distribución es aproximadamente 0,5.
Relacionarlo con la idea de cuantil.

17
• Si una v. a toma gran cantidad de valores, podemos describir una
distribución de probabilidad con una medida de tendencia central y una
de dispersión.
• El valor promedio que toma una v. a = media poblacional
• La dispersión de los valores relativos = varianza poblacional. Raíz
cuadrada de la varianza = desviación estándar poblacional.
.

Modelos de VA

 Hay v.a. que aparecen con frecuencia en las Ciencias de la Salud.


 Experimentos dicotómicos.
 Bernoulli
 Contar éxitos en experimentos dicotómicos repetidos:
 Binomial
 Poisson (sucesos raros)
 Y en otras muchas ocasiones…
 Distribución normal (gaussiana, campana,…)

1. Distribución Bernoulli

Consiste en realizar un experimento aleatorio una sola vez y observar si cierto


suceso ocurre o no, siendo p la probabilidad de que esto sea así (éxito) y q =
1−p el que no lo sea (fracaso).
X=1 (éxito, con probabilidad p)
X=0 (fracaso, con probabilidad q=1-p)
Lanzar una moneda y que salga cara.
p=1/2
Elegir una persona de la población y que esté enfermo.
p=1/1000 = prevalencia de la enfermedad
Aplicar un tratamiento a un enfermo y que éste se cure.
p=95%, probabilidad de que el individuo se cure
Como se aprecia, en experimentos donde el resultado es
dicotómico, la variable queda perfectamente determinada
conociendo el parámetro p.

2. Distribución Binomial

17
Se dice que una v.a. X sigue una ley binomial de parámetros n y p, X;B(n, p), si
es la suma de n v.a. independientes de Bernouilli con el mismo parámetro, p:

X;B(n, p) () X = X1+· · ·+Xn, donde Xi;Ber (p), i = 1, . . . , n

Esta definición puede interpretarse en el siguiente sentido: Supongamos que


realizamos n pruebas de Bernouilli, Xi, donde en todas ellas, la probabilidad de
éxito es la misma (p), y queremos calcular el número de éxitos, X, obtenidos el
total de las n pruebas corresponde a una distribución binomial.
Si se repite un número fijo de veces, n, un experimento de Bernoulli con
parámetro p, el número de éxitos sigue una distribución binomial de
parámetros (n,p).
El valor esperado y la varianza de esta variable son:
E[X] = np
Var [X] = npq

Considere una v. a binaria, Y. La variable Y debe tomar dos posibles valores


excluyentes. Ejemplo: hombre, mujer; enfermedad, salud.
A menudo se les denomina “fracaso” “éxito “= v. a de Bernoulli

Ejemplo:

Uso fórmula binomial:


x n-x
 P (x) = n! * p *q para x = 0,1,2,……n q= (1-p)
(n –x)! x!

 Ejemplo : Dado que el 10 % de la gente es zurda , interesa conocer la


probabilidad de obtener exactamente 3 estudiantes zurdos en un grupo
de 15 estudiantes.
 Es este un experimento binomial
 Identifique los valores de n,x,p y q.
Solución: Es experimento binomial porque:

17
o El número de ensayos es fijo
o Los ensayos son independientes, ya que un estudiante sea zurdo o diestro
no afecta la probabilidad de que otro sea zurdo o diestro.
o Cada ensayo tiene 2 categorías: zurdo o no
o La probabilidad es constante 0.10.
Valores n,x,p y q.
 Con 15 estudiantes n = 15
 Queremos 3 estudiantes zurdos ( éxitos) x =3
 La probabilidad de obtener un estudiante zurdo es de 0.10= p =0.10
 La probabilidad de fracaso es 0.90= q = 0.90 = ( 1-p)

Uso de la tabla
 En lugar de utilizar estos cálculos a mano, podemos utilizar la tabla A:1
del apéndice A para obtener las probabilidades binomiales del valor
selecto n y p .
 El número de ensayos n aparece en la primera columna de la izquierda
de la tabla para n <=20. La cantidad de éxitos se encuentra en la
segunda columna de la tabla y toma valores enteros de 0 a n. La
probabilidad p figura en el reglón ubicado en la parte superior.
 Para valores específicos de n, x y p , la entrada en el cuerpo de la tabla
representa:
 x n-x
 P (X = x)= n p (1-p)
x
 Ejemplo : n = 15, x = 3, p = 0.10
 Tabla = 0.1285

3. Distribución de Poisson

17
4. Distribución Normal:

17
17
Cálculo de Areas:
 Supongamos que frente a una determinación de glucosa en la sangre,
tengamos que decidir si este valor es normal o no. Se sabe que midiendo
la glucosa sanguínea tiene una distribución normal con media =83 y
DS= 4

17
 Para determinar si es habitual tener un valor de esta magnitud o
superior, estando sano, debemos calcular la probabilidad con que esto
ocurre., es decir en qué medida un valor determinado se aparta de la
media describiendo su situación en unidades de DS

 Para calcular el área bajo la curva normal, a partir de determinado valor


de la variable x, se han construido tablas de áreas de la normal
reducida, con promedio 0 y DS = 1.
 Para usar estas tablas es necesario transformar la variable original en
que están dado los datos de manera que su promedio y su DS tengan
estos valores = variable normal estándar = z

 Un valor tipificado o z es un procedimiento que permite expresar


cualquier valor inicial en términos de unidades DS

 Z = x-u
Sigma

En el ejemplo, si encontramos un valor de glucosa sanguínea de 90, el valor z


correspondiente es:
z = 90-83 = 1.75
4
Es decir 90 se encuentra a 1.75 DS del promedio
• Puntaje z: distancia a lo largo de la escala horizontal de la gráfica
• área o probabilidad = representan regiones bajo la curva normal

• Uso de la tabla:
• En la tabla, z aparece hasta con 2 decimales, indicándose los enteros y
el primer decimal en la primera columna y el segundo decimal en la
primera fila.
∞ El centro de la tabla contiene los valores de la superficie bajo la curva,
expresada en relación a 1 desde el valor de z hasta infinito en la misma
posición. Es decir para un z positivo, desde z hasta + infinito y para un z
negativo , desde z hasta – infinito.

 En el ejemplo z = 1.75 el área correspondiente es 0.041. Esto significa
que según el modelo de distribución normal que la probabilidad de
encontrar valores iguales o superiores es 0.041 o bien que hay un 4.01%
de valores iguales o superiores a 90 mg por 100 ml. de sangre.

 Si definiéramos como raros, aquellos valores que ocurren menos de un


5% de las veces en este caso debiéramos considerar como anormal la
glicemia encontrada

Ejemplo: Queremos conocer la probabilidad de encontrar valores de glicemia


entre 75 y 85 mg, buscamos z y su área para ambos valores.

17
z1 = (75 -83)/4 = -2 p1= 0.0228
z2 =(83 –83)/4 = 0.5 p2= 0.3085
Gráfica:
Lo que interesa es el área en blanco. Sumamos áreas extremas y restamos a la
superficie total = 1, encontramos la probabilidad buscada =
0.0228 + 0.3085 = 0.3313
1.0000 – 0.3313 = 0.6915

La probabilidad de encontrar valores entre 75 y 85 es de 0.6915, es decir


esperamos que el 69.15 % de los individuos sanos tengan una glicemia entre
75 y 85 mg.

Distribuciones asociadas a la normal

Cuando queramos hacer inferencia estadística hemos visto que la distribución


normal aparece de forma casi inevitable.
Dependiendo del problema, podemos encontrar otras (asociadas):
X2 (chi cuadrado)
t- student
F-Snedecor

Distribución Ji Cuadrado
Tiene un sólo parámetro denominado grados de libertad.
La función de densidad es asimétrica positiva. Sólo tienen densidad los valores
positivos.
La función de densidad se hace más simétrica incluso casi gausiana cuando
aumenta el número de grados de libertad.
Normalmente consideraremos anómalos aquellos valores de la variable de la
“cola de la derecha

Distribución t Student
Tiene un parámetro denominado grados de libertad.
Cuando aumentan los grados de libertad, más se acerca a N(0,1).
Es simétrica con respecto al cero.
Se consideran valores anómalos los que se alejan de cero (positivos o
negativos).

Distribución F de snedecor
Tiene dos parámetros denominados grados de libertad.
Sólo toma valores positivos. Es asimétrica.
Normalmente se consideran valores anómalos los de la cola de la derecha.

Bibliografía:

Cualquier Libro de Estadística Capítulo Probabilidad Estadística.


Estadística William Sheffler
Estadística Colección Shaum

17
17