Professional Documents
Culture Documents
Anónimo
Bioestadística y Epidemiologia
2º Grado en Veterinaria
Facultad de Veterinaria
Universidad de León
BIOESTADSITICA Y EPIDEMILOGIA.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Temas del Bloque I – Estadística descriptiva.
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4674686
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4674686
Me han encerrado aquí ¿alguien puede leer esto?
Reservados todos los derechos.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Bioestadística y Epidemiología _____________________________________ Tema 1. Introducción a la Bioestadística.
1. Introducción a la Bioestadística.
La Bioestadística o Biometría es la ciencia que estudia los métodos y
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
procedimientos para recoger, resumir, y analizar datos, así como hacer inferencias
científicas partiendo de tales datos.
La peculiaridad de la Bio-metría es que pretende medir las variables biológicas
(no fijas) con medidas fijas (matemáticas). Si deseo medir una característica biológica en
un individuo, por ejemplo la presión arterial, será muy difícil dar un resultado, pues tantas
veces como la mida obtendré valores diferentes, según la hora del día, el estado del
cuerpo, etc., esta característica me obliga a medir el carácter varias veces, y hace
necesario una ciencia que me permita medir y expresar con rigor esas características tan
“variables”, como son los caracteres que exhiben las poblaciones animales.
Por el contrario, en las ciencias exactas, Física, Química, etc, se trabajan con
Leyes universales (un solo experimento vale) para conocer una característica cualquiera,
poblaciones naturales las variables tienden a tener una distribución normal, si conozco los
procedimientos bioestadísticas con solo dos parámetros de la población (media aritmética
y desviación típica) puedo conocer la distribución total de la población. Es decir podré
saber cuantas ovejas pesan mas de 85 kilos o cuantas entre 70 y 80, etc.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La estadística descriptiva comprende:
Organización y Presentación de los datos con la finalidad de describir las
características de una situación. Así se ocupa de reunir datos de la mejor manera posible
en base a Formularios, Diseño de experimentos, Optimizar el muestreo, etc. La
descripción de las características de una situación concreta se aborda a través de técnicas
de Reducción de datos y Presentación de parámetros de interés, tablas, gráficos, etc.
La estadística inductiva, Inferencia estadística o estadística analítica a comprende:
El Análisis los datos y generaliza conclusiones de tales datos, a través de los
métodos de Estimación de parámetros los métodos de Contraste de hipótesis, que
proporcionan la técnicas matemáticas para generalizar dichas conclusiones. Dichos
parámetro sino estadístico. Los parámetros se denotan con letras griegas (μ-media
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
aritmética, σ-desviación típica), en tanto que los estadísticos con letras latinas (s-
desviación típica).
Los parámetros y estadísticos describen las poblaciones/muestras caracterizando
dichas poblaciones, las diferencias son que los estadísticos suelen ser conocidos, se miden
en las muestra, y los parámetros suelen ser desconocidos, pues el acceso a toda la
población generalmente no es posible.
Población
(32±5)
(p<0,05)
(32±5)
Estimación Experimento
Resultados
Población
(F=32)
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4674686
Bioestadística y Epidemiología _____________________________________ Tema 1. Introducción a la Bioestadística.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Esta secuencia es la forma habitual de acceder a las poblaciones, no obstante, para
completar con rigor el procedimiento es necesario conocer los métodos de muestreo y los
métodos de estimación de parámetros objeto del programa de la asignatura.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
comprar y pagar una licencia de uso, sin embargo actualmente hay a disposición del
usuario muchas opciones de software libre.
El software libre más divulgado para el análisis estadístico y gráfico es el “R”, es
un lenguaje y entorno de programación muy utilizado por los investigadores a nivel
internacional.
Se trata de un proyecto de software libre, resultado de la implementación GNU del
premiado lenguaje S. R y S son, probablemente, los dos lenguajes más utilizados en
investigación por la comunidad estadística, siendo además muy populares en el campo de
la investigación biomédica, la bioinformática y las matemáticas financieras. A esto
contribuye la posibilidad de cargar diferentes bibliotecas o paquetes con finalidades
específicas de cálculo o gráfico.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Distribución de frecuencias. Definición de una distribución de datos en variables
cuantitativas. Medidas de centralización. Medidas de dispersión. Medidas de posición.
Representación gráfica de los datos.
Constantes
Características
de los datos CUALITATIVAS
Variables
Discretas
CUANTITATIVAS
Continuas
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4674686
Bioestadística y Epidemiología ___________________________________________ Tema 2. Organización de los datos.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Katy Canina Hembra 3 5,24 1
Canela Felina Hembra 6 2,10 0
Poncho Canina Macho 3 4,50 -
30 10
20 5
0
10
0
5
13
13
14
14
15
15
0
1 2 3 4 Alzada en cm
Nº de crías
Figura 2-2. Distribuciones de dos tipos de caracteres con variación discreta y continua
2. Distribución de frecuencias.
La distribución de frecuencias es el método para definir como se distribuye una
variable cualitativa, es decir para presentar los resultados de una variable cualitativa,
donde tenemos distintas categorías o modalidades. Así la Distribución de frecuencias se
define como Conjunto de clases de la variable y la frecuencia de cada una de ellas.
Frecuencia absoluta. Número de observaciones en cada categoría.
Frecuencia relativa. Proporción de observaciones en cada categoría.
Ejemplo. ¿ Que tipo de animales llegan a la consulta ? La especie animal que llega a una consulta
veterinaria es una variable cualitativa, donde vamos considerar cinco categorías (perros, gatos, aves, reptiles
y otros).
10
Respuesta:
Opción A. El año pasado se recibieron 1450 consultas y paso un listado con todas las consultas donde se
puede leer la especie animal de cada una de ellas. (Esta opción es poco eficiente).
Opción B. Presento la tabla 2.2. La distribución de frecuencias permite su interpretación con solo leer la
tabla, sin necesidad de leer las 1450 consultas.
Tabla 2-2. Distribución de frecuencias del tipo de animales en la consulta el año pasado.
Frecuencia Frecuencia relativa
Tipo animal (clase)
absoluta
Perros 755 0,52
Gatos 455 0,31
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Aves 136 0,09
Reptiles 36 0,02
Otros 68 0,05
Total 1450 1,00
11
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ejemplo: Para responder a la pregunta de ejemplo anterior ¿ Que altura tienen las alumnos de la clase ? , es
decir para definir su distribución se presentan tres opciones:
A. Presentar el listado de las 200 observaciones y que el lector estudie los datos.
B. Presentar la distribución de frecuencias, ver tabla 2-2, se puede apreciar los resultados con
solo ver la tabla.
C. Presentar la distribución de la variable con solo tres números. Así la altura de los alumnos de
clase del ejemplo anterior podríamos haberla expresado como, Se midieron 200 alumnos con
una media de 175 ± 15 cm. Estos tres valores 200, 175 y 15, si los sabemos interpretar nos
indican con gran concisión la distribución de dicha variable. 175 es la media aritmética y 15
es la desviación típica.
Media aritmética: (μ) Es la suma de todos los valores de la variable dividido por
el número de observaciones.
La formulación de la media aritmética es la siguiente, son formulas equivalentes
en función si los datos estén o no agrupados.
X=
x1 + ..... + xn
X=
∑x i
X=
∑x f i i
n n ni f i
Las observaciones o características de la media aritmética es que:
- Son muy sensibles a los valores extremos, así la media podría desplazarse en la
dirección de los valores extremos, si los hubiera.
- Si consideramos una variable discreta el valor de la media puede no pertenecer al
conjunto de valores la variable, por ejemplo nº de crías por parto en ganado
ovino, x = 1,55.
Ejemplo A, en la serie X ( 20, 24, 31, 35, 45, 49); Media=34; Med = 33.
12
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
variable.
La formulación de la media aritmética es la siguiente fórmula:
Mediana: (Med) Es el valor de la variable que deja por debajo de sí el 50% de las
observaciones.
Las propiedades de la mediana son:
- No está afectada por las observaciones extremas, pues dependen del orden no de
5. Medidas de dispersión.
Las medidas de dispersión son los parámetros o estadísticos que tiene como
objetivo indicar el grado de variabilidad o dispersión de la variable cuantitativa. Nos
indican si los valores están próximos a la media si o están dispersos.
Las medidas de dispersión son: Rango, Desviación media, Varianza, Covarianza,
Desviación típica y Mediana.
Rango. Amplitud o rango es la diferencia entre el valor más alto y mas bajo de las
observaciones.
Propiedades:
- Es fácil de calcular y de interpretar,
- Solo utiliza dos observaciones (máximo y mínimo).
13
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4674686
Bioestadística y Epidemiología ___________________________________________ Tema 2. Organización de los datos.
DM x =
∑ X −X
n
Es un parámetro muy poco utilizado en el tratamiento estadístico.
Varianza: (S2) (V) (σ2)
Media de las desviaciones cuadráticas con respecto a su media aritmética.
Σ 2
−
(Σxi )2
∑ (X − X ) = i
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2 x
Vx = n
n n
Propiedades:
- Es siempre positiva, pues son medias cuadráticas.
- Grandes propiedades para la inferencia estadística.
- El problema es que se mide en unidades cuadráticas, de difícil interpretación.
- Propiedades matemáticas de la varianza:
V(x) > 0
V(X+Y) = VX +VY + 2cov XY
V(X-Y) = VX+ VY - 2cov XY
V(K+X) = VX
Propiedades:
- Es la medida de la dispersión o variabilidad por excelencia en las variables con
distribución normal, pues la función de normalidad es dependiente de la desviación típica.
(Estos conceptos se abordarán en el tema 4)
- No es recomendable como media de dispersión si la distribución no es normal, ni
lo es en este caso la media como medida de centralidad.
14
Propiedades matemáticas:
COV(X,X) = VX
COV(X,Y) = COV(Y,X)
COV(X,a) = 0
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
COV(X+a,Y+b) = COV(X,Y)
X 20 24 31 35 45 49
Y 134 123 150 167 134 210
6. Medidas de posición.
Las medidas de posición son los parámetros o estadísticos que tiene como objetivo
indicar el posicionamiento de un valor concreto en la distribución de la variable. Son
valores de la variable caracterizados por superar a cierto porcentaje de observaciones de
xi 0 1 2 3 4 5 6 7
ni 4 12 16 21 11 18 10 8
Ni 4 16 32 53 64 82 92 100
Q1=P25, = 2;
Q3=P75 =5,
D1=P10 = 1;
D5 = Q2=P50=Med =3;
P80=5
15
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Los gráficos en las variables cualitativas más frecuentes son: diagrama de barras,
gráfico de sectores y pictogramas.
.
500
40 Clínica B
30
400
300
20
200
10
100
0
es
os
os
os
0
ve
ti l
at
tr
rr
O
ep
G
Pe
36 68
136
Perros
Gatos
755 Aves
Reptiles
455
Otros
16
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
modalidades de la variable. Es un mismo dibujo en diferente escala de tal forma que el
área de la figura sea proporcional a la frecuencia de la clase que representa.
90
80
70
60
Frecuencia
50
40
30
20
10
0
145 155 165 175 185 190 205
Altura (cm)
100
80
Frecuencia absoluta
60
40
20
0
145 155 165 175 185 190 205
Altura (cm)
17
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4674686
Bioestadística y Epidemiología ___________________________________________ Tema 2. Organización de los datos.
200
180
160
Frecuencia acumulada
140
120
100
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
80
60
40
20
0
145 155 165 175 185 190 205
Altura (cm)
18
1. Introducción.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La probabilidad nos provee de herramientas para estudiar la incertidumbre, pues nos mide
la incertidumbre en la ocurrencia de un determinado suceso, estudia los fenómenos
aletorios. Además el estudio de las probabilidades nos será muy útil en desarrollo de la
inferencia estadística.
Ejemplo: Ante la decisión de hacer un tratamiento frente a una enfermedad es muy útil conocer de todos los
tratamientos posibles la probabilidad de curación en cada uno de ellos. También es interesante conocer si la
probabilidad de curación de cada tratamiento está condicionada por algún factor del individuo como sexo,
edad, etc., que permitirá elegir el tratamiento más interesante.
19
3. Probabilidad y propiedades.
Probabilidad: Respecto al concepto de probabilidad tenemos varios puntos de vista o
definiciones.
Probabilidad clásica (según Laplace). Cociente entre el número de casos favorables y
casos posibles, cuando todos los sucesos elementales son igualmente probables.
CF
P( S ) =
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
CP
Ejemplo, Sacar un número par al lanzar el dado P (nº par) = 3/6 = 0,5.
Probabilidad frecuencial (según Mises). La probabilidad de un suceso es el límite de su
frecuencia relativa cuando el número de pruebas tiende a infinito.
f
p ( S ) = lim n −>∞
n
Ejemplo, Lanzar una moneda al aire, probabilidad de cara, ½ .
Propiedades de la probabilidad.
Las propiedades de la probabilidad se deducen a partir de estos axiomas.
♦ La probabilidad de un suceso vacío o imposible es cero, p (Ø) = 0.
♦ La probabilidad de un suceso seguro es uno, p (Ω)=1.
♦ La ley de la adicción: p (A U B) = p(A) + p(B) - p (A ∩ B)
Para sucesos compatibles. p (A+B) = p(A) + p(B) – p (A.B).
Para sucesos excluyentes: p (A+B) = p(A) + p(B), p (A.B)=0
♦ La ley de la multiplicación: p (A ∩ B) = p(A) . p (B/A)
Probabilidad condicionada, P(B/A), es la probabilidad de B condicionado a que suceda A.
Para sucesos independientes, p (A y B) = p(A) . p(B), p(B/A)=P(B)
Para sucesos dependientes, p (A y B) = p(A) . p(B/A),
♦ Suceso contrario, p ( A ) = 1 − p ( A)
♦ Suceso complementario, p ( A) = p ( A ∪ B) + p ( A ∩ B )
Cuando el especio muestral es discreto se puede estimar la probabilidad de todos los
subconjuntos y de los sucesos elementales.
20
Cuando el espacio muestral es continuo (R) se mide una característica continua asociado
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
a un experimento y no es posible estimar la probabilidad de un punto concreto ni los
subconjuntos de R, si la probabilidad en un intervalo y de todos los subconjuntos de
intervalos.
4. Sucesos compatibles vs sucesos excluyentes.
Sucesos incompatibles o excluyentes son aquellos que no se pueden verificar
simultáneamente. Cuando pueden verificarse ambos a la vez se llaman compatibles.
Si A y B son incompatibles, entonces A B= Ø.
Si A y B son compatibles, entonces A B≠Ø
Ejemplo: Sea el experimento aleatorio lanzamiento del dado. Definimos los sucesos:
A = "salir un número par"
B = “salir un nº impar”
C = "salir un múltiplo de tres"
5. Probabilidad condicionada.
Cuando a las condiciones del experimento se la añade una condición supletoria (que
se ha cumplido) el universo queda restringido a los resultados que cumplen esa condición,
es los que se denomina probabilidad condicionada, P(A/B), se define como probabilidad
de que suceda A, habiéndose cumplido B.
Ejemplo: En el experimento del lanzamiento del dado.
suceso A- salgan un 2 (p(A)= 1/6)
suceso B, salga un nº par (p(B)=1/2).
La probabilidad de que salga un 2, sabiendo que ha salido nº par, se puede formular en términos de
probabilidad condicionada, p(A/B), siguiendo la ley de la multiplicación podemos formular p(A/B)
= p(A y B)/p(B) = (1/6)/(1/2)= 1/3.
La probabilidad condicionada es muy utilizada en la diagnosis médica, se calcula
la probabilidad de que tenga una enfermedad condicionada a que tenga un complejo
particular de síntomas. Para diagnosticar una enfermedad se valoran muchos síntomas y
cada uno de ellos nos va precisando más probabilidad de tener o no tener dicha
enfermedad.
21
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4674686
Bioestadística y Epidemiología ___________________________________________ Tema 3. Cálculo de probabilidades.
Ejemplo. Se realiza una encuesta en una muestra de la población donde se recogen dos sucesos (A es
fumador, SI/NO; B, género Hombre/Mujer), los resultados son los siguientes:
Tabla 3-1. Tabla de contingencia de frecuencias absolutas.
Fuma \ Genero Varón Mujer Global
SI fuma 25 15 40
No fuma 85 75 160
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Global genero 110 90 200
7. Teorema de Bayes.
El teorema de Bayes es una propiedad de la probabilidad condicionada, es una
generalización de la probabilidad condicionada a un experimento con varios sucesos.
La probabilidad condicionada y el teorema de Bayes son muy utilizados en la teoría
probabilística del diagnostico médico, en la aplicación de los estudios de factores de
riesgo, en la medida de la asociación entre factores de riesgo y enfermedad, etc.
Sea B1,B2,…Bn sucesos de una partición de Ω y A un suceso con probabilidad
positiva, el teorema de Bayes se define como
p( A / B) p( B) p ( A / Bi ) p ( Bi )
p ( B / A) = --------- p ( B1 / A) = n
p ( A)
∑ p( A / B ) p( B )
J =1
j j
Ejemplo: Un una determinada población se sabe que de cada 100 pacientes con dolor crónico de estómago
70 presentan gastritis, 20 úlcera y 10 cáncer. En el análisis de la sintomatología se ha comprobado que las
probabilidades de presentar vómitos son: en la úlcera 0,6, en la gastritis 0,3 y en el cáncer 0,9.
22
Si estamos ante un paciente con dolor de estómago que presenta vómitos: ¿ Que probabilidad tiene de tener
un cáncer gástrico ?.
Solución: Experimento A, Tener/ no tener vómitos.
Experimento B, Tener dolor de estómago.
Conocemos las frecuencias de los tres sucesos del experimento B,
B1, dolor de estomago y gastritis, p(B1) = 0,70
B2 dolor de estomago y úlcera, p(B2) = 0,20
B3, dolor de estomago y cáncer, p(B3) = 0,10
También conocemos las probabilidades condicionadas del suceso B con cada uno de los sucesos de A.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
p(A/B1), p (vómitos/ sabiendo que tiene gastritis), 0,30
p(A/B2), p (vómitos/ sabiendo que tiene úlcera), 0,60
p(A/B3), p (vómitos/ sabiendo que tiene cáncer), 0,90
Formulación
0,01x0,9 0,09
p ( B3 / A) = = = 0,21
(0,7 x0,3) + (0,2 x0,6) + (0,1x0,9) 0,42
23
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Tema 4. Variables aleatorias, distribución en la población. Distribuciones de
variables discretas: binomial, de Poisson. Distribuciones variables continuas: D. normal.
Tipificaciones. Desviaciones de la normalidad.
1. Variables aleatorias.
Siguiendo el concepto de experimento aleatorio (tema I.3), se define una variable
aleatoria como aquella que toma distintos valores según el azar. En función de los
valores que tome la variable se clasifica en variable aleatoria discreta o contínua.
Ejemplos:
1. Se cruzan dos individuos heterozigóticos, Bb x Bb, los genotipos de los
descendientes forman el siguiente universo Ω = {BB, Bb,bB,bb}
La variable aleatoria puede definirse en este caso como X = nº de alelos tipo B,
0,6 0,5
0,4 0,25 0,25
P(x)
0,2
0
0 1 2
Nº de caras
25
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4674686
Bioestadística y Epidemiología _________________________________________________ Tema 4. Variables aleatorias.
El interés en estudiar las distribuciones está en que nos preguntamos ¿ Que leyes
matemáticas siguen las distribuciones de los datos biológicos ? Si encontramos una
formula teórica (función) que sigua la misma distribución que los datos y se ajusta bien,
estaríamos modelizando dicho fenómeno biológico.
Muchas variables o caracteres biológicos se ajustan a funciones muy conocidas,
por ejemplo la función distribución normal o de Gaus es muy estudiada por que la
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
mayoría de las variables cuantitativas en biología siguen esa distribución.
Las distribuciones teóricas de variables discretas más conocidas son: Binomial,
multinomial y de Poisson. Las continuas son Normal, T-student, Ch-cuadrado, F de
Fisher.
3. Distribución binomial.
Premisa: Experimentos donde hay dos sucesos posibles, Si-No, Enfermo-Sano, +/-,
favorable-contrario, etc.
Ejemplo, lanzamiento de una moneda (cara /cruz), resultado del tratamiento de
Definición: (En un experimento aleatorio con dos sucesos posibles, uno principal
y otro contrario), la variable aleatoria binomial se define como Nº de elementos
principales x contenidos en una muestra de n elementos al azar de la población.
En una sucesión de n elementos: x son favorables/principales
n-x son desfavorables/contrarios
p probabilidad del suceso favorable
q=1-p probabilidad del suceso contrario
P( I ) = B( X ) = nx p x q n − x
La probabilidad de una sucesión I(x) es:
Donde nx = n!
son la permutaciones posibles y p x q n − x es el producto
x!(n − x)!
de n probabilidades
26
5
5.4.3.2.1 1 10
B( 5, 3, 0 , 5 ) = 53 0,530,52 = = = 0,3125
3.2.1.2.1 2 32
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Probabilidad binomial individual B (x,n,p), que sean exactamente x favorables.
Probabilidad binomial acumulada B (r,n,p), que sean r o mas que r favorables,
(al menos r).
4. La distribución de Poisson.
La distribución de los sucesos raros. Es el caso límite de la distribución binomial
cuando n tiende infinito y p tiende a cero, n . p tiende a λ (media), es decir λ =n.p
Ejemplos: Nº de glóbulos blancos en 0.0001 mm3 de sangre.
Ejemplo:
Enfermedad con p = 1/100000, en una ciudad con 500.000 habitantes.
¿Probabilidad de que la padezcan 3 personas ?
53 e −5
P( 5, 3) = = 0,1404
3!
En la distribución de Piosson también está tabulada su función de densidad, que
utilizaremos en la resolución de ejercicios.
27
normal, por ejemplo el CCS (Concentración de células somáticas en leche), para que sea
normal es necesario hacer la transformación logarítmica.
Otra característica que le da gran importancia a la distribución normal es que tiene
grandes propiedades matemáticas y está tabulada, así muchos métodos de inferencia
estadística se basan en la distribución normal y sirve de referencia para describir otras
distribuciones.
Definición: Se dice que una variable es normal de Gaus, aquella variable aleatoria
continua x cuyo rango es todo el eje real (-∞,+∞), cuya media es μ y su varianza es σ2 si
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
su función de densidad viene dada por la expresión
( x − µ )2
1 −
f ( x) = e 2σ 2
2πσ
Propiedades:
Variable x es N (µ, σ)
Función de densidad es una curva con forma de campana se le llama campana de
28
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
6. La distribución normal Tipificada.
Existen muchos tipos de campanas de Gaus, dependiendo de la media y de la
desviación típica, pero se puede generalizar a un que denominamos distribución normal
tipo.
Se denomina distribución normal tipo aquella distribución de la variable z cuando
N(0,1).
Z es la variable tipificada
Z es N(0,1)
Permite tabular función de distribución.
29
a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4674686
Bioestadística y Epidemiología _________________________________________________ Tema 4. Variables aleatorias.
No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
aritmética.
Para medir el nivel de asimetría se utiliza el llamado Coeficiente de Asimetría g1.
g1= 0 es distribución simétrica; existe la misma concentración de valores a la
derecha y a la izquierda de la media; g1 > 0, distribución asimétrica positiva; existe
mayor concentración de valores a la derecha de la media que a su izquierda y g1< 0,
distribución asimétrica negativa; existe mayor concentración de valores a la izquierda de
la media que a su derecha.
8. Ejercicio resuelto.
Supongamos que se sabe que el peso de los individuos de una determinada
población sigue una distribución aproximadamente normal, con una media de 80 Kg y
una desviación estándar de 10 Kg.
A) ¿Podremos saber cuál es la probabilidad de que una persona, elegida al azar, tenga un
peso superior a 100 Kg ?
x − 80
La probabilidad que se desea calcular es z=
10
100 − 80
La probabilidad que obtengo en la tabla es: P( x > 100) = P z > = P(z > 2)
10
30