Professional Documents
Culture Documents
ELEMENTOS DE
ESTADÍSTICA
GUÍA DE TRABAJOS
PRÁCTICOS
2011
SECRETARIA DE PUBLICACIONES
Facultad de Ciencias
Veterinarias
U.B.A.
Elementos de Estadística
Guía de Trabajos Prácticos
Área Bioestadística
2011 – 1er. Cuatrimestre
Cronograma 2011 – 1er. Cuatrimestre
Sem lunes
1 Miér 9/3 Jue: Experimentos aleatorios. Teorías de probabilidad.
2 14/3 Mar: Experimentos aleatorios. Teorías de probabilidad.
Jue: Probabilidad Condicional. Probabilidades conjuntas. Variable
aleatoria
Función de probabilidad, función de densidad y función de
distribución.
3 21/3 Mar: Probabilidad Condicional. Probabilidades conjuntas. Variable
Feriado aleatoria Función de probabilidad, función de densidad y función de
Jue 24
distribución.
4 28/3 Distribuciones especiales: distribución Binomial, distribución Normal
Feriado
Sáb 2/4
I
Bibliografía
DeVore, Jay, L.: Probabilidad y Estadística para Ingeniería y Ciencias.
International Thomson Editores. 6ta. Edición. México. Capítulos: 1 a 8.
NOTA IMPORTANTE:
II
Sistema de Evaluación de Elementos de Estadística
Se tomarán dos parciales, que serán calificados en una escala de 0 a 10, en forma
global.
III
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
PROBABILIDAD
OBJETIVO ESPECIFICO
Comprender, analizar y aplicar a la resolución de problemas los conceptos de probabilidad, experimento
y variable aleatoria.
CONTENIDOS TEMATICOS
Probabilidad: Nociones de probabilidad basadas en la teoría clásica, del límite de frecuencia relativa, y la
definición axiomática. Características de cada una de las teorías. Experimento y suceso aleatorio. Reglas de
la suma y del producto, y sus aplicaciones. Probabilidad condicional. Aplicaciones.
GLOSARIO
Experimento aleatorio. Espacio muestral. Punto muestral. Sucesos. Casos especiales: sucesos imposibles,
ciertos o seguros, mutuamente excluyentes o incompatibles, complementarios. Definición clásica de
probabilidad, la probabilidad como límite de la frecuencia relativa, teoría axiomática de probabilidad.
Propiedades derivadas de la definición axiomática. Teoremas de la suma y del producto de probabilidades.
Probabilidad condicional. Probabilidad conjunta. Independencia de sucesos.
PROBLEMAS RESUELTOS
EJERCICIO 1) Se tiene una urna que contiene tres bolillas verdes y dos rojas numeradas del 1 al 5.
1.1) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos, si el experimento consiste en elegir una
bolilla al azar y
A) se observa y registra el color;
B) se observa y registra el número.
1.2) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios, asignando la
probabilidad correspondiente a cada uno de sus elementos si
1.2.1) el experimento consiste en elegir dos bolillas al azar, una y luego la otra con reposición y
A) se observa y registra el color de cada una;
B) se observa y registra el número de cada una
1.2.2) el experimento consiste en elegir dos bolillas al azar, una y luego la otra, sin reposición
A) se observa y registra el color de cada una;
B) se observa y registra el número de cada una
1.3) Indicar las probabilidades (si ya están calculadas) o calcularlas, de los siguientes sucesos de los
diferentes espacios muestrales definidos:
i) la bolilla extraída es verde, considerando que el espacio muestral corresponde a 1.1.A)
ii) la bolilla es la número 1, considerando que el espacio muestral corresponde a 1.1.B)
iii) la bolilla tiene un número par, considerando que el espacio muestral corresponde a 1.1.B)
iv) las dos bolillas son verdes, considerando que los espacios muestrales corresponde a 1.2.1.A) y a
1.2.2.A)
v) la primera bolilla es verde y la segunda es roja, considerando que los espacios muestrales
corresponde a 1.2.1.A) y a 1.2.2.A)
vi) al menos una bolilla es verde, considerando que los espacios muestrales corresponde a 1.2.1.A) y
a 1.2.2.A)
vii) una bolilla es la número 1 y la otra es la número 5, considerando que los espacios muestrales
corresponde a 1.2.1.B) y a 1.2.2.B)
viii) las dos bolillas tienen números mayores o iguales que 2, considerando que los espacios
muestrales corresponde a 1.2.1.B) y a 1.2.2.B)
SOLUCIÓN
1.1) Hallar el espacio muestral correspondiente a los siguientes experimentos aleatorios,
asignando la probabilidad correspondiente a cada uno de sus elementos si el experimento
consiste en elegir una bolilla al azar y
A) se observa y registra el color
Si interesa el color, sólo se distinguen dos situaciones que llamaremos puntos muestrales y que
simbolizamos así:
1.2.1) el experimento consiste en elegir dos bolillas al azar, una y luego la otra con reposición y
A) se observa y registra el color de cada una;
Al extraerse 2 bolillas cada punto muestral estará formado por 2 ocurrencias (que podrán ser igual color o
diferente color) quedando determinado un espacio muestral con 4 puntos muestrales.
S = { VV, VR, RV, RR }
Al realizar extracciones con reposición siempre que se realiza una extracción tendremos 5 elementos
para realizar la selección.
3 3 9 3 2 6 23 6 22 4
p(VV) = * = ; p (VR) = * = ; p(RV) = * = ; p(RR) = * =
5* 5 25 5* 5 25 5* 5 25 5* 5 25
1.2.2) el experimento consiste en elegir dos bolillas al azar, una y luego la otra, sin
reposición
A) se observa y registra el color de cada una;
Al realizar extracciones sin reposición siempre que se realiza la primera extracción tendremos 5
elementos para elegir y, cuando realizamos la segunda extracción, sólo hay 4 elementos pues, el que fue
seleccionado no se vuelve a colocar en la urna (no le damos la oportunidad de volver a salir). La cantidad
de casos favorables puede o no modificarse dependiendo de cuál es la bolilla que quedó afuera.
1.2.2) el experimento consiste en elegir dos bolillas al azar, una y luego la otra, sin reposición
B) se observa y registra el número de cada una
2
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
Al realizar extracciones sin reposición, cuando realizamos la segunda extracción sólo hay 4
elementos y la cantidad de casos favorables puede o no modificarse dependiendo de cuál es la bolilla
que quedó afuera.
El espacio muestral sólo tiene 20 elementos (resultado de 5X4).
S = {(1,2); (1,3); (1,4); (1,5); (2,1); (2,3); (2,4); (2,5); (3,1); (3,2); (3,4); (3,5); (4,1); (4,2); (4,3); (4,5);
(5,1); (5,2); (5,3); (5,4)}
1 1
p(1, 2) = K = p(5, 4) = =
5* 4 20
1.3) Indicar las probabilidades (si ya están calculadas) o calcularlas, de los siguientes sucesos de los
diferentes espacios muestrales definidos.
i) la bolilla extraída es verde, considerando que el espacio muestral corresponde a 1.1.A)
3
p(V) = se obtiene por lectura de lo calculado
5
3
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
6 6 9 21
p ( H ) = p ( VR) + p (RV ) + p ( VV ) = + + = o por sucesos complementarios
25 25 25 25
4 21
p( H ) = 1 − p( H ) = 1 − p (RR) = 1 − =
25 25
G ={(1,1); (1,2); (1,3); (1,4); (1,5); (2,1); (3,1); (4,1); (5,1)} por lo que
1 1 9
p(G) = p(1,1) + p (1, 2) + K + p (5,1) = +L + = y por lo tanto
25 25 25
9 16
p (G) = 1 − p (G) = 1 − =
25 25
En forma similar considerando el espacio muestral de 1.2.2.B)
G ={(2,3); (2;4); (2,5); (3,2); (3,4); (3,5); (4,2); (4,3); (4,5); (5,2); (5,3); (5,4)}
4
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
1 1 12
• p (G) = p (2,3) + p (2, 4) + K + p (5, 4) = +L + =
20 20 20
1 12
• p (G) = 12 * p (2,3) = 12* =
20 20
1 1 8
• p(G) = p(1, 2) + p(1,3) + K + p(5,1) = +L + = y por lo tanto
20 20 20
12 8
p(G) = 1 − p(G) = 1 − =
20 20
EJERCICIO 2) En una jaula conviven, en igual proporción, dos especies de jilguero, A y B. De la especie
A, el 22% de los ejemplares está parasitado por un protozoo intestinal, mientras que de la especie B, el 35%
de los ejemplares está parasitado por el mismo organismo. Un investigador necesita un jilguero para una
investigación, con lo cual entra a la jaula y captura uno al azar:
a) ¿Cuál es la probabilidad de que el jilguero capturado esté parasitado?
b) Si el jilguero capturado está parasitado, ¿cuál es la probabilidad de que pertenezca a la especie B?
SOLUCIÓN
Simbolizaremos a los sucesos
A = {el jilguero es de la especie A}
B= {el jilguero es de la especie B}
E= {el jilguero está parasitado}
“De la especie A, el 22% de los ejemplares está parasitado por un protozoo intestinal”. Al saber que son de la
especie A se simboliza p(E/A) = 0,22
“... mientras que de la especie B, el 35% de los ejemplares está parasitado por el mismo organismo”.
En forma similar, dado que se sabe que son de la especie B, se simboliza p(E/B) = 0,35
Nota: si bien es conveniente que el símbolo seleccionado para cada suceso ayude a su interpretación (como
el caso de A y B) no se debe usar la letra P con más de una finalidad, por lo cual la reservamos para
probabilidad y para “parasitado” se utilizó el símbolo E (de enfermo).
a) Para la definición del suceso “sea parasitado”, debemos considerar a todos los parasitados, es decir, los
que están parasitados y son de la especie A y a los que están parasitados y son de la especie B, como
aparece en la fórmula:
[
p (E ) = p (E I A )U (E I B ) ]
Como son dos sucesos mutuamente excluyentes (si un jilguero es parasitado de la especie A ese jilguero no
es parasitado de la especie B) la probabilidad de parasitado (p(E)) se calcula como la suma de las
probabilidades de los dos sucesos que intervienen en la unión.
p (E ) = p [(E I A )U (E I B )] = p (E I A ) + p (E I B )
Cada uno de los términos es la probabilidad de una intersección de sucesos no independientes por lo tanto
se calcula
p (E) = p [(E I A )U (E IB )] = p (E I A ) + p (E IB ) = p ( A ) . p (E/A ) + p (B ) . p (E/B )
b) “Si el jilguero capturado está parasitado ... indica que “parasitado” es algo que ocurrió por lo tanto lo
p ( B/E )
solicitado se simboliza
5
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
Y se resuelve p (E I B ) 0,175
p (B/E ) = = = 0, 614
p(E) 0,285
EJERCICIO 3) Dos campos con equinos en pastoreo clasificados según su pelaje presentan la siguiente
distribución:
campo 1 campo 2
Zaino 9 6
Bayo 11 6
Rosillo 5 13
c) Como puede darse que el animal sea Zaino y también del campo 1 los dos sucesos Z y C1 no son
mutuamente excluyentes lo que lleva a la siguiente expresión y correspondiente cálculo
15 25 9 31
p ( Z U C1) = p ( Z ) + p ( C1) − p ( Z I C1) = + − = = 0, 62
50 50 50 50
6
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
d) Lo que se sabe (equivalente a decir que está dado) es que “...es del campo 1” y lo aleatorio es que “...sea
rosillo”, por lo tanto p R ( C1) = 255 = 15 = 0, 20 (por lectura directa de tabla), tomando en cuenta que la
3) Al no indicar el orden en que deben ocurrir los sucesos, el planteo tiene dos formas de presentarse
17 15
p (BZ ) + p ( ZB ) ó 2* p (BZ ) = 2* * = 0, 2040
50 50
4) Como no aclara orden puedo plantear un caso y multiplicar por las permutaciones, es decir, por la cantidad
de cambios de lugar diferentes que se pueden dar. En este caso debo multiplicar por 2 debido a que sólo se
pueden dar en dos órdenes: primero BC1 y luego ZC2, o primero ZC2 y luego BC1.
11 6
p (BC1 IZC2 ) = 2* * = 0, 0528
50 50
3.2.2) Sin reposición
En este caso debemos recordar que:
- para calcular la probabilidad del primer elemento, se razona de la misma manera que lo que se hizo
con reposición.
- en el cálculo de la probabilidad del segundo elemento que se selecciona, y en los sucesivos, el
denominador (cantidad de elementos que pueden ser seleccionados) siempre van disminuyendo.
1) En este caso cuando se selecciona el segundo elemento y el primero no se repuso vamos a tener
también un caso favorable menos
17 16
p (BB ) = * = 0,1110
50 49
17 15 255
2) p (BZ ) = * = = 0,1041
50 49 2450
17 15
3) p (BZ ) + p ( ZB ) = 2* p (BZ) = 2* * = 0, 2082
50 49
11 6
4) p (BC1 I ZC2 ) = 2* * = 0, 0539
50 49
EJERCICIO 4) Queremos evaluar la calidad del análisis clínico en la detección de cáncer de mama. Para
ello se consideran los 2641 casos de consulta en un servicio de ginecología y patología mamaria de Capi-
tal Federal.
Los resultados registrados se han tabulado a continuación:
7
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
SOLUCIÓN
Para cada medida de calidad del análisis clínico se aplican las siguientes fórmulas:
Sensibilidad = P(+/E)= VP/(VP+FN)
VPN = P( E /-)=VN/(VN+FN)
EJERCICIO 5) Un test de diagnóstico tiene una probabilidad 0,9 de detectar la presencia de Escherichia
coli, en caso de haberla (sensibilidad del test). Si no está presente, detecta su ausencia con una probabi-
lidad de 0,8 (especificidad del test). La probabilidad de que una muestra de agua contenga Escherichia
coli es 0,20 (prevalencia).
SOLUCIÓN
Consideremos una tabla similar a la del ejemplo anterior:
Bacteria Escherichia Coli
Presente Ausente
Resultado del test Positivo VP FP PP
diagnóstico Negativo FN VN PN
0,20 0,80 1,00
P(+/presente)= 0,9
P(-/ausente)=0,8
8
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
2- Suponiendo que el test dio un resultado positivo, ¿cuál es la probabilidad de que realmente la muestra
de agua contenga E. coli? (Valor predictivo positivo del test)
3- Por otro lado, si el test da un resultado negativo, ¿cuál es la probabilidad de que realmente el agua
está libre de bacterias? (Valor predictivo negativo del test)
4- Calcular el coeficiente Falso positivo = P(test positivo cuando la bacteria está ausente)
5- Calcular el coeficiente Falso negativo = P(test negativo cuando la bacteria sí está presente)
PROBLEMAS PROPUESTOS
EJERCICIO 1) Un grupo de 60 perros fue clasificado como indica el cuadro:
Cachorro Adulto
Negro 6 9
Marrón 12 23
Blanco 2 8
Calcular:
a) la probabilidad de seleccionar:
a.1) un perro negro del grupo de cachorros;
a.2) un cachorro negro.
b) si se seleccionan dos perros, ¿cuál es la probabilidad de que:
b.1) uno sea un cachorro marrón y el otro un adulto negro?
b.2) el primero sea adulto blanco y el segundo un perro marrón?
b.1) sean, el primero sospechoso y vaquillona y el segundo vaca de tercera parición y negativo?
b.2) sean uno negativo y otro sospechoso?
b.3) el segundo sea negativo sabiendo que el primero es una vaca negativa de tercera parición?
EJERCICIO 3) Un test detecta un cierto tipo de bacteria T con una probabilidad 0,90 en caso de haberla. Si
no la hay, detecta la ausencia, con probabilidad 0,80. Sabiendo que la probabilidad de que una muestra de
agua contenga la bacteria de tipo T es 0,20, calcular la probabilidad de que:
a) realmente haya presencia de bacteria cuando el test haya dado positivo.
b) realmente haya presencia de bacteria cuando el test haya dado negativo.
c) haya bacteria y además el test dé positivo.
d) o haya bacteria o el test dé positivo.
EJERCICIO 4) La esferocitosis es un tipo particular de anemia que se encuentra en 1 cada 2000 pacientes
con anemia. Se conocen dos métodos de detección: CHCM (concentración de hemoglobina corpuscular
media) mayor o igual a 34,5 y ADE (amplitud de distribución eritrocitaria) mayor o igual a 14,5. El test basado
en la CHCM tiene una sensibilidad de 86% y una especificidad de 90%, mientras que en el test basado en la
ADE la sensibilidad es de 94% y la especificidad de 88%.
a) ¿Cuál es la probabilidad de que una persona con anemia cuyo CHCM es mayor o igual a 34,5 tenga
esferocitosis?
b) ¿Cuál es la probabilidad de que una persona con anemia cuyo ADE es mayor o igual a 14,5 no tenga
esferocitosis?
EJERCICIO 5) Se sabe que uno de cada mil individuos contraen cierta enfermedad en una población de
estudio. Para detectar esta enfermedad se usa un test que da resultado positivo en el 99% de los casos de
personas enfermas, en tanto que da positivo sólo en el 2% de los casos de las personas sanas.
a.- Si tomamos un individuo al azar, le realizamos el test y da positivo, ¿cuál es la probabilidad de que haya
contraído la enfermedad?
b.- Si ha dado negativo el test, ¿cuál es la probabilidad de que la persona esté sana?
Sensibilidad:
Especificidad:
Valor predictivo positivo:
Valor predictivo negativo:
10
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
CUESTIONARIO
1) En un diario comentan que los accidentes automovilísticos en las rutas son más probables actualmente
que hace diez años. El diario de la competencia informa que este año la probabilidad de que suceda un
accidente automovilístico para las vacaciones de invierno es de 1,5; por lo que aconseja prudencia.
Opine sobre lo publicado en este último. Justifique su opinión.
2) Dados dos sucesos distintos de vacío A y B, puede ser que:
a) p (A) sea mayor que p (A/B)
b) p (A) sea igual que p (A/B)
c) p (A) sea menor que p (A/B)
Justifique en forma gráfica, analítica o con ejemplos cada una de las respuestas.
7) Dados dos sucesos A y B no vacíos incluidos en un espacio muestral S, son ........................ cuando
la ocurrencia de uno no impide la ......................................... del otro en ..................... repetición/nes del
experimento.
11
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
VARIABLE ALEATORIA
DISTRIBUCIONES EN PROBABILIDAD
* OBJETIVOS ESPECÍFICOS
Comprender los conceptos de variable aleatoria, funciones de probabilidad y de distribución acumulada.
Aplicar estos conceptos a la interpretación del comportamiento de fenómenos biológicos y conocer
algunas distribuciones de probabilidad que los describen.
Analizar distintos casos y calcular valores medios y de dispersión.
Calcular las probabilidades de ocurrencia de resultados experimentales.
* CONTENIDOS TEMÁTICOS
Variable aleatoria: discreta y continua.
Distribución de probabilidad, función de cuantía, densidad y distribución acumulada. Distribuciones de
probabilidad, Esperanza y varianza. Propiedades de la esperanza y la varianza. Percentil. Distribuciones
especiales: Bernoulli, Binomial, Normal, Normal estandarizada, t de Student y Ji-Cuadrado.
* GLOSARIO
Variable aleatoria. Funciones de probabilidad: función de cuantía, función de densidad, función de
distribución acumulada. Percentiles. Esperanza matemática. Varianza.
Distribuciones de probabilidad discretas y continuas. Distribuciones particulares: Binomial, Normal, t de
Student y Ji-Cuadrado.
PROBLEMAS RESUELTOS
EJERCICIO 1) Si X es una variable aleatoria discreta tal que:
xi 0 1 2 3 4
p(xi) 0,1 0,1 0,35 0,25 .……
a) Completar el valor faltante; b) Calcular la función de distribución acumulada; c) Determinar P(X ≥ 2);
d) Graficar la función de cuantía y la función de distribución acumulada; e) Hallar E(X); f) Hallar E(X+2);
g) Hallar E(2X)
a) Para resolver este punto debemos recordar una de las condiciones para que una función sea una función
de probabilidad puntual o función de cuantía: la suma de las probabilidades puntuales es igual a uno,
simbólicamente:
n
∑ p( x ) = 1 .
i =0
i
4
En nuestro caso ∑ p( x ) = 1 , es decir: p(0) + p(1) + p(2) + p(3) + p(4) = 1 ;
xi = 0
i
reemplazando por los valores de tabla nos queda: 0,1+ 0,1+ 0,35 + 0,25 + p(4) = 1, despejando obtenemos:
p(4)=1 - 0,1 - 0,1 - 0,35 - 0,25.
Nota:
Nota observar que el n de la sumatoria, puede ser infinito.
12
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
xi 0 1 2 3 4
p(xi) 0,1 0,1 0,35 0,25 0,2
F(xi) 0,1 0,2 0,55 0,80 1,0
c) Nos están preguntando la probabilidad de que la variable tome valores mayores o iguales a dos. Este ítem
se puede resolver de dos formas
1) Utilizando la función de cuantía y sumando cada probabilidad puntual
P ( X ≥ 2) = p ( X = 2) + p ( X = 3) + p ( X = 4) = 0,35 + 0, 25 + 0, 2 = 0,8
2) Utilizando la función de distribución y aplicando las propiedades de que la suma de todas las
probabilidades es uno y de sucesos mutuamente excluyentes:
P ( X ≥ 2 ) = 1- P ( X < 2 ) = 1- P ( X ≤ 1) = 1- 0,2 = 0,8
Por lo tanto P ( X ≥ 2) = 0,8
Nota:
Nota observar que en el caso en que la variable pueda tomar muchos valores, la primera forma de
resolución es poco práctica, ya que podría ser una suma con muchos términos; en cambio la segunda forma
siempre va a ser una operación de, a lo sumo, dos términos.
d) El gráfico de la función de cuantía es un gráfico de bastones que muestra las probabilidades puntuales de
cada valor de la variable. En el eje de las abscisas se ubican los valores de la variable y en el eje de las
ordenadas se ubican los valores de probabilidad puntual.
El gráfico de la función de distribución acumulada es un gráfico de escalones que muestra cuánto
acumula cada valor de la variable, antes del primer valor de la variable la función vale cero ya que no
acumula probabilidad y luego del último valor de la variable la función se mantiene constante en uno ya que
no hay más valores de variable que aporten probabilidad. En el eje de las abscisas se ubican los valores de
la variable y en el eje de las ordenadas los valores de probabilidad acumulada.
e) Para calcular la esperanza de una variable aleatoria discreta se utiliza la siguiente fórmula
n
E ( X ) = ∑ xi p ( xi )
i =o
4
En nuestro caso E ( X ) = ∑ xi p ( xi ) = 0 ∗ 0,1 + 1 ∗ 0,1 + 2 ∗ 0,35 + 3 ∗ 0,25 + 4 ∗ 0,2 = 2,35
i=0
Por lo tanto E(X)=2,35
13
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
f) Para calcular la esperanza que nos están pidiendo hay que utilizar la propiedad que establece que la
esperanza de una variable más una constante es la esperanza de la variable más la constante:
E(X+a)=E(X) + a. En nuestro caso la constante es 2, E(X+2) = E(X) + 2
g) Para calcular la esperanza hay que utilizar la propiedad que establece que la esperanza de una
variable por una constante es la esperanza de la variable por la constante: E(aX) = aE(X). En nuestro
caso la constante es 2, E(2X) = 2 E(X),
1 2 1
EJERCICIO 2) Dada la función: f (x) =
x +
8 3
a) Verificar que f(x) es función de probabilidad en el intervalo [0;2] y graficar.
b) Hallar la función de distribución acumulada.
c) Calcular E(X)
d) Calcular P(0,5 < X ≤ 1,5)
a) Para verificar que f(x) es una función de probabilidad hay que verificar las dos condiciones:
1) f ( x) ≥ 0 ∀ x ∈ ( −∞; ∞ )
∞
2) ∫ f ( x) dx = 1
−∞
f(x)
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
Desde menos infinito hasta 0 la función vale cero, desde 0 hasta 2 la función es mayor o igual que
cero y desde 2 hasta más infinito la función vale cero. Por lo tanto la primera condición se verifica.
La segunda condición se verifica calculando la integral, es decir verificando que el área bajo la curva es uno.
∞ 0 2 ∞ 0 2 ∞
1 2 1
∫ f (x )dx = ∫ f ( x)dx + ∫ f ( x)dx + ∫ f ( x)dx = ∫ 0 dx + ∫ 8 x + 3 dx + ∫ 0 dx =
−∞ −∞ 0 2 −∞ 0 2
2 2
1 x 3 1 x3 x 2 3 2 0 3 0 8 2 1 2
= 0 + . + x + 0 = + = + − + = + − 0 = + = 1
8 3 3 0 24 3 0 24 3 21 3 24 3 3 3
14
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
Por lo tanto se verifican las dos condiciones es decir que f(x) es una función de probabilidad.
0 para x < 0
1
1
FX ( x ) = x 3 + x para 0 ≤ x ≤ 2
Por lo tanto la función de distribución es:
24 3
1 para x > 2
c) Para calcular la esperanza de una variable aleatoria continua se utiliza la siguiente fórmula:
∞
E( X ) = ∫ x f ( x)
−∞
dx
2
En nuestro caso:
2 2
1 1
2
1 1 1 x4 1 x2
E ( X ) = ∫ x f ( x ) dx = ∫ x x 2 + dx = ∫ x3 + x dx = + =
0
0
8 3 0
8 3 8 4 3 2 0
2
1 1 24 22 16 4 7
= x4 + x2 = + = + = = 1,17
32 6 0 32 6 32 6 6
d) Nos están preguntando la probabilidad de que la variable tome valores entre 0,5 y 1,5.
Para calcular esta probabilidad utilizaremos la función de distribución acumulada. Primero calculamos la
probabilidad de que la variable tome valores menores que 1,5 (reemplazando este valor en la función de
distribución acumulada) y a este valor le restamos la probabilidad de que la variable tome valores menores
que 0,5 (reemplazando este valor en la función de distribución acumulada). Recordemos que, como la
variable es continua, la probabilidad en un punto es igual a cero, por lo tanto:
P ( X < 1,5) = P ( X ≤ 1, 5) = F (1,5) , y lo mismo para 0,5.
Por lo que se puede deducir que no importa si los extremos están o no incluidos, cálculo de probabilidad se
hace de la misma manera.
Nos queda:
15
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
a) Para verificar que es función de densidad, o función de probabilidad debemos probar que la función
cumple con dos propiedades (como en el ejercicio anterior).
Estas son:
1) f(x) ≥ 0 en todo su recorrido
+∞
2)
∫ f(x) dx = 1
−∞
La primera propiedad la verificamos directamente en el gráfico de la función y observamos que el
mismo aparece sobre el eje x (de abscisas), que se corresponde con el eje positivo de ordenadas, en
este caso f(x).
Al observar el gráfico vemos que se cumple la primera propiedad.
f(x) 2.0
La segunda propiedad la verificamos
realizando un cálculo sencillo a partir del
gráfico para evitar calcular integrales. 1.5
Debemos observar que la segunda
propiedad corresponde a considerar el
área bajo la curva que queda delimitada 1.0
por el intervalo de definición o dominio.
0.5
X 0 1 2
En este caso bajo la curva reconocemos una figura geométrica, el triángulo, por lo que debemos
calcular el área del mismo, su base es de 1 unidad y su altura es de 2 unidades, por lo tanto:
b∗h 1∗2
área del triángulo = = = 1
2 2
Como el área bajo la curva de la función es uno se verifica la segunda condición
Por lo tanto se verifican las dos condiciones, entonces f(x) es una función de probabilidad o función
de densidad.
b) Nos están preguntando la probabilidad de que la variable tome valores menores a ½, para esto
utilizaremos la expresión de la función de distribución acumulada, que es una función partida, es decir
que hay que prestar especial atención al valor de la variable ya que este nos va a indicar qué parte de la
función utilizar.
En este caso el valor es ½, este valor está entre 0 y 1, por lo tanto utilizamos la parte central de la
2
función, es decir F(x) = x
2
Por lo tanto F(1/2) = P(X < 1/2) = (1/2) = 0,25
c) Nos están preguntando la probabilidad de que la variable tome valores menores o iguales a 2. En este
caso el valor de la variable es 2, mayor que 1, por lo tanto utilizaremos la última parte de la función, es
decir F(x)=1
Nota: observar que el caso continuo es indistinto utilizar los símbolos > o ≥ y < o ≤, ya que la probabilidad
puntual de una variable aleatoria continua es siempre cero. Es decir que:
P(X≤a) = p(X<a) + p(X=a) = p(x<a) + 0 = p(x<a), por lo tanto P(X≤a) = P(x<a)
16
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
d) Nos están preguntando la probabilidad de que la variable tome valores mayores o iguales a ½, a
diferencia de los dos puntos anteriores, no podemos utilizar directamente la función de distribución ya
que esta sirve solamente para probabilidades acumuladas hasta el valor de la variable y, en este caso, es
una probabilidad acumulada a partir de dicho valor de la variable. Por lo tanto tendremos que hacer un
paso más que consiste en escribir la expresión P(X ≥ 1/2) como una probabilidad que acumula por
menor. Sabemos que la probabilidad total es uno por lo tanto: P(X ≥ 1/2)= 1 - P(X < 1/2).
Ahora estamos en condiciones de utilizar la función de distribución con el valor ½ (esta probabilidad fue
calculada en el punto “b”).
Por lo tanto P(X ≥ 1/2)= 1 - P(X < 1/2) = 1 - (1/2) = 1 - 0,25 = 0,75
2
EJERCICIO 4) De acuerdo a las leyes genéticas la inseminación artificial con semen proveniente de machos
Landrace con hembras Duroc Jersey da hijos con las características paternas en un 60% de los casos y el
resto con las características maternas. Si se tomaron 14 crías de este tipo de apareamiento (provenientes de
distintas madres), ¿cuál es la probabilidad de obtener:
a) hasta 5 crías con características maternas?
b) menos de 6 crías con características paternas?
c) el 50% de las crías con características maternas?
d) Hallar V(3X)
e) Hallar V(X+4).
SOLUCIÓN: La variable en estudio es una variable aleatoria discreta, pero a diferencia de las variables
discretas de los ejercicios anteriores, parecería tener una distribución conocida, la distribución Binomial,
cuyas probabilidades están tabuladas. Con lo cual, antes de calcular probabilidades debemos verificar los
supuestos de dicha distribución.
En principio, es necesario precisar en qué consiste el experimento aleatorio. En este caso sería inseminar
artificialmente una hembra Duroc Jersey con semen de un macho Landrace, y observar si un hijo tiene
características paternas.
Este experimento se repite 14 veces y, de esta manera, queda definida la variable binomial.
X: “N° de hijos de machos Landrace con hembras Duroc Jersey con características paternas, en 14 crías”.
1) El experimento aleatorio tiene dos resultados posibles: éxito y fracaso. Cada cría puede tener
características paternas o maternas (por como fue definida la variable el éxito es que tenga características
paternas; pero se podría haber definido de otra forma).
2) Cada repetición del experimento aleatorio es independiente de las demás. Cada cría es independiente de
las demás.
3) Los resultados del experimento aleatorio son mutuamente excluyentes. Si una cría tiene características
paternas no puede tener características maternas.
4) La probabilidad de éxito se mantiene constante a lo largo de todas las repeticiones. La probabilidad de
características paternas (p=0,6) es la misma a lo largo de los 14 repeticiones.
5) El número de repeticiones es prefijado. Hay 14 crías observadas (n=14).
∼Bi (14;0,6).
Una vez verificadas las condiciones de binomialidad se puede decir que X∼
Como la probabilidad de éxito es 0,6 es conveniente definir una variable aleatoria binomial auxiliar ya que
la tabla no puede usarse con probabilidades de 0,6 porque solo cuenta con probabilidades de 0 a 0,5. Por
esta razón definimos
Y: “N° de hijos de machos Landrace con hembras Duroc Jersey con características maternas, en 14 crías”.
∼Bi (14;0,4).
Es una variable aleatoria con distribución binomial con parámetros p=0,4 y n=14: Y∼
a) Nos están preguntando sobre las características maternas por lo tanto debemos utilizar la variable
aleatoria Y. “Hasta 5 crías con características maternas” quiere decir que la variable aleatoria Y puede tomar
valores menores o iguales que 5. Hay dos formas de resolver este ítem:
1) Por tabla, que da la función de distribución acumulada, entrando con n=14 y p=0,4 y buscando el 5
P(Y ≤ 5) = 0,4859
( )
5 14 y 14− y
2) Por fórmula: P(Y ≤ 5) = ∑ y 0, 4 .0, 6
i=0
Por lo tanto la probabilidad de obtener hasta 5 crías con características maternas es de 0,4859.
17
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
Nota: Por lo general es conveniente utilizar la tabla ya que los cálculos con fórmula son muy
trabajosos
b) Nos están preguntando sobre las características paternas por lo tanto debemos utilizar la variable aleatoria
X, pero vamos a tener que hacer un cambio de variable. “Menos de 6 crías con características paternas”
quiere decir que la variable aleatoria X puede tomar valores menores a 6, es decir menores o iguales a 5.
Para hacer el cambio de variable analicemos que sucede con la otra variable, si la variable X puede tomar
valores menores o iguales a 5 quiere decir que la variable Y puede tomar valores mayores o iguales a 9, ya
que si hay 5 crías con características paternas o menos hay 9 con características maternas o más
(recordemos que el total es 14). Este cambio de variable se puede ver más claramente con un esquema en
donde se ubican los valores de ambas variables:
X 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Y 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0
2) Por fórmula: ( )
P(X = 7) = 14
7 7
x 0, 4 ⋅ 0, 6 = 0,1574
Por lo tanto, la probabilidad de obtener el 50% de las crías con características maternas es 0,1574.
Nota: la fórmula para el cálculo de las probabilidades puntuales no es la misma que la del cálculo de las
probabilidades acumuladas, ya que no tiene la sumatoria.
d) La varianza de toda variable con distribución binomial es: V(X)=np(1-p), por lo tanto en nuestro caso
2
V(X)=14*0,4*(1-0,4)=14*0,4*0,6=3,36. Aplicando la siguiente propiedad V(aX)=a V(X), y reemplazando a por
2
3, la varianza que nos están pidiendo queda: V(3 X)=3 *V(X)
Por lo tanto, V(3X)=9*3,36=30,24
e) Aplicando la siguiente propiedad V(X±a)=V(X) y reemplazando a por 4, la varianza que nos están
pidiendo queda V(X+4) = V(X)
Por lo tanto, V(X+4)= 3,36
EJERCICIO 5) Un tambero está al borde de la quiebra por lo que sus expectativas están puestas en la
producción futura. Las vacas Holando Argentino de su tambo tienen un rendimiento normal con media 450
litros y desvío estándar de 80 litros, por mes. El tambero superaría la situación actual si en el próximo mes
cada vaca produce más de 510 litros en promedio.
18
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
c) Si el tambero produjera en otro país tendría un 30% de probabilidad de no ir a la quiebra, ¿cuántos litros
tendría que producir para no quebrar?
SOLUCIÓN: La variable en estudio es una variable aleatoria continua, a diferencia de los ejercicios
anteriores, es una variable aleatoria con distribución conocida y tabulada. Por la información que nos dan en
el enunciado sabemos que es una variable aleatoria con distribución normal, con media poblacional 450
2 2
litros/mes y varianza poblacional de 6400 litros /mes (ya que su desvío estándar es de 80 litros/mes), por lo
tanto podemos decir que:
Recordemos que sólo contamos con la tabla para la distribución normal estándar por lo tanto tendremos
que estandarizar la variable con la siguiente fórmula:
X −µ X − 450 y sabemos que Z tiene una distribución normal estándar, es decir una distribución
Z= =
σ 80
normal con media poblacional 0 y varianza poblacional 1, simbólicamente: Z∼N(0,1)
a) El tambero llega a la quiebra si produce a lo sumo 510 litros/mes por animal, por lo tanto no llega a la
quiebra si produce más de 510 litros/mes, es decir que nos están preguntando: ¿cuál es la probabilidad de
que la variable tome valores mayores que 510?, simbólicamente se escribe: P(X > 510) (tendremos que
utilizar la propiedad de que la probabilidad total es uno, ya que todas las tablas dan probabilidades para
valores menores que un cierto valor, ya que son tablas de funciones de distribución acumulada).
X − µ 510 − 450
P( X > 510) = P > = P( Z > 0,75) = 1 − P(Z ≤ 0, 75) = 1 − 0,77337 = 0, 22663
σ 80
b) El tambero llega a la quiebra si produce a lo sumo 510 litros/mes y pierde su patrimonio personal si
produce menos de 320 litros/mes, por lo tanto no pierde su patrimonio personal si produce más de 320
litros/mes. Es decir que nos están preguntando: ¿cuál es la probabilidad de que la variable tome valores
entre 320 y 510? Simbólicamente se escribe: P (320 ≤ X ≤ 510)
320 − µ 510 − µ 320 − 450 510 − 450
P (320 ≤ X ≤ 510) = P ≤Z ≤ = P ≤Z≤ =
σ σ 80 80
= P (−1, 63 ≤ Z ≤ 0, 75) = P ( Z ≤ 0, 75) − P ( Z ≤ −1, 63) = 0, 77337 − 0, 05155 = 0, 72182
Por lo tanto, la probabilidad de que el tambero llegue a la quiebra sin perder su patrimonio
personal es de 0,72182.
c) Si el tambero, en otro país, tiene una probabilidad de 0,3 de no irse a la quiebra, debemos buscar el
valor de la variable que nos determina esta probabilidad, es decir buscamos el valor de “a” que resuelve:
P(X>a)=0,3, pero debemos estandarizar, es decir que buscamos “b” que resuelva: P(Z>b)=0,30.
19
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
EJERCICIO 6) Sea X una variable aleatoria con distribución t-Student, con 16 grados de libertad
a) ¿Cuál es la probabilidad de que X ≤ 2,12?
b) ¿Cuál es la probabilidad de que X > 2,921?
c) ¿Cuál es la probabilidad de que X < -2,583?
d) ¿Cual es el valor de “a” que cumple con la siguiente restricción: P(X≤a)=0,90?
e) ¿Cuál es el valor de “a” que cumple con la siguiente restricción: P(X<a)=0,05?
SOLUCIÓN: La variable en estudio es una variable aleatoria continua con distribución t-Student con 16
grados de libertad por lo tanto podemos escribir: X∼t16. Vamos a utilizar la tabla de la distribución t, para
entrar en tabla necesitamos los grados de libertad, que en nuestro caso son 16, por lo tanto solo
utilizaremos la fila correspondiente a 16 para resolver los diferentes ítem del ejercicio.
Nota: si no está exactamente el valor de variable que buscamos se utiliza el valor más próximo.
b) Como nos están pidiendo la probabilidad de que la variable tome un valor mayor que 2,921 tendremos
que utilizar la propiedad de la suma de las probabilidades totales, ya que la tabla sólo contiene
probabilidades de valores menores que un valor de la variable.
Entonces P(X > 2,921) =1-P(X ≤ 2,921). Para encontrar P(X ≤ 2,921) hacemos lo mismo que en el
punto “a” y obtenemos que P(X ≤ 2,921) = 0,995. Con lo cual P(X>2,921)=1-0,995=0,005
c) La tabla de la distribución t sólo cuenta con los valores positivos de la variable, pero como es una
distribución simétrica utilizamos estos valores para encontrar probabilidades de los valores negativos. Por
ser simétrica podemos escribir P(X < -2,583) = P(X > 2,583) y seguir resolviendo como en el punto “b”,
con lo cual P(X < -2,583) = P(X > 2,583) = 1-P(X < 2,583)=1- 0,99 = 0,01
Nota: la simetría nos asegura que el área que queda a la izquierda del valor negativo de la variable es la
misma la que queda a la derecha del valor positivo de la variable.
d) Nos están pidiendo un valor de variable y nos están dando la probabilidad de que los valores de t sean
menores de ese valor de variable (0,90), por lo tanto entramos por el encabezado de columna con este
valor, lo cruzamos con la fila de los 16 grados de libertad y así queda determinado el valor que estamos
buscando: 1,337.
Simbólicamente: P(X<a) = 0,90 ⇒ a = t16,0.90 = 1,337
Por lo tanto, a =1,337.
20
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
e) A diferencia del punto anterior, no podemos entrar directamente a tabla, por que la tabla cuenta solamente
con valores de probabilidad desde 0,6 hasta 0,9995. Por lo tanto, tendremos que utilizar nuevamente la
propiedad de simetría de la distribución.
Por simetría: P ( X < a ) = 0, 05 ⇒ P ( X > − a ) = 0, 05
Por suma de las probabilidades totales: P ( X > − a ) = 0,05 ⇒ 1 − P ( X < −a ) = 0,05
Despejando: P ( X < − a ) = 1 − 0,05 ⇒ P ( X < − a ) = 0,95 .
Ahora podemos buscar el valor en la tabla, cruzando la fila de los 16 grados de libertad con el valor de
probabilidad 0,95, nos da que el valor de la variable es 1,746, es decir que – a =1,746, con lo cual a =-1,746.
Simbólicamente: P(X< a ) = 0,05 ⇒ a = t16,0,05= - t16,0,95 = -1,746
Por lo tanto, a =-1,746.
EJERCICIO 7) Sea Y una variable aleatoria con distribución Ji-cuadrado, con 22 grados de libertad
a) ¿Cuál es la probabilidad de que Y ≤ 26,04?
b) ¿Cuál es la probabilidad de que Y > 33,92?
c) ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y<b) = 0,25?
d) ¿Cuál es el valor de “b” que cumple con la siguiente restricción P(Y>b) = 0,1?
SOLUCIÓN: La variable en estudio es una variable aleatoria continua con distribución Ji-Cuadrado con
22 grados de libertad por lo tanto podemos escribir: Y∼ χ 22 . Vamos a utilizar la tabla (de distribución
2
acumulada) de la distribución Ji. Para entrar en tabla necesitamos los grados de libertad, que en nuestro
caso son 22, por lo tanto solo utilizaremos la fila correspondiente a 22 para resolver los diferentes ítem
del ejercicio. La tabla de Ji es parecida a la de la t ya que cuenta con los valores de la variable en la parte
central, los grados de libertad en la primera columna y los valores de probabilidad en la primera fila.
a) Para obtener el valor que nos están pidiendo solo tenemos que buscar en la fila de los 22 grados de
libertad el valor de la variable 26,04, y leer en la fila de encabezados el valor de probabilidad
correspondiente.
Por lo tanto, P(Y ≤ 26,04) = 0,75.
Nota: si no está exactamente el valor de variable que buscamos se utiliza el valor más próximo.
b) Una vez más tendremos que utilizar la propiedad de la suma de las probabilidades totales ya que la
tabla sólo da probabilidad para valores menores que un determinado valor de variable y nos están
pidiendo una probabilidades para valores mayores que un determinado valor de variable. Con lo cual
P(Y> 33,92) = 1-P(Y ≤ 33,92), solo falta buscar el valor de probabilidad en tabla como en el punto “ a ”.
P(Y>33,92) =1-P(Y ≤ 33,92)=1-0,95 = 0,05
Por lo tanto, P(Y > 33,92) = 0,05.
c) Entramos directamente en tabla con los grados de libertad 22 y el valor de probabilidad 0,25, donde se
cruzan la fila de los grados de libertad y la columna del valor de probabilidad queda determinado el valor
pedido: b = 17,24
Simbólicamente: p(Y < b) = 0,25 ⇒ b = χ 22
2
, 0, 25 = 17,24
Por lo tanto, b=17,24.
d) Una vez más tendremos que utilizar la propiedad de la suma de las probabilidades totales
P (Y > b) = 0,1 ⇒ P (Y < b) = 1 − 0.1 ⇒ P (Y < b) = 0,9 . Ahora hacemos lo mismo que en el punto “c”,
pero con un valor de probabilidad de 0,9 y obtenemos que b = 30,81.
Simbólicamente: p(Y < b) = 0,1 ⇒ b = χ 22
2
, 0 , 9 = 30,81
21
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
EJERCICIO 8) Un laboratorio afirma que una droga causa de efectos secundarios en una proporción de
5 de cada 100 pacientes. Para contrastar esta afirmación, otro laboratorio elige al azar a 2 pacientes a los
que aplica la droga. ¿Cuál es la probabilidad de los siguientes sucesos?
Resolver los siguientes ítems de dos maneras diferentes, utilizando la distribución correspondiente a la
variable de interés, y también aplicando los conceptos aprendidos en la unidad I.
a) Ningún paciente tenga efectos secundarios.
b) Uno tenga efectos secundarios y el otro no
c) Ambos tengan efecto secundario
SOLUCIÓN
Si aplicamos los conceptos de la unidad 1, debemos considerar los sucesos:
E: que el paciente tenga efectos colaterales provocados por la droga.
NE: que el paciente tenga efectos colaterales provocados por la droga.
El espacio muestral correspondiente al experimento en el que se extraen 2 individuos, con reposición,
formando el siguiente espacio muestral:
S = {(E, E); (E, NE); (NE, E); (NE, NE)}
EJERCICIO 9) En una jaula hay 3 cobayos negros y 5 blancos. Se extraen simultáneamente dos coba-
yos, se pide:
1. Hallar el espacio muestral si se observa y registra el color.
2. Calcular la probabilidad de que:
2.a- ambos sean negros.
2.b- ambos sean blancos.
2.c- uno sea negro y el otro blanco.
3. Si interesa estudiar la variable X: “número de cobayos negros seleccionados”, se pide:
22
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
3.a- A partir de los valores que toma la variable X, ordenarlos en una tabla, y calcular la función de
cuantía y la función de distribución.
3.b- Graficar ambas funciones.
3.c- Calcular esperanza y varianza.
3.d- Calcular la probabilidad de que a lo sumo dos cobayos sean negros.
SOLUCIÓN
1. Hallar el espacio muestral correspondiente a observar y registrar el color, y a la extracción de dos
cobayos.
S = { NN , NB, BN , BB}
2. Calcular la probabilidad de que:
2.a- ambos sean negros.
3 2 3
P ( NN ) = ∗ = = 0,107
8 7 28
2.b- ambos sean blancos.
5 4 5
P ( BB ) = ∗ = = 0,357
8 7 14
2.c- uno sea negro y el otro blanco.
3 5 15
P ( N ∩ B ) ∪ ( B ∩ N ) = 2 ∗ P ( N ∩ B ) = ∗ ∗ 2 = = 0, 536
8 7 28
3. Si interesa estudiar la variable X: “número de cobayos negros seleccionados”, se pide:
3.a- A partir de los valores que toma la variable X, ordenarlos en una tabla, y calcular la función de
cuantía y la función de distribución.
X p(X) F(X)
0 5/14 5/14
1 15/28 25/28
2 3/28 1
3.b- Graficar ambas funciones.
p(xi) 0,60
0,50
0,40
0,30
0,20
0,10
0,00
0 1 2
X
23
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
PROBLEMAS PROPUESTOS
EJERCICIO 1) La distribución del número de crías nacidas muertas por parición de un lote de 200 cerdas
Duroc Jersey considerado como población es la siguiente:
xi 0 1 2 3 4 5
p(xi) 0,05 0,20 0,30 0,20 0,15 0,10
0 para x < -1
con función de distribución acumulada:
F( X ) = -x2 +1 para -1≤ x ≤ 0
1 para x > 0
Calcular:
a) ¿De qué tipo es la variable en estudio?
b) F(X) es la función de ................................................ y f(x) es la función de ....................................
c) P (-1 ≤ X ≤ -0,5)
d) P (-0,5 ≤ X ≤ -0,1)
e) P (X ≥ -2)
f) P (X ≤ 1)
g) P (X < -0,25)
xi 1 2 3 4 5 6
p(xi) 0,05 0,10 0,25 0,30 0,20 ?
24
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
EJERCICIO 5) 1ra. parte: La distribución del tiempo de respuesta obtenido en la aplicación de prostaglandi-
nas a hembras caninas preñadas entre 35 y 55 días es normal con media 60 horas y con desvío de 15
horas.
a) Definir la variable en estudio
b) Detallar su distribución
c) Si es necesario detallar la forma de estandarización
d) ¿Cuál es la probabilidad de obtener la reacción luego de 50 horas?
e) ¿Cuál es la probabilidad de obtener la reacción antes de 30 horas?
f) ¿Cuál es la probabilidad de obtener la reacción entre 30 y 60 horas?
g) ¿Cuál es la probabilidad de obtener la reacción luego de 90 horas?
h) ¿A partir de qué tiempo la probabilidad de obtener reacción es del 30%?
2da. Parte (se verá en la unidad temática correspondiente): Si se toma una muestra de 16 hembras
preñadas, ¿cuál es la probabilidad de que, en promedio, tengan la reacción:
a) luego de 50 horas?
b) antes de 30 horas?
c) entre 30 y 60 horas?
d) luego de 90 horas?
e) ¿A partir de qué tiempo medio la probabilidad de obtener reacción es del 30%?
25
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
EJERCICIO 8) En un criadero de perros se dedican a las razas labrador y doberman, de pelajes negro y
marrón. Se selecciona una muestra de 20 perros, y se ordenan los datos en la siguiente tabla:
Negro Marrón
Doberman 4 5
Labrador 3 8
EJERCICIO 9) En un pensionado canino se encuentran 20 perros que fueron clasificados por tamaño y
edad:
Cachorro Adulto
Grande 2 1
Mediano 4 6
Pequeño 5 2
1. Calcular la probabilidad de seleccionar un perro:
1.a- mediano del grupo de los adultos.
1.b- mediano y adulto.
2. Si se seleccionan dos perros ¿Cuál es la probabilidad de que:
2.a- uno sea cachorro pequeño y el otro adulto grande.
2.b- el primero sea adulto pequeño y el segundo un perro mediano.
3. Si se sabe que el 40% de los perros del pensionado se contagia de pulgas, y también que la capacidad
es de 20 caniles que constantemente permanecen ocupados:
3.a- Definir la variable en estudio.
3.b- ¿Cuál es la probabilidad de que haya más de 8 perros con pulgas?
3.c- ¿Cuál es la probabilidad de que ninguno se haya contagiado de pulgas?
26
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
CUESTIONARIO
1) Indicar el tipo de variable aleatoria (D: discreta o C: continua) y la unidad experimental, para cada una
de las siguientes variables:
a) X = ”Número de alumnos en una comisión de Elementos de estadística”
b) X = ”Peso del cráneo de un animal”
c) X = ”Cantidad de dinero, en monedas, en un monedero”
d) X =”Producción de leche en un tambo”
3) Dado un grupo de siete perros con ciertas afecciones, se sabe que la probabilidad de que un
tratamiento L sea efectivo es 0,85. Utilizando esta información:
a) defina una variable con distribución Binomial. Especifique dicha distribución.
b) verifique los supuestos teóricos en ESTE CASO.
4) Determinar el intervalo de definición para que la siguiente función sea una función de densidad de
probabilidad.
c)
6) Si una función de densidad es distinta de cero en el intervalo (2 ; 7), ¿puede ser que la P(X=3)=0?
Justificar.
27
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
28
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
ESTADÍSTICA DESCRIPTIVA
OBJETIVOS ESPECIFICOS
Identificar una población o muestra
Definir la o las variables que caracterizan a una distribución
Calcular medidas de posición y de dispersión adecuadas para describir cada distribución.
CONTENIDOS TEMÁTICOS
Población y muestra. Variables cuantitativas continuas y discretas. Variable atributo. Principios y tipos de
muestreo. Distribución de frecuencias discretas y continuas. Gráficos. Medidas de posición y dispersión: me-
dia aritmética, mediana, modo, amplitud, varianza, desvío estándar, coeficiente de variación y distancia inter-
cuartílica. Propiedades de media aritmética y varianza. Esperanza, varianza y caso especial de la distribución
de X .
* GLOSARIO
Estadística. Variable: cuantitativa, cualitativa o atributo. Población. Muestra. Muestreo. Gráficos: barras,
bastones, escalones, histogramas; polígonos de frecuencias, ojiva; Boxplot. Media aritmética, Mediana,
Modo, Varianza, Desvío estándar, Coeficiente de variación, Rango o Amplitud. Variación relativa y abso-
luta.
PROBLEMAS RESUELTOS
EJERCICIO 1) En un estudio sobre la detección de pseudotuberculosis, la Dirección de Bromatología
seleccionó al azar 28 establecimientos, dedicados a la cría y engorde de ovinos, registrando la cantidad
de animales afectados, por establecimiento, al realizar la faena en el frigorífico:
SOLUCIÓN
a) La variable es aquella característica que nos interesa medir, en este caso:
X: cantidad de ovinos atacados de pseudotuberculosis en un establecimiento. V. Cuantitativa Discreta.
En este problema la población en estudio corresponde a los establecimientos dedicados a la cría y
engorde de ovinos; como no se especifica la región en donde están ubicados, solamente con esta descrip-
ción nos alcanza. Entonces, la muestra tomada es de:
n (tamaño de la muestra): 28 establecimientos dedicados a la cría y engorde de ovinos.
b) Tabla de frecuencias: la primera columna contiene los valores de la variable que se registraron en la
muestra, y se simboliza con xi; en la segunda columna se registra cuántas veces se observa cada uno de
los valores de la variable (xi), y corresponde a la frecuencia absoluta simple (fi). En la tercera columna se
registra cuántas veces se observan los valores de la variable menores o iguales a xi, o sea, las frecuen-
cias absolutas acumuladas (Fi). La cuarta columna corresponde al cociente entre fi y n, o sea la frecuen-
cia relativa simple (hi). En la última columna, correspondiente a las frecuencias relativas acumuladas
(Hi), sumamos las frecuencias relativas simples de la misma manera que en la tercera columna, hasta
29
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
acumular el total de la muestra. Por las características de las frecuencias relativas siempre obtendremos
como valor 1, o 100%, o cercanos a ellos, según se expresen en decimales o como porcentajes.
xi fi Fi hi Hi
70 3 3 0,11 0,11
75 4 7 0,14 0,25
77 5 12 0,18 0,43
82 7 19 0,25 0,68
110 5 24 0,18 0,86
118 2 26 0,07 0,93
120 1 27 0,04 0,96
135 1 28 0,04 1,00
TOTAL 28 1,00
La utilidad de la tabla es que el ordenamiento de los datos permite interpretar la información de la mues-
tra. Por ejemplo, tomemos la información de la cuarta fila de datos, en donde x4 = 82:
• f4 = 7, indica que en 7 establecimientos se encontraron 82 ovinos atacados de pseudotuberculosis.
• F4 = 19, se interpreta como que en 19 establecimientos se encontraron a lo sumo 82 ovinos atacados
de pseudotuberculosis (o hasta 82 ovinos atacados de pseudotuberculosis inclusive).
4
NOTA: F4 = ∑f
1
i = f1 + f 2 + f 3 + f 4 = 3 + 4 + 5 + 7 = 19
El gráfico siguiente se denomina de ESCALONES, y sirve para representar frecuencias acumuladas, ya sean
las absolutas o las relativas, pero en este ejercicio sólo necesitamos graficar estas últimas.
30
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
Podemos observar los escalones y relacionarlos con el gráfico de la función de distribución acumulada
F(xi), que ya hemos visto en la unidad anterior (correspondiente a Distribuciones de Probabilidad).
d) Medidas de posición
MEDIA ARITMÉTICA
xi fi xi fi
Para calcular la media aritmética debemos sacar el promedio de
todos los valores de la variable que hemos obtenido en la muestra. En la 70 3 210
fórmula observamos que aparece la expresión Σxifi o sea la sumatoria de los 75 4 300
productos entre cada valor de la variable y su correspondiente frecuencia 77 5 385
absoluta simple. Para facilitar los cálculos podemos agregar una columna a 82 7 574
la tabla de frecuencias en donde realizaremos estos productos, de la si- 110 5 550
guiente forma: 118 2 236
Σxi fi 2510 120 1 120
x= = = 89, 64
n 28 135 1 135
Interpretación: aproximadamente 90ovinos atacados 28 2510
MEDIANA
Para calcular la mediana, primero debemos ordenar los datos de menor a xi Fi
mayor o de mayor a menor. En este ejercicio ya ordenamos los datos al construir
la tabla de frecuencias. Como sabemos, esta medida divide a la muestra en dos 70 3
partes iguales, por lo que en el primer paso debemos encontrar la posición de la 75 7
misma, o sea encontrar cuál es el valor central de la muestra (en caso de que n 77 12
sea un número impar), o cuáles son los valores centrales (en caso de que n sea 82 19
un número par). 110 24
n +1 29
Pos Me = = = 14,5 118 26
2 2 120 27
135 28
Entonces los valores centrales ocupan los lugares 14 y 15.
Como los valores centrales son x(14)=82 y x(15)=82, debemos realizar el promedio entre ellos:
x(14 ) + x(15) 82 + 82
Mex = = = 82 ovinos atacados
2 2
f 4 = 7 ⇒ Mo = 82 ovinos atacados
31
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
MODO
DISTANCIA INTERCUARTÍLICA
Es la medida de dispersión asociada a los cuartiles, se simboliza dC, y en ella observamos la disper-
sión de los valores centrales, la forma de calcularla es: dC = C3 – C1 , e indica el rango o amplitud donde
se encuentra el 50% “central” de las observaciones.
VARIANZA xi fi xi fi xi2fi
En la fórmula observamos que aparece la
expresión xifi, que ya habíamos usado al calcular
70 3 210 14700
2
la media aritmética, y aparece una expresión, ∑xi fi, 75 4 300 22500
la sumatoria de los productos entre el cuadrado de 77 5 385 29645
cada valor de la variable y su correspondiente fre- 82 7 574 47068
cuencia absoluta simple. Para facilitar los cálculos 110 5 550 60500
podemos agregar una columna a la tabla de fre- 118 2 236 27848
cuencias en donde realizaremos estos productos, 120 1 120 14400
de la siguiente forma:
135 1 135 18225
TOTAL 28 2510 234886
1 2 ( Σxi f i ) 1 ( 2510 ) 1
2 2
s =
2
Σxi f i − = 234886 − = ( 234886 − 225003, 57 ) = 366, 02
n − 1
x
n 27 28 27
sx2 = 366,02
Debemos recordar que se expresa en la unidad de la variable pero elevada al cuadrado.
DESVÍO ESTÁNDAR
El desvío estándar es la raíz cuadrada de la varianza. Por lo que lo calculamos de la siguiente forma:
COEFICIENTE DE VARIACIÓN
Es una medida de dispersión relativa en donde se relaciona una medida de dispersión (sx) con
una medida de posición ( x ), y su resultado se expresa en porcentaje. No tiene unidades de medida.
sx 19,13
C.V.x % = .100 = .100 = 21,34 es decir 21,34%
x 89 ,64
e) Si cada observación se disminuye en 10%, la variable inicial X se modifica de la siguiente forma:
z i = xi - 0,10 xi = xi (1 - 0,10) = 0,90 xi
La media aritmética y la varianza también se modifican, en este caso según la propiedad del producto
entre la variable y una constante:
EJERCICIO 2) Los siguientes valores corresponden a la altura, en mm, del complejo QRS de 20 electro-
cardiogramas de galgos de ambos sexos, luego de una competencia:
25,0 29,3 20,0 24,1 22,5 20,5 25,0 24,0 21,0 23,7
17,0 20,5 30,0 20,6 23,2 30,8 27,5 30,3 25,5 33,8
a) ¿Cuál es la variable en estudio y de qué tipo es?
b) Realizar los gráficos correspondientes a los datos ordenados en una tabla de frecuencias.
c) Calcular las medidas de tendencia central y de dispersión, indicando las unidades que correspon-
den a cada caso.
SOLUCIÓN
a) X: altura del complejo QRS en electrocardiogramas de un galgo luego de una competencia, medida en
mm.
n = 20 (tamaño de muestra)
b) Tabla de frecuencias:
[ ; ) x'i fi Fi hi Hi
17,0 - 20,4 18,7 2 2 0,10 0,10
20,4 - 23,8 22,1 7 9 0,35 0,45
23,8 - 27,2 25,5 5 14 0,25 0,70
27,2 - 30,6 28,9 4 18 0,20 0,90
30,6 - 34,0 32,3 2 20 0,10 1,00
TOTAL 20 1,00
33
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
donde: x'i = marca de clase (punto medio del intervalo) fi = frecuencia absoluta simple
Fi = frecuencia absoluta acumulada hi = frecuencia relativa simple
Hi = frecuencia relativa acumulada
Ejercitemos la interpretación de los datos que aparecen en la tabla. Tomemos por ejemplo la infor-
mación del intervalo de clase que aparece en la cuarta fila: [27,2 – 30,6). ¿Cómo interpretamos “[27,2 –
30,6)”? El intervalo es cerrado en 27,2 y abierto en 30,6, por lo que la altura de complejo QRS de los electro-
cardiogramas realizados luego de la competencia a los galgos de la muestra, está comprendida entre 27,2
mm (inclusive) y 30,6 mm (sin incluir).
Como F4 = 18, podemos decir que 18 electrocardiogramas de galgos, luego de una competencia,
tienen una altura de complejo QRS menor a 30,6 mm.
Como h4 = 0,20, decimos que el 20% de los electrocardiogramas de los galgos muestreados, lue-
go de una competencia, tiene una altura de complejo QRS comprendida entre 27,2 mm (inclusive) y 30,6
mm (sin incluir).
f4 = 4, indica que se encontraron 4 galgos, cuyos electrocardiogramas realizados luego de una
competencia muestran una altura del complejo QRS comprendida entre 27,2 mm (inclusive) y 30,6 mm
(sin incluir).
H4 = 0,90, indica que el 90% de los galgos muestreados, luego de la competencia, muestran una
altura en el complejo QRS de hasta 30,6 mm.
0
15,30 18,70 22,10 25,50 28,90 32,30 35,70
Altura
0,40
0,35
0,30
frecuencia relativa
0,25
0,20
0,15
0,10
0,05
0,00
15,30 18,70 22,10 25,50 28,90 32,30 35,70
Altura
Los dos gráficos representan las frecuencias simples (absolutas y relativas), se denominan HISTO-
GRAMAS y también tienen representado un polígono, llamado POLÍGONO DE FRECUENCIAS, que pasa
por los puntos cuyas abscisas son los puntos medios de los intervalos de clase, o las marcas de clase y cu-
yas ordenadas son las frecuencias correspondientes a dicho intervalo. Se cierra el polígono uniendo con las
marcas de clase de dos intervalos ficticios, uno anterior al 1er. intervalo, y otro posterior al último intervalo.
Ambos gráficos representan la densidad de los valores observados de la variable en esta muestra, ya que la
superficie encerrada dentro del histograma es equivalente a la superficie delimitada por el polígono de fre-
cuencias.
La distribución de la variable en esta muestra, presenta una leve asimetría positiva (cola a derecha).
34
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
15 Poligonal u ojiva
10
5 Histograma
0
15,30 18,70 22,10 25,50 28,90 32,30 35,70
Altura
1,00
0,80
frec. rel. acumulada
0,60
0,40
0,20
0,00
15,30 18,70 22,10 25,50 28,90 32,30 35,70
Altura
En este caso, se representan las frecuencias acumuladas, absolutas y relativas. Se denomina HIS-
TOGRAMA (pero para frecuencias acumuladas), y se representa una poligonal, llamada OJIVA, que marca
la acumulación a lo largo del intervalo, uniendo la frecuencia acumulada obtenida en el límite inferior de cada
intervalo con la obtenida en el límite superior del mismo.
c) Medidas de centralidad:
(NOTA Observar que se trata de variables continuas, agrupadas en intervalos, por lo tanto: la media y la va-
rianza se calculan utilizando las marcas de clase.)
MEDIA ARITMETICA
∑ x′i f i 499 ,8
x= = = 24,99 mm
n 20
MEDIANA
n + 1 21
Pos Me = = = 10,5 ⇒ Int Me [23,8 ; 27,2)
2 2
(n + 1 )
-F i -1
M ex = L i + c 2
f i
Donde: c : amplitud del intervalo
Li: límite inferior del intervalo mediana
fi: frecuencia absoluta simple del intervalo mediana
Fi-1: frecuencia absoluta acumulada del intervalo anterior
10,5-9 1,5
Mex = 23,8 + 3,4 = 23,8 + 3,4 = 23,8 + 3,4.0,3 = 23,8 + 1,02 = 24,82 mm
5 5
Es importante diferenciar POSICIÓN DE MEDIANA y cálculo de la MEDIANA en sí. La primera sólo nos
aporta la ubicación del Intervalo Mediana, y la segunda es el valor numérico de la Mediana.
35
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
MODO
Int. Mo ----> [ 20,4 ; 23,8)
∆1
Mo = Li+ c
∆1 + ∆ 2
D o n d e:
∆ 1 = f (M a x) − f (a n t)
∆2 = f (M a x)
− f (p o st)
Li: Límite inferior del intervalo Modal.
c: Amplitud del intervalo Modal.
f(post): Frecuencia absoluta del intervalo posterior al intervalo Modal.
f(ant): Frecuencia absoluta del intervalo anterior al intervalo Modal.
5 5
Mo = 20,4 + 3,4 = 20,4 + 3,4. = 20,4 + 2, 429 = 22,829 mm
5+ 2 7
Volvamos a analizar la distribución de la variable en esta muestra utilizando las medidas de posición:
Me= 24,82 mm, Mo = 22,8295 mm, x = 24,99 mm. Al ser Mo < Me < x , podemos decir que la distribu-
ción tiene ASIMETRÍA POSITIVA.
Medidas de dispersión:
VARIANZA
1 2 ( Σx 'i fi ) 1 ( 499,8 ) 1
2 2
s =
2
Σx 'i f i − = 12784, 02 − = ⋅ 463,372 = 24,388mm 2
n − 1
x
n 19 20 19
DESVÍO ESTÁNDAR
sx = sx2 = 24,388mm = 4,938mm
COEFICIENTE DE VARIACIÓN
sx 4,938
C.V .x % = .100 = .100 = 19, 75%
x 24,99
BOX PLOT
El boxplot o diagrama de caja lo utilizamos para analizar la distribución de la variable en esta muestra.
36
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
36,00
33,50
31,00
28,50
Altura
26,00
23,50
21,00
18,50
16,00
En la caja, la Me se ubica casi en el centro, y el tamaño de los bigotes es distinto, siendo mayor el
bigote superior. En este caso podemos decir que la distribución es levemente ASIMÉTRICA POSITIVA.
En este cuadro presentamos las medidas resumen obtenidas, a partir de los datos de la muestra,
aplicando el programa estadístico InfoStat®.
Estadística descriptiva
Variable n Media D.E. Var(n-1) CV Mín Máx Mediana
Altura 20 24,99 4,93 24,388 19,76 17,00 33,80 24,05
SOLUCIÓN
a)
2
[ ; ) x’i fi Fi hi Hi x’i* fi x’i * fi
10,0 – 10,5 10,25 3 3 3/40 3/40 30,75 315,1875
10,5 – 11,0 10,75 4 7 4/40 7/40 43 462,25
11,0 – 11,5 11,25 14 21 14/40 21/40 157,5 1771,875
11,5 – 12,0 11,75 10 31 10/40 31/40 117,5 1380,625
12,0 – 12,5 12,25 5 36 5/40 36/40 61,25 750,3125
12,5 – 13,0 12,75 3 39 3/40 39/40 38,25 487,6875
13,0 – 13,5 13,25 1 40 1/40 40/40 13,25 175,5625
40 40/40 461,50 5343,5
37
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
b)
16
14
12
frecuencia absoluta
10
0
9,5 10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 14,0
Anchura
n + 1 41
c) MEDIANA: Pos Me = = = 20, 5 ⇒ Int. Mediana : [11, 0 ; 11,5 )
2 2
Pos Me − Fi −1 20,5 − 17
Me = Li + c = 11, 0 + 0, 5 ∗ = 11, 4821 mm
fi 14
MODO: La mayor frecuencia absoluta simple es f4 = 14, por lo que el intervalo modal es [11,0 ; 11,5), por
lo que
∆1 10
Mo = L i + c = 11, 0 + 0,5 ∗ = 11,0 + 0,357 = 11,357 mm
∆1 + ∆ 2 10 + 4
S 0, 6969
COEFICIENTE DE VARIACIÓN: CV = ∗100 = ∗100 ≅ 6, 044%
X 11,53
14,00
12,00
En el boxplot se observa asimetría positiva.
11,00
10,00
38
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
3
e) p (10 < x < 10,5) = = 0, 075
40
3
f) p (10 < x < 10,5) / x < 11,5) = = 0,1428
21
i) p (13 < x < 13, 5) / x < 11,57) = 0/18 = 0
EJERCICIO 4) Se quiere estudiar la eficacia de un nuevo insecticida para plantas de interior. Se selec-
cionan 50 plantas y se cuenta el número de hojas que han sido atacadas por la plaga, después de haber
tratado la planta con el nuevo producto. Los resultados son:
N° de hojas atacadas fi
0 6
1 10
2 12
3 8
4 5
5 4
6 3
8 1
10 1
a) Definir la variable en estudio y clasificarla.
b) ¿Cuál es la población en estudio? ¿Y la muestra observada?
c) Encontrar todas las medidas de tendencia central que correspondan.
d) Encontrar todas las medidas de variabilidad que correspondan.
e) ¿Qué porcentaje de plantas observadas fueron atacadas? ¿Qué porcentaje de plantas observadas
tienen a lo sumo 1 sola hoja atacada? ¿qué porcentaje de plantas observadas tienen más de 5 hojas
atacadas?
f) Complete la tabla encontrando las frecuencias relativas y las frecuencias acumuladas (absolutas y
relativas).
g) Interprete, respecto al problema planteado, los valores de: f3 ; F6 ; h1 ; H4
h) La empresa que comercializa el nuevo insecticida dice que, el número de hojas atacadas por planta
cuando se aplica este insecticida, sigue la siguiente distribución de probabilidad:
N° de hojas atacadas p(x)
0 0,12
1 0,20
2 0,25
3 0,15
4 0,10
5 0,08
6 0,06
8 0,03
10 0,01
Encontrar la esperanza, varianza y desvío estándar de la variable definida. ¿Cuál es la probabilidad de
que una planta que ha sido tratada con el nuevo fertilizante tenga por lo menos 3 hojas atacadas, según
la información de la empresa que comercializa el nuevo fertilizante?
SOLUCIÓN
a) Definir la variable en estudio y clasificarla.
X: número de hojas atacadas por la plaga de una planta tratada con el nuevo insecticida
Variable cuantitativa discreta
39
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
f) Complete la tabla encontrando las frecuencias relativas y las frecuencias acumuladas (absolutas y
relativas).
N° de hojas atacadas fi hi Fi Hi
0 6 0,12 6 0,12
1 10 0,2 16 0,32
2 12 0,24 28 0,56
3 8 0,16 36 0,72
4 5 0,1 41 0,82
5 4 0,08 45 0,9
6 3 0,06 48 0,96
8 1 0,02 49 0,98
10 1 0,02 50 1
40
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
F6=45 de las 50 plantas observadas tratadas con el nuevo insecticida, 45 tienen a lo sumo 5 hojas
atacadas.
h1=0,12 de las 50 plantas observadas tratadas con el nuevo insecticida, la proporción de plantas que
no tienen ninguna hoja atacada por la plaga es 0,12. O también se puede decir que el 12% de las
plantas observadas de la muestra no tienen ninguna hoja atacada por la plaga.
H4=0,72 de las 50 plantas observadas tratadas con el nuevo insecticida, la proporción de plantas
que tienen a lo sumo 3 hojas atacadas es 0,72. También podemos decir que, el 72% de las plantas
observadas de la muestra fueron atacadas a lo sumo en 3 hojas.
h) La empresa que comercializa el nuevo insecticida dice que, el número de hojas atacadas por planta
cuando se aplica este insecticida, sigue la siguiente distribución de probabilidad:
0 0,12
1 0,20
2 0,25
3 0,15
4 0,10
5 0,08
6 0,06
8 0,03
10 0,01
Encontrar la esperanza, varianza y desvío estándar de la variable definida. ¿Cuál es la probabilidad de
que una planta que ha sido tratada con el nuevo fertilizante tenga por lo menos 3 hojas atacadas, según
la información de la empresa que comercializa el nuevo fertilizante?
E ( X 2 ) = 02 *0,12 + 12 *0, 2 + 22 *0, 25 + 32 *0,15 + 42 *0,1 + 52 *0,08 + 62 *0,08 + 82 *0, 03 + 102 *0, 01 =
= 0 + 0, 2 + 1 + 1,35 + 1, 6 + 2 + 2,16 + 1,92 + 1 = 11, 23
PROBLEMAS PROPUESTOS
EJERCICIO 1) Clasificar las siguientes variables en CUALITATIVAS (NOMINALES u ORDINALES) o
CUANTITATIVAS (DISCRETAS o CONTINUAS):
41
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
4 3 5 7 4 2 1 0 6 3 5 6 3
0 3 1 2 1 3 6 0 4 3 2 1 2 6
EJERCICIO 3) Los siguientes datos corresponden a la medición en sangre de GPT (glutámico pirúvico
transaminasa, enzima que demuestra toxicidad hepática) en felinos sometidos a una dosis tóxica mínima
de un nuevo antiparasitario externo:
42
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
EJERCICIO 8) Resolver la 2da. parte del ejercicio 12 de la página 22 (Unidad 2: Variable Aleatoria).
43
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
EJERCICIO 9) En un estudio acerca de las palabras usuales, usted necesita una muestra de las páginas
tomadas de un libro dado. Diseñe brevemente un procedimiento de muestreo que pudiera usar. ¿Qué
haría usted con las páginas que tienen grabados sobre ellas o con aquellas que están llenas sólo par-
cialmente?
EJERCICIO 10) En un estudio sobre parasitismo un grupo de investigadores registra la cantidad de hue-
vos por nido parasitados en 1700 nidos. Los datos se registran en la siguiente tabla:
44
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
CUESTIONARIO
1) Responda “Verdadero” si la proposición siempre es verdadera, y si no cambie las palabras en negrita
por aquellas que siempre hagan verdadera la misma.
i La media aritmética se obtiene ordenando los datos y no es influenciada por valores extremos.
............................................................................................................................................................
ii La varianza es una medida de variación relativa porque permite comparar la dispersión de muestras de
distintas variables. .........................................................................................................
iii La media aritmética de una variable puede ser negativa. ...............................................................
iv El polígono de frecuencias se utiliza para graficar frecuencias absolutas y relativas simples.
............................................................................................................................................................
2) ¿Puede ser que en una muestra coincidan numéricamente la media aritmética y la varianza? Justifi-
que y/o ejemplifique.
3) ¿Está de acuerdo con la siguiente afirmación? “Si todos los valores de una variable con desviación
estándar 30 se aumentan un 30%, entonces la varianza de la nueva variable es 1521”. Justifique su res-
puesta.
4) En una distribución asimétrica positiva la mediana es numéricamente ............................ que la media.
5) ¿Cómo se representa F(x) para una variable discreta? ¿Por qué?
6) Haga un círculo en V (“Verdadero”) o F (“Falso”) según corresponda:
a) V F Los histogramas de todas las distribuciones muestrales siempre tienen forma simétrica.
b) V F Las frecuencias relativas están expresadas en las mismas unidades que la de la unidad de
observación.
c) V F La media aritmética es una medida influenciada por valores extremos.
d) V F El coeficiente de variación es útil para comparar valores promedios.
7) Si la distribución de una variable es asimétrica negativa, entonces cuando uno se mueve de menos
infinito a más infinito se encuentra con ....................... , ................................., y modo.
8) Dé dos razones válidas para justificar un muestreo en lugar de un censo para obtener información de
una población.
9) Se sabe que una máquina produce piezas defectuosas periódicamente y para testear su funciona-
miento se seleccionan una de cada 15 piezas producidas. ¿Qué tipo de muestreo se aplicó? ¿Le parece
adecuado en este caso? ¿Por qué? Indique las posibles conclusiones de este muestreo.
10) Para elegir en una región 1000 personas expuestas a un factor de contaminación ambiental (agua,
químicos, desechos tóxicos, etc.) es más fácil seleccionar al azar localidades, y dentro de ellas a las per-
sonas. ¿Cuál sería el muestreo más adecuado para este caso?
11) Se quiere estimar la producción por Ha de maíz en una región productora de dicho cereal. Se sabe
que algunas zonas tienen riego artificial y otras no, y que en algunas se emplean fertilizantes y en otras
no.
Indique:
i) qué muestreo le parece más adecuado para una estimación correcta:
a) Muestreo aleatorio simple
b) Muestreo estratificado
c) Muestreo por conglomerados
d) Muestreo sistemático
ii) ¿Cómo seleccionaría una muestra en el muestreo que haya elegido?
45
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
* CONTENIDOS TEMÁTICOS
Propiedades de los estimadores.
Teorema Central del Límite (TCL). Aplicaciones.
Muestra aleatoria. Muestreo aleatorio simple. Unidad de muestreo. Tamaño de muestra.
Ejemplos de estimación puntual para:
a) la media ( µ )
b) la varianza ( σ )
2
c) la proporción ( p ) poblacional.
Algunos estimadores usuales para la media, para la varianza y la proporción. Distribuciones de X y S2 .
Aplicaciones.
desconocida; c) σ ; y d) p. Límite superior e inferior del IC. Nivel de confianza 100(1-α)%. Margen de error,
2
* GLOSARIO
Teorema Central del Límite (TCL). Muestra aleatoria. Unidad de muestreo. Tamaño de muestra. Estimador
puntual. Estimador por Intervalo de Confianza. Supuestos Teóricos. Error estándar.
PROBLEMAS RESUELTOS
EJERCICIO 1) Asuma que el aumento de peso en un cobayo, alimentado con un determinado
balanceado, se distribuye aproximadamente normal con media igual a 105 g y desvío estándar igual a
10,5 g. Si se extrae de esta población de cobayos una muestra aleatoria de tamaño 16:
a) ¿Con qué probabilidad un cobayo tomado al azar tendrá un aumento de peso de al menos 104 g?
b) ¿Cuál es la probabilidad de que los cobayos de una muestra de tamaño 16 tengan un aumento de
peso promedio inferior a 106 g?
c) ¿Qué valor del aumento de peso no será superado con probabilidad 0,95 por un cobayo tomado al
azar?
d) ¿Qué valor del aumento medio de peso no será superado con probabilidad 0,95 en muestras de
tamaño 16?
En este tipo de ejercicios, generalmente nos dan información de una variable (aumento de peso de un
cobayo, X ) y nos piden resolver cálculos de probabilidad para esa variable o para la variable promedio
(aumento de peso medio o promedio de 16 cobayos, X 16 ). Las distribuciones de estas dos variables
aleatorias son: X ≈ N (105; 110, 25) y X 16 ≈ N (105; 6,890625 )
En los gráficos siguientes se representa sendas muestras aleatorias de tamaño 10.000 cada una, a la
izquierda la distribución del aumento de peso en un cobayo, y a la derecha la de aumento de peso medio
o promedio de 16 cobayos.
46
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
0.26 0.23
0.19 0.17
frecuencia relativa
frecuencia relativa
0.13 0.11
0.06 0.06
0.00 0.00
64 78 91 105 119 132 146 64 78 91 105 119 132 146
Po bla ción Mu es tra 1 6
PESO PESO MEDIO
La distribución de la media muestral tiene una varianza menor que la de la variable original, lo que se ve
reflejado claramente en los gráficos anteriores, aunque coinciden en la media. Entonces, es importante elegir
correctamente la distribución sobre la cual se realizarán los cálculos de probabilidades. Si la pregunta se
refiere a un individuo, el cálculo de probabilidad se realizará con la distribución de la variable
X ≈ N (105;110, 25 ) ; en cambio, si la misma se refiere al promedio entonces se empleará la distribución del
promedio de la muestra, en este caso X 16 ≈ N (105; 6,890625 ) donde el 6,890625 proviene de
σ X2 110, 25
σ X2 = = .
n 16
SOLUCIÓN
a) En este caso estamos calculando la probabilidad de que un cobayo pese 104 g o más (al menos 104
g), nos interesa la distribución de X . Entonces se procede:
104 − 105
P ( X ≥ 104 ) = P Z ≥ = P ( Z ≥ −0, 095 ) = 1 − P ( Z < −0, 095 )
10,5
Entonces, buscamos en la tabla de la distribución normal estándar aproximando –0,095 a –0,1 y obtenemos:
P( X ≥ 104) ≅ 1 − P ( Z < −0,10 ) ≅ 1 − 0, 4602 ≅ 0,5398
Un cobayo de la muestra tendrá un aumento de peso de al menos 104 g con una probabilidad aproximada
de 0,54.
b) En este caso nos preguntan sobre el aumento medio (o promedio) de los cobayos de una muestra de
tamaño 16, entonces se debe usar la distribución de X 16 .
106 − 105
P ( X 16 < 106 ) ≡ P Z < = P ( Z < + 0,38 ) = 0, 6480
10,5
16
La probabilidad de que el promedio de los individuos de una muestra de tamaño 16 sea menor que 106 g es
igual a 0,65.
Debemos notar que en este caso no estamos usando el TCL, ya que suponemos que X es aproximadamente
normal y asumimos que la distribución de X 16 es aproximadamente normal, basados en las características
de la distribución de X . Además, notemos que 10, 5 / 16 es el desvío estándar de X 16 .
c) Se quiere saber que valor no será superado con probabilidad 0,95 por un cobayo tomado al azar. En este
caso interesa la distribución X , entonces, por un lado sabemos que:
x − 105
P ( X ≤ xi ) = 0,95 ≡ P Z ≤ i = 0,95
10,5
47
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
( )
Por el otro, en la distribución normal estándar P Z ≤ z0,95 = 0,95 , sabemos que z0,95 = 1,64; entonces
xi − 105 , y despejando x − 105
igualando z0,95 con xi de dicha igualdad, 1, 64 = i , se obtiene el valor de xi .
10,5 10,5
xi = 105 + 1, 64 ⋅10,5 = 122, 22 g.
El valor del aumento de peso que no será superado con probabilidad 0,95 por un cobayo es
aproximadamente 122,2 g.
d) Esta pregunta, aunque similar a la anterior, se refiere al valor medio de una muestra de tamaño 16,
entonces, empleamos la distribución de X 16 .
x − 105
P ( X 16 ≤ xi ) = 0,95 ≡ P Z ≤ i = 0,95
10,5
16
xi − 105
Al igual que antes, igualando z0,95 con , y despejando xi se obtiene la solución:
10,5 16
xi = 105 + 1, 64 ⋅ 2, 625 = 109,305 g.
El valor del aumento medio de peso que no será superado con probabilidad 0,95 en muestras de tamaño
16 es aproximadamente 109,3 g.
50,00 77,50 105,00 132,50 160,00 90,00 97,50 105,00 112,50 120,00
Peso Peso medio
Notar que la solución en d) está más cerca de la media de su distribución que la solución en c) de la suya,
aunque ambas soluciones representen desde el punto de vista probabilístico lo mismo.
EJERCICIO 2) Se está investigando el efecto de una droga para reducir el nivel promedio de glucosa en
sangre (glucemia, en mg/ml), en una línea de ratas diabéticas. Para ello se tomó una muestra de 40 ratas
tratadas con la droga, con la suposición de que la probabilidad de que el promedio sea menor a los 2 mg/ml
(valor promedio de la glucemia en ratas sin tratar) sea alta (por ejemplo, mayor a 0,8).
Se desconoce la distribución del nivel de glucemia para las ratas tratadas con la droga, pero se sabe que
tiene media 1,7 mg/ml y desvío 0,8 mg/ml. ¿Se cumple la suposición de los investigadores?
SOLUCIÓN
Tenemos:
X: “glucemia de una rata tratada con la droga”, medida en mg/ml. (Con distribución desconocida, siendo
µ=1,7 mg/ml y σ = 0,8 mg/ml).
X : “glucemia media de una muestra de ratas tratadas con la droga”, medida en mg/ml.
48
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
X −µ 2 − 1, 7 0,3
P ( X ≤ 2) ≅ P z ≤
Nos interesa calcular:
σ = P z ≤ 0,8 = P z ≤ 0,13 = P ( z ≤ 2, 31) = 0, 98956
n 40
Como la probabilidad obtenida es 0,98956, o sea una probabilidad alta, se cumpliría con la suposición de
los investigadores.
EJERCICIO 3) Se toma una muestra de 18 caninos de la ciudad de Neuquén. A cada uno se le extrae
sangre, se separa el plasma de la misma, y finalmente se mide la concentración de colesterol libre.
3
Obteniéndose, a partir de los 18 registros de colesterol libre, un promedio de 70 mg/100 cm de colesterol
3
libre, y un desvío estándar de 15 mg/100 cm .
Antes de resolver el problema, vemos que tenemos que estimar intervalos de confianza de nivel 99% y 90%
para la media poblacional, µ, sin conocer σ (varianza poblacional), entonces se emplea como la variable
2
X −µ
pivotal a la siguiente t de Student: t= ∼tn-1
S
n
Esta es una variable auxiliar basada en la distribución de X que nos será de utilidad para obtener los
estimadores del intervalo de confianza para µ, no depende de ningún parámetro desconocido; sólo es
función de las observaciones de la muestra y de µ, y, además, tiene distribución conocida.
Para obtener las expresiones de los límites interior (LI) y superior (LS), debemos plantear la siguiente
igualdad:
X −µ
P tn −1; α 2 ≤ ≤ tn −1;1−α 2 = 1 − α
S
n
Por conveniencia, ya que la distribución t de Student es simétrica, emplearemos − tn −1;1−α 2 en lugar de
tn −1; α 2 . Entonces,
X −µ
P − tn −1;1−α 2 ≤ ≤ tn −1;1−α 2 = 1 − α
S
n
Despejando µ desde el término entre paréntesis de la igualdad anterior se obtienen las expresiones de los
límites inferior y superior del IC.
Primero despejamos la diferencia que contiene al parámetro: − tn −1;1−α 2 ⋅ S ≤ X −µ ≤ tn −1;1−α 2 ⋅
S
n n
Luego la media muestral: − X − tn −1;1−α 2 ⋅ S ≤ −µ ≤ − X + tn −1;1−α 2 ⋅
S
n n
S S
Multiplicamos por (-1): X + tn −1;1−α 2 ⋅ ≥µ≥ X − tn −1;1−α 2 ⋅
n n
S S
Reordenamos: X − tn −1;1−α 2 ⋅ ≤µ≤ X + tn −1;1−α 2 ⋅
n n
S S
Entonces, el intervalo de confianza está dado por: X − t . ; X + tn −1;1−α . , cuya expresión
n −1;1−α
2 n 2 n
S
puede resumirse en: X m tn −1;1−α 2 ⋅ (1)
n
49
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
Notemos que tanto el LI como el LS son variables aleatorias ya que dependen de las observaciones de la
muestra (para calcular X y S), del nivel de confianza, y del tamaño de la muestra; lo que permitiría la
siguiente expresión probabilística:
S S
P X − tn −1;1−α 2 ⋅ ≤µ≤ X + tn −1;1−α 2 ⋅ = 1−α
n n
Sin embargo, cuando X y S se reemplazan por los valores obtenidos a partir de la muestra, el LI y el LS ya
no son variables pues toman un único valor dependiendo de la muestra. Esto es lo que limita, en el momento
de la conclusión, la interpretación probabilística del intervalo de confianza obtenido. Entonces, siempre la
conclusión de los IC se expresa desde el punto de vista del nivel de confianza que se haya empleado en la
estimación del intervalo. Esto debería quedar claro en las conclusiones siguientes.
SOLUCIÓN
a.- Un IC99% para µ con σ desconocida. Datos: n = 18 (tamaño de la muestra);
2
x = 70 mg/100 cm3;
s = 15 mg/100 cm3; y nivel de confianza 99%, o sea 1-α = 0,99.
Por lo tanto, el valor tabular que emplearemos es tn −1;1−α 2 = t17; 0,995 = 2,898.
Notemos aquí que hay tres formas de expresar el valor tabular 1) simbólico en general: tn −1;1−α 2 , 2) sim-
bólico en particular (o sea, teniendo en cuenta el tamaño muestral y en nivel de confianza del ejercicio)
t17; 0,995 , 3) mediante su valor numérico: 2,898.
ATENCIÓN!! en el contexto del presente curso de estadística (al resolver ejercicios, parciales o finales)
“siempre” que sea posible se debe informar tanto el valor tabular “simbólico en particular” como su “valor
numérico”.
15
Reemplazando en (1) tenemos: 70 m 2,898 ⋅ .
18
Entonces, un intervalo de confianza del 99% para µ es [59,75 mg/100 cm ; 80,25 mg/100 cm ]
3 3
3
CONCLUSIÓN: Con un nivel de confianza del 99%, se espera que el intervalo [59,75 mg/100 cm ; 80,25
3
mg/100 cm ] cubra o contenga al verdadero valor de la media de la concentración de colesterol libre en el
plasma sanguíneo de los caninos de la ciudad de Neuquén.
b) En este caso, 1-α = 0,90; entonces tn −1;1−α 2 = t17; 0,95 = 1,74. Los otros datos son iguales al punto anterior.
Reemplazando en (1) tenemos, ahora: 70 m 1, 74 ⋅ 15 .
18
Entonces, un intervalo de confianza del 90% para µ es [63,85 mg/100 cm ; 76,15 mg/100 cm ]
3 3
3
CONCLUSIÓN: Con un nivel de confianza del 90%, se espera que el intervalo [63,85 mg/100 cm ; 76,15
3
mg/100 cm ] contenga o cubra el verdadero valor de la media de la concentración de colesterol libre en el
plasma sanguíneo de los caninos de la ciudad de Neuquén.
c) El IC90% para µ es de menor amplitud (diferencia entre el límite superior e inferior, LS – LI) que el IC99%
para µ, pero también es menos confiable. Eso será una constante para un n fijo, a mayor amplitud mayor
confianza. El análisis de esto se discutirá en clase con el docente, es buena idea pensar un poco y llevar
preguntas al aula.
50
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
En este caso debemos estimar la varianza poblacional (σ ) mediante un intervalo de confianza. La variable
2
χ2 =
( n − 1) ⋅ S 2 ∼ χ 2
n −1
σ2
Como en el caso anterior, para obtener las expresiones de los límites del intervalo de confianza, debemos
plantear la siguiente expresión:
P χ n2−1; α 2
( n − 1) ⋅ S 2
χ
≤ ≤ = 1−α
2
− − α
σ
2 n 1;1 2
El mecanismo para obtener las expresiones del IC para σ es bastante sencilla pero requiere cierto
2
cuidado. Sabemos que esta variable aleatoria no es simétrica, con lo cual no podemos usar un único
valor tabular.
Despejando se obtiene el siguiente intervalo: ( n − 1) ⋅ S 2 ≤σ ≤2 ( n − 1) ⋅ S 2 (2)
χ n2−1;1− α 2 χ n2−1; α 2
SOLUCIÓN
Datos: n = 15; x = 96 UI/ml; s = 35 UI/ml ; y 1-α = 0,95.
14 ⋅1225
Reemplazando en (2) nos queda: a) LI: = 656,58
26,15
14 ⋅1225
b) LS: = 3046, 72
5, 629
2 2
CONCLUSIÓN: Se espera con una confianza del 95% que el intervalo [656,58 (UI/ml) ; 3046,72 (U/ml) ]
contenga o cubra al verdadero valor de la varianza de la concentración de amilasa en suero en la población
de individuos aparentemente normales.
¿Qué hubiera ocurrido si en el ejercicio nos hubieran solicitado un intervalo de confianza para el desvío
estándar poblacional (σ)?
En principio nada muy distinto. Primero se obtiene un intervalo de confianza para σ , luego se obtiene la raíz
2
cuadrada de los LI y LS, y finalmente se concluye. Hubiera resultado ser algo así:
Para el ejercicio 4), estime el desvío estándar poblacional mediante un intervalo de confianza el 95%.
Un IC95% para σ : a) LI= 656,58 = 25, 62 UI/ml y b) LS= 3046, 72 = 55, 20 UI/ml
CONCLUSIÓN: Se espera con una confianza del 95% que el intervalo [25,62 UI/ml; 55,20 U/ml] contenga o
cubra al verdadero valor del desvío estándar de la concentración de amilasa en suero en la población de
individuos aparentemente normales.
EJERCICIO 5) Un fabricante de material de laboratorio desea saber qué proporción de sus productos no
contienen fallas. Estimar puntualmente y mediante un intervalo de confianza la proporción de material sin
fallas si se sabe que en una muestra de 100 unidades producidas se contó sólo 4 unidades con fallas. Usar
un nivel de confianza del 90% (1 - α = 0,90).
En este caso, la variable pivotal a emplear es: pˆ − p
z= ≈ N ( 0;1)
pˆ (1 − pˆ )
n
51
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
Usando el mismo razonamiento que antes se pueden obtener las expresiones de los límites inferior y
pˆ (1 − pˆ )
superior del IC para p, que presentamos en la siguiente expresión: pˆ m z α ⋅ (3)
1− n
2
SOLUCIÓN
Datos: n = 100; número de unidades con fallas = 4 ; 1 - α = 0,90
casos favorables 96
a) Estimación puntual: pˆ = = ˆ = 0,96
, o sea p
tamaño de muestra 100
CONCLUSIÓN: Con un nivel de confianza del 90%, se espera que el intervalo [0,928; 0,992] contenga o
cubra al verdadero valor de la proporción de unidades producidas sin fallas correspondiente al fabricante de
material de laboratorio.
Antes de resolver el ejercicio, veamos algunos conceptos asociados a este problema. Llamamos margen de
error a la semiamplitud del intervalo de confianza y lo simbolizamos con la letra d.
Si la amplitud a = (LS – LI), entonces la semiamplitud d = (LS – LI) / 2. En los casos de los Intervalos de
Confianza expresados en (1) y (3), la semiamplitud coincide con el término a la derecha del signo m .
Entonces, nos podemos dar cuenta, analizando la función semiamplitud, de qué factores depende y cómo
depende de estos.
En el presente problema, el parámetro de interés es la proporción poblacional, por lo tanto se trabaja con el
intervalo presentado en (3), del cual se obtiene:
pˆ (1 − pˆ )
d = z1−α 2 ⋅ (4)
n
Observando (4) podemos ver que el nivel de confianza influye en el valor de z. La experiencia piloto nos
permite usar un valor de p̂ ; el margen de error, d, es igual a 0,05. Por lo tanto sólo se debe despejar n para
tener una respuesta al problema.
SOLUCIÓN
Datos: d = 0,05; 1-α = 0,95; xm = 35 (número de machos o casos favorables); y tamaño de la muestra
piloto np = 100.
Despejando n desde (4) obtenemos:
2
z1−α 2
n0 = ⋅ pˆ (1 − pˆ ) (5)
d
[Notaremos n0 al tamaño de muestra calculado para satisfacer los requisitos de “margen de error” y
“nivel de confianza” deseados.]
Reemplazando en (5) con los datos, y recordando que z1−α 2 = z0,975 = 1,96:
2
1,96
n0 = ⋅ 0,35 ( 0, 65 ) = 349,58 ≅ 350 moscas
0, 05
Respuesta: el tamaño de la muestra debe ser de 350 moscas para tener un margen de error de a lo sumo
0,05 y una confianza de 95%.
52
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
[Siempre que sea necesario redondear al buscar el tamaño de muestra, lo haremos redondeando hacia el
entero superior.]
Nota: Muchas veces, antes de realizar un muestreo para estimar con cierto margen de error un parámetro,
no se cuenta con información relativa a la variación de la población. En tal caso, se puede adoptar alguna de
las siguientes opciones: a) hacer un muestreo piloto, b) tomar información de bibliografía, c) consensuar un
valor sobre la base de la experiencia del investigador en el tema o tratando de considerar algún caso
extremo. (Ejemplo: pˆ = 0,5 en caso de no contar con información previa)
2
EJERCICIO 7) Se desea estimar el peso promedio de materia verde por m en un campo de 10 ha,
sembrado con alfalfa. Se admite un error en la estimación (sinónimo de margen de error) de 0,05 Kg, con una
confianza del 99%. Dado que no se dispone de información anterior se procedió a seleccionar una muestra
2 2 2
piloto de 20 unidades (o sea, 20 m ) y se calculó s = 1,4 kg . Determinar el tamaño de muestra adecuado a
las restricciones enunciadas y definir: a) Variable y población en estudio; y b) Unidad de muestreo.
En este ejercicio se agrega un concepto que es de utilidad cuando las poblaciones son de tamaño finito.
Generalmente, consideramos que N (el tamaño de la población) es infinito, pero en muchas situaciones,
como en la del ejemplo, la población tiene un tamaño finito. Entonces, para considerar esta situación se debe
usar la siguiente corrección:
n0
nf =
n
1+ 0
N
Notemos que ahora se denomina nf al tamaño de muestra requerido para satisfacer las restricciones de
margen de error y nivel de confianza cuando el tamaño de la población es finito.
SOLUCIÓN
2 2
Datos: N = 10 ha = 100000 m (tamaño de la población); np = 20 m (tamaño de la muestra piloto);
s = 1,4 kg ; 1-α = 0,99 → tn p −1;1−α 2 = t19; 0,995 = 2,861; y d = 0,05 Kg
2 2
2
a) Variable en estudio: peso de materia verde en 1 m expresado en Kg de campo sembrado con alfalfa.
2
Población en estudio: 100.000 m sembrados con alfalfa.
2
b) Unidad de muestreo: una parcela de 1 m sembrada con alfalfa.
En base a la información suministrada, se debe trabajar con la semiamplitud obtenida a partir de (1):
s ⋅ tn p −1;1−α 2 1,1832 ⋅ 2,861 2
2
n0 = = = 4583,656
d 0, 05
En este punto sería necesario aproximar hacia el entero superior, pero como emplearemos la fórmula de
corrección por tamaño finito de la población, la aproximación se pospone hasta haber realizado el
siguiente cálculo:
4583,656
nf = = 4382,765 ≅ 4383 parcelas de 1 m
2
4583,656
1+
100000
2
El tamaño de la muestra para una población de tamaño finito debe ser de 4383 parcelas de 1m para
satisfacer las restricciones (margen de error y confiabilidad) en la estimación.
EJERCICIO 8) El peso, en gramos, de pollitos blancos de raza Leghorn es una variable aleatoria con fun-
ción de probabilidad dada por:
1
si X ∈ [ 280;380]
f ( X ) = 100
0
si X ∉ [ 280;380]
53
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
0 si X < 280
1
280
La función de distribución es: F ( X ) = x− si 280 ≤ X ≤ 380
100 100
1 si X > 380
a) Se elige un pollito al azar de la población total en estudio. Calcular la probabilidad de que su peso sea
mayor que 330 g.
c) Sabiendo que la media de los pesos de los pollitos blancos de raza Leghorn es 330 g y la varianza de
2
los pesos es 833,33 g , y se eligen al azar en forma independiente 36 pollitos, calcular la probabilidad de
que el peso promedio sea mayor a 330 g. Justificar el cálculo hecho.
SOLUCIÓN
1 280
a) P ( X > 330 ) = 1 − F ( 330 ) = 1 − *330 − = 1 − 0,5 = 0,5
100 100
b) Al elegir 10 pollitos en forma independiente, y considerar como variable X: “cantidad de pollitos blancos
de raza Leghorn con peso superior a 330 g”, se analiza si cumple con los requisitos para ser considerada
binomial. En este punto, sería conveniente que usted escriba los supuestos de la binomial, aplicándolos a
esta situación práctica. Verá que se cumplen, y podemos escribir lo siguiente: X∼Bi (n=10 ; p=0,5), por lo
que se resuelve:
P ( X = 6 ) = P ( X ≤ 6 ) − P ( X ≤ 5 ) = 0,8281 − 0, 6230 = 0, 2051
c) Como X tiene distribución uniforme, con µ=330 g y σ = 833,33 g , entonces podemos buscar la distri-
2 2
bución del peso promedio aplicando el Teorema Central del Límite, con lo que nos queda que:
σ 2 833,33
X 36 ≈ N µ = 330; σ X2 = = = 23,148
n 36
330 − 330
P( X > 330) = P Z > = P( Z > 0) = 1 − P( Z ≤ 0) = 1 − 0,5 = 0,5
833,33
36
EJERCICIO 9) En los últimos años se desarrollan actividades alternativas de cría, basándose en especies
animales autóctonas de la zona. Este es el caso de la cría del lagarto overo, en alguna localidad de la
Mesopotamia argentina. En un estudio realizado en un centro de reproducción y cría, de dicha localidad,
se midieron 45 colas de lagartos hembra juveniles, obteniéndose una media de 0,5 m y una varianza de
2
0,008 m . La variable de interés se distribuye en forma normal.
a) Estimar, utilizando un nivel del 95%, la longitud media de la cola.
b) Si usted hubiera decidido realizar el intervalo con un nivel de confianza del 90%, ¿qué modificación
hubiera tenido la amplitud del mismo? Justifique su respuesta y realice los cálculos correspondientes.
c) Suponga que, por bibliografía consultada, la longitud de la cola en los yacarés overos hembras juve-
niles es una variable aleatoria con distribución desconocida cuya media es 0,45 m y su varianza es 0,01
2
m . A partir de esta información y considerando que tiene los mismos elementos en su muestra, ¿puede
definir la distribución de la longitud media de la cola?
d) Si para reproducción se dejan aquellas hembras con longitudes medias de cola superiores a 0,48 m,
¿qué porcentaje de las hembras de la muestra serán seleccionadas para el plantel reproductor?
SOLUCIÓN
a) La variable en estudio es X: “Longitud de la cola de un lagarto overo hembra del centro de reproduc-
ción y cría de algún lugar de la Mesopotamia argentina”, y está medida en m. Los datos que tenemos
son: n=45 ; x = 0,5m ; s 2 = 0, 008m 2 , por lo que s = 0, 089m
54
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
b) La amplitud (simbolizada con a) del intervalo anterior la calculamos restando los valores de los límites
obtenidos: a = LS – LI = 0,525 – 0,473 = 0,052
Veamos qué ocurre si la confianza disminuye como en este caso, ya que pasamos a tener 90%. Recor-
demos que la semiamplitud del intervalo corresponde al producto entre el valor tabular de la variable pivo-
tal y el error estándar de la media, en este caso, dado que estamos armando un intervalo para la media,
s
quedando así: d = t α *
n −1;1− n
2
Si reemplazamos numéricamente y calculamos:
s 0, 089
d =t α * = t44;0,95 * = 1, 68* 0, 013 = 0, 022
n −1;1− n 45
2
PROBLEMAS PROPUESTOS
EJERCICIO 1) Se desea estimar el peso promedio de un lote de 500 cerdas, a partir de una muestra de 36.
Los pesos obtenidos se presentan en la siguiente tabla:
PESO (Kg) Cant. animales
40 - 42 3
42 - 44 5
44 - 46 7
46 - 48 10
48 - 50 6
50 - 52 3
52 - 54 2
Proponer una respuesta trabajando con un nivel de confianza del 99%, y suponiendo que la distribución de la
variable es normal.
EJERCICIO 2) Se desea estimar el desvío estándar de la alzada de potrillos PSC (Pura Sangre de Carrera)
de la provincia de Entre Ríos, con una confianza del 95%, sabiendo que una muestra de 20 animales
presentó un CV% de 19,03% y un promedio de 1,10 m. Suponga que la variable tiene distribución normal.
a.- Definir la variable en estudio y la población de interés.
b.- Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c.- Indicar los valores tabulares empleados para el LI y el LS.
d.- Estimar el desvío estándar poblacional mediante un intervalo de confianza y concluir.
55
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
EJERCICIO 4) Un investigador necesita conocer el nivel medio de una enzima en una población. Con los
datos disponibles, correspondientes a determinaciones realizadas en una muestra piloto de 10 individuos, se
2
obtuvo una media de 22 UI y una varianza de 49 UI . Suponga que la variable tiene distribución normal.
a.- Definir la variable en estudio y la población de interés.
b.- Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c.- ¿Qué cantidad de determinaciones deberá realizar para estimar la media poblacional con una confianza
del 99% y con un margen de error no mayor a 2 UI?
Asuma que se tomó una muestra del tamaño por Ud. recomendado en el punto c.-, y que entonces las
estimaciones para µ y σ resultaron ser 23 UI y 48,5 UI , respectivamente.
2 2
EJERCICIO 5) Se quiere estimar la proporción de familias del Conurbano Bonaerense que tienen alguna
forma de seguro de salud.
a.- Definir la variable en estudio y la población de interés.
b.- Considerando que no se dispone de información previa, ¿qué tamaño de muestra se deberá tomar para
asegurar un nivel de confianza del 99% y un margen de error de 0,3?
c.- Si se cree que el 70% de las familias tienen seguro, ¿qué tamaño de muestra se deberá tomar para
asegurar un nivel de confianza del 99% y un margen de error de 0,3?
EJERCICIO 6) Si el peso de los novillos de la raza Aberdeen Angus es una variable con una media de
360 Kg y un desvío estándar de 18 Kg,
a.- La probabilidad de que el promedio de 49 novillos Aberdeen Angus, elegidos al azar, pesen entre 380 y
390 Kg es igual a
b.- Al tomar una muestra al azar de 36 novillos Aberdeen Angus, la probabilidad de que el promedio de la
misma esté entre 365 y 370 Kg es igual a
Planteo Desarrollo Resultado
56
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
b.- Tache lo que no corresponde: “El intervalo de confianza fue [SIMÉTRICO] [ASIMÉTRICO] con respecto al
estimador puntual.”
EJERCICIO 8) ¿Cuál sería el tamaño de muestra necesario para que la amplitud de un intervalo de
confianza del 95% para la media poblacional de una variable, medida en mm, con distribución normal sea
2
igual a 2mm, si la varianza es conocida e igual a 4mm ?
EJERCICIO 9) Al estimar la media poblacional mediante un intervalo de confianza del 90% se obtuvieron
los siguientes límites: [95; 110]. Sabiendo que se trabajó con una muestra de 26 individuos, dar el valor
del promedio y de la varianza que se utilizó para el cálculo de dicho intervalo si σ era desconocida.
2
EJERCICIO 10) El administrador de un rodeo está interesado en conocer la edad promedio de las vacas
de cría en un año dado. Decide tomar una muestra de tamaño 25, con la que se obtuvo un promedio de
5,3 años. Si se conoce que esta variable tiene una distribución normal con varianza poblacional de 2,25
2
años .
a.- Estimar la edad promedio poblacional mediante un intervalo de confianza del 95%.
b.- Si se quiere reducir en un 50% la amplitud del intervalo de confianza ¿Cuál debería ser el tamaño de
la muestra?
c.- Si al punto anterior se le agrega la información de que el tamaño poblacional es finito, N = 500. ¿Cuál
sería su respuesta?
EJERCICIO 11) Con el fin de analizar el contenido de proteínas del salmón enlatado, medido en %, se
seleccionó una muestra de 15 unidades y se realizó la determinación correspondiente. Los datos obteni-
dos son los siguientes:
22,4 24,5 23,0 27,1 24,2 25,7 26,4 28,3 26,4 25,2 24,7 26,3 25,3 24,9 27,4
26,00
es una variable aleatoria con distribución normal:
25,00
c) Halle un intervalo de confianza del 95% para la verda-
dera media poblacional. Interprete en términos del 24,00
problema planteado
23,00
d) Halle un intervalo de confianza del 95% para el ver-
dadero desvío poblacional. Interprete en términos del 22,00
problema planteado
tenida en ellos? En la próxima unidad usted aprenderá otro método estadístico que le permitirá hacer otro
tipo de inferencia, para responder a la siguiente pregunta: ¿aumentó la proporción de caninos con leptos-
pirosis?
CUESTIONARIO
( )
1.- a) Sea X una variable aleatoria, X ~N µ ; σ 2 . ¿Cómo se distribuye la media muestral para las muestras
de tamaño n? ¿Debe hacerse alguna consideración con respecto a n? Justifique la respuesta.
b) Ídem suponiendo que se desconoce la distribución de X .
( )
2.- Sea X una variable aleatoria, X ~N µ ; σ 2 . Establezca la relación de igualdad o desigualdad (< ó >)
( )
según corresponda entre las siguientes probabilidades: P a < X < b y P ( a < X < b ) siendo a < µ < b .
Justifique la respuesta.
3.- Sea X una variable aleatoria con distribución desconocida, pero de la cual se sabe que tiene E(X ) = µ
y V ( X ) = σ 2 . ¿Cómo se distribuye la media aritmética muestral para las muestras de tamaño 10?
Justifique la respuesta.
4.- Explique cuál es la importancia del Teorema Central del Límite a la Estadística.
5.- Sea X una variable aleatoria tal que X ~N ( µ ; σ 2 ) . Se toman dos muestras aleatorias, una de tamaño n
(muestra 1), y otra de tamaño m (muestra 2). Compare las varianzas correspondientes a las variables
promedio de las muestras 1 y 2 (o sea, X 1 y X 2 ), indicando la relación entre ellas en los casos: a) n = m y
b) n > m.
6.- Se construyó un intervalo de confianza para la media poblacional con varianza conocida. Con la misma
muestra se quiere construir otro intervalo de menor amplitud. ¿Qué puede proponer para lograrlo? Justifique
la respuesta.
7.- ¿Cómo interpreta el coeficiente de confianza cuando construye un intervalo de confianza? Ejemplifique.
8.- Al estimar σ por medio de dos intervalos de confianza construidos con la misma muestra, se obtuvieron
2
S S S S
a.- X − S ; X + S b.- X − ;X+ c.- X − tn −1;1− α 2 . ; X + tn −1;1− α 2 .
n n n n
10.- Si X es una variable aleatoria cuya distribución es desconocida, pero con media 120 y varianza 16
conocidas. Seleccionar la opción que considere correcta:
“La media de muestras de tamaño 100 se distribuye ...
a.- aproximadamente normal con media 120 y varianza 16.”
b.- exactamente normal con media 120 y varianza 0,16.”
c.- aproximadamente normal con media 120 y varianza 0,16.”
e.- con distribución desconocida pero con media 120 y varianza 0,16.”
11.- ¿Por qué debe decirse que “el intervalo cubre o contiene al parámetro” y no “el parámetro cae dentro del
intervalo”? Justifique la respuesta.
12.- “El teorema central del límite nos garantiza la distribución aproximadamente normal de la media muestral
cuando la variable X
a.- tiene distribución Normal.”
b.- tiene distribución no Normal.”
c.- tiene distribución desconocida pero tabulada”
d.- tiene distribución desconocida.”
58
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
13.- ¿Qué diferencias encuentra entre el margen de error para la estimación de µ cuando σ es conocida
2
14.- Trate de obtener la expresión de la amplitud (LS – LI) para un IC para la media poblacional, y analice
como varía esta en función de las variables que la componen.
15.- Intente realizar el despeje para obtener el LI y el LS de un IC para la varianza poblacional.
16.- ¿Cuál sería la razón de adoptar la regla del redondeo del tamaño de la muestra al entero superior?
59
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
PRUEBA DE HIPÓTESIS
* OBJETIVOS ESPECÍFICOS
Comprender y analizar la lógica de los ensayos de hipótesis así como de sus componentes
fundamentales.
Aplicar correctamente los conceptos de nivel de significación, potencia de una prueba y regla de decisión
estadística a la resolución de problemas.
Desarrollar espíritu crítico para evaluar la correcta aplicación de una dócima en un determinado contexto.
* CONTENIDOS TEMÁTICOS
Concepto de hipótesis estadística. Errores tipo I y II. Nivel de significación. Concepto de potencia de una
prueba estadística. Esquema para contrastar una hipótesis. Prueba de hipótesis para la media (µ), la
2
proporción (p) y la varianza (σ ). Aplicaciones.
* GLOSARIO
Prueba, dócima o contraste de hipótesis. Supuestos teóricos. Hipótesis de trabajo. Hipótesis estadística.
Hipótesis nula y alternativa. Error tipo I y tipo II. Nivel de significación. Región crítica. Regla de decisión.
Potencia.
PROBLEMAS RESUELTOS
EJERCICIO 1) En una chimenea se ha instalado un sistema de precipitación con el que se cree que la
3
concentración de sólidos en el humo, que es en promedio de 1,8 g/m , será menor a la tercera parte. Puesta
3
en marcha la instalación se efectúa una serie de mediciones, obteniéndose los siguientes valores (g/m ):
En base a estos valores, ¿cree usted que se ha obtenido el resultado esperado? (α=0,05)
SOLUCIÓN
Variable en estudio
3
X: concentración de sólidos en el humo de una chimenea luego de instalar un sistema de precipitación (g/m )
La hipótesis de trabajo (HT) expresa el supuesto o conjetura que motiva al experimentador. Se expresa
siempre como una afirmación y está dada en forma coloquial, no en términos estadísticos, ya que el
investigador no necesita tener conocimientos estadísticos específicos.
Es formulada antes de cualquier estudio estadístico.
En este caso HT es: “el sistema de precipitación instalado en la chimenea disminuye la concentración
de sólidos en el humo a menos de la tercera parte”.
Para poner a prueba la HT se necesita transformar las afirmaciones allí expresadas a términos
estadísticos a los fines de poder aplicarles la técnica adecuada que permita responder sobre la hipótesis
formulada. Esta consta de varios pasos y es importante tener claro en que consiste cada uno de ellos y el
orden en que se presentan.
En este caso: De acuerdo a lo formulado en la hipótesis de trabajo, y teniendo en cuenta que el valor de la
3
concentración media de sólidos antes de instalar el sistema de precipitación era de 1,8 g/m , será:
60
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
Este valor proporciona una medida del riesgo con el que se desarrollará la prueba, consecuencia del
método inductivo. Significa que de cada cien muestras obtenidas, cinco nos pueden llevar a resultados
erróneos; esperamos que la nuestra sea una de las noventa y cinco “buenas”.
En este caso:
α = 0,05 = P(rechazar H0 /H0 es verdadera) = P(suponer µ < 0,6 cuando en realidad es µ ≥ 0,6)
Esto significa que, en cinco de cada cien veces, concluiremos que el sistema disminuye la concentración
de sólidos a menos de la tercera parte cuando en realidad no lo hace.
Antes de elegir el estadístico de prueba, necesitamos tener información sobre la distribución de la
variable en estudio, ya que en este caso no está aclarada en el enunciado del problema.
ST : X ~ N (µ , σ ) X ≈ N (µ , σ )
2 2
ó
Para verificar este supuesto se realizó una prueba de Shapiro-Wilk, llegando a la conclusión de que se
puede suponer que la variable se distribuye aproximadamente normal.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Sólidos 10 0,55 0,04 0,91 0,4176
Como p=0,4176 > 0,05 (nivel dado), no rechazo H0. Por lo tanto, al nivel del 5%, no tengo evidencias
suficientes para rechazar H0 y puedo suponer que parecería que la concentración de sólidos se distribuye
normalmente.
Necesitamos ahora determinar la región crítica. Recordemos que la región crítica está formada
por los valores del estadístico de prueba en los cuales se va a producir el rechazo de la hipótesis nula.
Se determina a partir de la distribución del estadístico de prueba, el nivel de significación de la prueba, la
hipótesis alternativa y a veces, del tamaño de la muestra.
61
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
También se puede expresar la región crítica como un subconjunto de valores del estimador del
parámetro, pero no lo usaremos en este curso.
Gráficamente:
Tomando una muestra aleatoria de la población en estudio, se estima el parámetro que se está
poniendo a prueba, y teniendo en cuenta toda la información obtenida de la muestra, se calcula el valor
del estadístico de prueba bajo la hipótesis nula y se toma la decisión.
CONCLUSIÓN: Con un nivel de significación del 5%, tengo evidencias suficientes para rechazar H0: µ≥0,6
por lo tanto µ<0,6; es decir, la media poblacional de la concentración de sólidos en el humo de las chimeneas
3
en las que se ha instalado el sistema de precipitación es menor a 0,6 g/m ; en consecuencia se concluye
que la disminución producida por la instalación de este nuevo sistema lleva el valor medio de concentración
de sólidos en la chimenea por debajo de la tercera parte; por lo tanto se ha obtenido el resultado esperado.
EJERCICIO 2) En la situación práctica del problema 1), se sospecha que la varianza no se mantiene en el
3 2
valor histórico de 0,0015 (g/m ) , por lo que se ponen a prueba las siguientes hipótesis estadísticas:
H0 : σ =0,0015 vs H1 : σ ≠ 0,0015
2 2
al mismo nivel de significación
Indicar sólo: hipótesis de trabajo, estadístico de prueba, región crítica, regla de decisión, decisión e
interpretación biológica del parámetro en estudio acorde a la decisión tomada
SOLUCIÓN
Hipótesis de trabajo: La varianza de la concentración de sólidos en el humo de la chimenea una vez
3 2
instalado un sistema de precipitación es de 0,0015 (g/m )
El supuesto teórico de normalidad sobre la variable en estudio ya fue verificado; por lo tanto el
estadístico de prueba es:
χ2 =
( n − 1) ⋅ S 2 ∼ χ 2
n −1
σ2
y la región crítica de acuerdo con H1 es bilateral, siendo:
χ (9);0,025 = 2,70 ==> región izquierda χ 9 ≤ 2,70
2 2
62
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
Gráficamente:
α/2 α/2
] [
0,00 2,70 7,50 15,00 19,20 22,50 30,00
EJERCICIO 3) Un laboratorio está dispuesto a lanzar al mercado un nuevo fármaco si es aceptado al menos
por el 50% de los profesionales. Para ello selecciona una muestra aleatoria de 100 médicos veterinarios a
quienes pregunta si utilizarían el fármaco en cuestión, obteniendo 38 respuestas positivas. ¿Cuál será la
decisión del laboratorio trabajando con un nivel de significación del 5%?
Responda la pregunta indicando sólo: variable en estudio, supuesto de distribución de la misma, hipótesis
de trabajo, hipótesis estadísticas, estadístico de prueba, regla de decisión, valor calculado del estadístico de
prueba, decisión y población en estudio.
SOLUCIÓN
Variable en estudio
X: número de médicos veterinarios que aceptan el nuevo fármaco, en 100.
ST: X ~ Bi(100, p)
Para verificar este supuesto no se utilizan pruebas estadísticas. Sólo las condiciones de la distribución
Binomial vistas en la Unidad 2.
Hipótesis de trabajo: al menos el 50% de los médicos veterinarios acepta el nuevo fármaco que propone el
laboratorio
Hipótesis estadísticas
Las expresiones dadas por porcentajes se traducen a proporciones para el estudio
estadístico. Se trata entonces de un caso de una prueba de hipótesis para la proporción
poblacional.
En este caso, el 50% indica 50 de cada 100 médicos, por lo tanto p = 0,50.
Pero la hipótesis de trabajo expresa que “al menos el 50%...”, lo cual es equivalente a decir “como mínimo el
50%...”, o también “por lo menos el 50%....”, y esto se expresa entonces como p ≥ 0,50.
Teniendo en cuenta además que en la hipótesis nula debe colocarse siempre la igualdad, tenemos:
H0: p ≥ 0,50
H1: p < 0,50
63
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
pˆ − p
El estadístico de prueba es: ZH0 = ≈ N ( 0,1)
p.(1 − p)
n
x 38
Información muestral: n = 100 ; x = 38 ; pˆ = = = 0,38
n 100
0,38 − 0,50
Por lo que sustituyendo en la variable pivotal resulta: ZH = = −2, 4 que es el valor calculado del
0 0,5 ⋅ 0,5/100
estadístico de prueba.
EJERCICIO 4) Se registró la edad de los niños atendidos por quemaduras en la última Navidad en los
hospitales y centros asistenciales de la ciudad “Quemucho” (Argentina) resultando:
Edad frecuencia
3–5 3
5–7 8
7–9 10
9 – 11 7
11 - 13 4
Se solicita:
a) Definir y clasificar la variable
b) Completar la tabla de frecuencias con las columnas de frecuencias relativas y la columna de frecuen-
cias absolutas acumuladas.
c) Interpretar el significado, en términos del problema, del número “10” que figura en la tabla
d) ¿Cuál es la proporción de niños de menos de 7 años que fueron atendidos por quemaduras en éste
grupo?
e) Si se considera la ciudad “Quemucho” es representativa de las ciudades de la Argentina respecto a los
casos de niños atendidos por quemadura durante la última Navidad:
e.1) estimar la proporción de niños menores de 7 años que fueron atendidos por quemaduras duran-
te la última Navidad en las ciudades de Argentina, con un 95% de confianza.
e.2) ¿Se puede afirmar, con un nivel de significación del 1%, que la edad media de los niños que se
atendieron en la última Navidad en Argentina es superior a 7 años? Suponga que la variable cumple
el supuesto de normalidad.
SOLUCIÓN
a) X: “edad de un niño atendido, por quemaduras en la última Navidad, en los hospitales y centros asis-
tenciales de la ciudad “Quemucho”. Variable aleatoria cuantitativa discreta.
b)
Edad fi Fi hi Hi
3-5 3 3 0,094 0,094
5-7 8 11 0,250 0,344
7-9 10 21 0,312 0,656
9-11 7 28 0,219 0,875
11-13 4 32 0,125 1,000
64
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
c) f3= 10 niños, de entre 7 y menores a 9 años, fueron atendidos por quemaduras en la última Navidad en
los hospitales y centros de asistencia de la ciudad “Quemucho”.
d) Me fijo en la columna Hi, y la que corresponde a lo pedido es H2=0,344, siendo esa la proporción de
niños menores de 7 años que fueron atendidos la última Navidad en los hospitales y centros de atención
sanitaria de “Quemucho”.
e)
e.1) Los niños menores de 7 años atendidos por quemaduras, son 11 de los 32 atendidos por
quemaduras en los centros sanitarios de la localidad de “Quemucho”, por lo que la estimación puntual de
la proporción es: pˆ = 0,344 . Como estamos diciendo que dicha localidad es representativa de las ciuda-
des de Argentina, entonces estimaremos la proporción poblacional de niños menores de 7 años que fue-
ron atendidos por quemaduras, la última Navidad, en centros sanitarios y hospitales de Argentina.
El intervalo de confianza del 95% correspondiente es:
pˆ . (1 − pˆ ) 0, 344.0, 656
pˆ m Z α = 0, 344 m 1,96 = 0,344 ± 0,165 = [ 0,179; 0, 509]
1− n 32
2
Con un nivel de confianza del 95%, se espera que el intervalo [0,179 ; 0,509] contenga la verdadera pro-
porción de niños menores de 7 años atendidos por quemaduras en los hospitales y centros de atención
sanitaria de Argentina en la última Navidad.
e.2) La hipótesis de trabajo es: la edad media de los niños que se atendieron en la última Navidad
en Argentina es superior a 7 años
H0 : µ = 7 X −µ
α = 0,01 t= ∼tn-1
H1 : µ > 7 S
n
La región crítica está definida por: t31 ≥ t31;0,99 ≅ t30;0,99 = 2, 457
Conclusión: Con un nivel de significación del 1% hay evidencia suficiente para rechazar la hipótesis nula
( H 0 : µ = 7 ) , por lo que se puede decir que la edad media poblacional de los niños que se atendieron
por quemaduras en los hospitales y centros de atención sanitaria en la última Navidad en Argentina es
superior a 7 años.
65
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
[ ; ) X’i fi
4,45 - 4,70 4,58 3
4,70 - 4,95 4,83 9
4,95 - 5,20 5,08 7
5,20 - 5,45 5,33 13
5,45 - 5,70 5,58 7
5,70 - 5,95 5,83 9
5,95 - 6,20 6,08 2
SOLUCIÓN
La variable en estudio es X: “peso del vellón de una llama del establecimiento, luego de la esquila”, me-
dido en Kg.
a) Los resultados se pueden representar mediante el histograma y/o el boxplot. Ambos muestran que
la distribución de la variable es simétrica.
6,50
14
12
6,00
10
frecuencia absoluta
Peso Vellón
5,50 8
6
5,00
4
4,50 2
0
4,00 4,33 4,58 4,83 5,08 5,33 5,58 5,83 6,08 6,33
Peso Vellón
b) El parámetro de interés es la media poblacional del peso del vellón de las llamas, luego de esquila-
do, del establecimiento en el que se emplearon técnicas de mejoramiento productivo.
xi' * f i 265, 75
X =∑ = = 5,315kg
i n 50
Si trabajamos con InfoStat ® obtenemos las medidas resumen:
Estadística descriptiva
Variable n Media D.E. Mín Máx Mediana Q1 Q3
PesoVe 50 5,312 0,419 4,500 6,100 5,350 5,000 5,600
66
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
H 0 : µ ≤ 4,5 x −µ
α = 0,05 Z= ∼N(0,1)
H1 : µ > 4,5 σ
n
La región crítica es: Z ≥ Z0,95 = 1,64
Regla de decisión: Z obs ≥ 1, 64
Rechazo H0 si
No rechazo H0 si Z
obs
< 1, 64
X − µ 5,315 − 4, 5 0,815
Z obs = = = = 3,84 > 1,64 , por lo que la decisión es Rechazo H0.
σ 1,5 0, 2121
n 50
Podemos concluir que, con un nivel de significación del 5%, existen suficientes evidencias para decir que
el peso medio poblacional de los vellones de las llamas, luego de la esquila, es mayor a 4,5 Kg, en el
establecimiento en el que se han implementado prácticas de mejoramiento productivo. A partir de esto
podemos decir que el objetivo se ha cumplido.
2
d) Para estimar puntualmente la varianza, debemos calcular s . A partir de la tabla de frecuencias ob-
tenemos: ∑x * f
i
'
i i = 265, 75 ; ∑x i
'2
i * fi = 1420, 6375
∑ ( ) = 1 1420, 6375 − ( 265, 75) = 1 [1420, 6375 −1412, 4613] =
2
xi' * f i
1
2
s2 = ∑ xi * fi −
'2 i
n −1 i n 49 50 49
1
= 8,1762 ≅ 0,1669 ( Kg )
2
49
El intervalo de confianza del 95% correspondiente es:
( n − 1) s 2 49*0,1669 8,1781
= 0,1378 ( Kg )
2
L.I . = = =
χ 2
α χ 49;0,975
2
59,342
n −1;1−
2
( n − 1) s 2 49 *0,1669 8,1781
L.S . = = = = 0,3347 ( Kg )
2
χ α
2
χ 49;0,025
2
24, 433
n −1;
2
(Notar que como 49 no figura en la tabla de chi cuadrado, se utilizó 50).
Como conclusión, podemos decir que, con un nivel de confianza del 95%, podemos esperar que el in-
2 2
tervalo [0,1378 (Kg) ; 0,3347 (Kg) ] cubra la varianza poblacional del peso de los vellones esquilados
de las llamas del establecimiento, luego de introducir mejoras a nivel productivo.
A partir de esto podemos comparar con el valor histórico y, sin realizar la prueba de hipótesis corres-
pondiente, tomar una decisión al respecto de si la varianza se modificó o no. Para ello, debemos elevar
2 2
al cuadrado el desvío informado, quedando la varianza con un valor: 1,5 = 2,25 (Kg) .
Las hipótesis que se plantean son: H0: σ = 2,25 vs H1: σ ≠ 2,25 . El nivel de significación es del 5%, y
2 2
La pregunta concreta sería: ¿2,25 es un valor cubierto por el intervalo de confianza? Por lo que vemos,
2 2
no es así, dado que el intervalo es [0,1378 (Kg) ; 0,3347 (Kg) ]. A partir de esto tomamos como deci-
sión rechazar la hipótesis nula, al 5%, ya que hay evidencias suficientes para decir que la varianza po-
blacional del peso de los vellones, luego de la esquila, de las llamas del establecimiento en el que se
2
implementaron prácticas de mejoramiento productivo es distinto a 2,25 (Kg) .
A los fines prácticos, esto indica que en este sentido también se observa la mejora, dado que los pesos
tienen menor dispersión, y se logra mayor homogeneidad en ellos.
67
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
PROBLEMAS PROPUESTOS
EJERCICIO 1) Un lote de 25 animales recibe una ración durante un período de 60 días. A partir de las
ganancias de peso por animal, se calcula x = 420 g/día y s = 100 g/día. Al nivel de significación del 5%:
a) ¿es sustentable la hipótesis de que el tratamiento produce una ganancia media de peso mayor a 400
g/día?
b) ¿Cuál es el supuesto teórico que necesita cumplirse para que la prueba anterior sea válida?
c) Responda el punto a) suponiendo que σ = 90 g/día.
EJERCICIO 2) Para estudiar la respuesta de un nuevo método de medición de la concentración de una
sustancia química, se hacen 10 mediciones a una concentración fija. Los resultados son los siguientes:
3,04 3,88 3,53 2,98 3,09
3,38 3,12 3,56 3,71 3,43
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(una cola)
Concentr 10 3,37 0,31 0,91 0,4330
Considerando que el método anterior tiene varianza σ =1,20, decida si el nuevo método es mejor que el
2
anterior (α=0,05).
Indique:
a) Verificación del supuesto teórico: ................................................................................................................
b) Hipótesis de trabajo: .....................................................................................................................................
c) Hipótesis estadísticas: ..................................................................................................................................
d) Región crítica: ...............................................................................................................................................
e) Población en estudio: ...................................................................................................................................
EJERCICIO 3) Los investigadores desean probar si la proporción de pacientes cuya úlcera sanó después del
tratamiento con cimetidina supera el 50%. Para ello se administra la droga a 66 enfermos y luego de 6
semanas resultaron 43 pacientes curados. Probar la hipótesis de interés (α=0,05).
Indique sólo: variable en estudio, distribución de la misma, región crítica, decisión, interpretación biológica
del nivel de significación de la prueba, parámetro en estudio y su interpretación biológica acorde a la decisión
tomada.
EJERCICIO 5) Un profesor de estadística, al final del cuatrimestre, les pregunta a los alumnos si han
asistido a clases de consulta, en dicho cuatrimestre, codificando como 0 (no asistió) y 1 (asistió). Las res-
puestas codificadas reportadas por cada estudiante son las siguientes:
00001000000000101011001010101000
10001000001000100001100000000001
Se solicita:
a) Definir y clasificar la variable
b) Construir una tabla de frecuencias.
c) Si se define una variable que cuenta la cantidad de alumnos que utilizan los horarios de consulta por
comisión:
c.1) ¿Qué distribución tiene dicha variable? Interprete los parámetros.
68
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
c.2) Suponiendo que todas las comisiones tienen cupo de 64 alumnos, y en base a la información an-
terior, ¿cuál es la estimación puntual del parámetro “proporción de alumnos que no utilizan el horario de
consulta”?
c.3) Considerando la distribución de la variable con los valores de los parámetros dados por lo obte-
nido en c.2), se pide calcular la probabilidad de que, entre 20 alumnos elegidos al azar de esta población,
10 de ellos NO usen el horario de consulta.
c.4) Suponiendo que se abre una nueva comisión de sólo 20 alumnos y considerando la misma pro-
porción de éxitos que en el inciso anterior, ¿cuál es la probabilidad de que más de 15 no utilicen el hora-
rio de consulta? ¿cuál es la probabilidad que entre 5 y 15 lo utilicen?
c.5) La Docente “My Plantas” afirma que “al menos el 30% de los alumnos utilizan el horario de con-
sulta”, por lo cual propone no suspenderlo. Al nivel de significación del 5%, ¿qué puede decir de dicha
afirmación?
CUESTIONARIO
1) Indique la opción correcta: En una prueba de hipótesis, las hipótesis estadísticas son aseveraciones
acerca de:
a) el parámetro en estudio
b) el estimador del parámetro en estudio
c) la relación entre el estimador y el parámetro en estudio
2) Indique la opción correcta. En una prueba de hipótesis, las hipótesis estadísticas se determinan:
a) a partir de resultados muestrales
b) a partir de un supuesto del investigador formulado antes de tener resultados muestrales
c) a partir de un supuesto del investigador formulado después de tener resultados muestrales
4) Indique la opción correcta. En una prueba de hipótesis, el nivel de significación (α) es:
a) El error de tipo I
b) La probabilidad del error de tipo I
c) La probabilidad del error de tipo II
Problemas Complementarios
UNIDADES 1, 2 y 3
1.- Para estudiar el efecto teratogénico de los aminoglucósidos se emplearon 15 ratas preñadas. Por
estudios anteriores se conoce que el 5% de los casos tratados tiene crías con alteraciones neurológicas.
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) Calcular la probabilidad de que en dicho lote haya 7 ratas con alteraciones en sus crías.
d) Calcular la probabilidad de que en dicho lote haya más de 4 con alteraciones en sus crías.
e) Calcular la probabilidad de que en dicho lote haya 12 ratas sin alteraciones en las crías.
f) Calcular la E(X)
2.- Se tienen dos jaulas con conejos, la primera con 2 blancos y 4 grises, y la segunda con 5 blancos. Se
selecciona un conejo de la primera jaula al azar y se lo coloca en la segunda. Luego se selecciona un conejo
de la segunda jaula. ¿Cuál es la probabilidad de que el conejo de la segunda jaula sea blanco si:
a) el primero fue gris?
b) el primero fue blanco?
3.- Se desea probar el efecto letal de una toxina, que se inyecta a huevos embrionados. Luego del período
considerado suficiente para obtener el efecto tóxico, se hace el recuento de embriones muertos por cada
bandeja de la incubadora: 8 7 7 5 9 10 12 8 6 12 6 5 10 9 5 11 15 8
10 6 8 12 10 6 8 15 7 11 12 5 6 7 9 5 9 10
a) Indicar y clasificar la variable en estudio.
b) La unidad de observación es .................................................................
c) Ordenar los datos en una tabla de distribución de frecuencias.
d) Interpretar f4 , h2 , F3 , H6.
e) Construir los gráficos correspondientes.
f) Calcular las medidas de tendencia central y de dispersión.
g) Interprete el Boxplot correspondiente a los datos de esta muestra.
h) A partir de la información del punto anterior clasifique la distribución de la variable con respecto a la
simetría.
16
15
14
13
Embriones muertos
12
11
10
4.- a.- Clasificar las siguientes distribuciones según sean simétricas o no.
70
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
..............................................................................................................................
5.- Un especialista en ictiología tropical está interesado en calcular cuánto tiempo puede vivir cierto tipo de
pez en aguas con determinado porcentaje de toxicidad. Luego de una larga serie de experimentos llega a
concluir que la vida media de este tipo de pez alcanza los 90 días, con una desviación estándar de 20 días.
En apariencia, la distribución de los días sobrevividos es normal.
a) ¿Cuál es la probabilidad de que un pez viva más de 120 días?
b) ¿Cuál es la probabilidad de que un pez viva entre 90 y 125 días?
c) ¿Cuál es la probabilidad de que un pez viva menos que la media de vida?
d) Sin utilizar tabla, ¿entre qué valores de la variable quedan el 68% de los valores centrales?
6.- El 60% de los bovinos de un establecimiento está parasitado con Fasciola hepatica. Al revisar una
muestra de 12 animales,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) ¿Cuál es la probabilidad de encontrar a lo sumo 8 parasitados?
d) ¿Cuál es la probabilidad de encontrar 10 que no estén parasitados?
e) ¿Cuál es la probabilidad de encontrar 8 animales parasitados?
f) ¿Cuál es la probabilidad de encontrar por lo menos 8 animales parasitados?
g) Calcular la E(X)
7.- El Servicio de Sanidad Ambiental luego de realizar tareas de desinfección y desratización en el área
vecina a una nueva autopista, hizo el recuento de ratas muertas por manzana, en parte del área afectada:
20 15 30 18 15 18 21 27 19 12 19 18 26
18 19 18 19 21 19 19 20 20 20 26 15
a) Definir y clasificar la variable en estudio.
b) Clasifique como Verdadera o Falsa la siguiente oración: “La unidad de observación es una rata.”
Justifique su respuesta.
c) Ordenar los datos en una tabla de distribución de frecuencias.
d) Interpretar f5 , H2.
e) Construir los gráficos correspondientes.
f) Calcular las medidas de tendencia central y de dispersión.
g) Interprete el Boxplot correspondiente a los datos de esta muestra.
h) En base a la información de los puntos e) y f), clasifique la distribución de la variable con respecto a la
simetría.
71
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
31
26
Ratas muertas
21
16
11
8.- Al estudiar la influencia de la dieta en el contenido de hemoglobina en sangre, se tomaron tres grupos
de animales y se alimentaron con tres raciones distintas. Si se supone que las dietas tienen distinto
comportamiento en cuanto a la variabilidad del contenido de hemoglobina, ¿qué medida recomendaría para
determinar:
a.- la dieta que presenta mayor variación absoluta en el contenido de hemoglobina en sangre?
.......................................................................................................................
b.- la dieta que presenta mayor variación relativa en el contenido de hemoglobina en sangre?
.......................................................................................................................
Justificar la respuesta.
9.- En una población de animales, la presión sistólica en reposo se distribuye normalmente con µ = 115
mm de Hg y σ = 225 (mm de Hg) . Hallar la probabilidad de que un animal de esta población tenga:
2 2
72
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
12.- El 10% de los animales de un establecimiento pecuario dedicado a la cría de Aberdeen Angus no está
vacunado contra fiebre aftosa. Si se revisa un lote de 15 animales elegidos al azar,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) Calcular la probabilidad de que ninguno de los animales esté vacunado.
d) Calcular la probabilidad de que, como máximo, el 20% no esté vacunado,
e) Calcular la probabilidad de que, como mínimo, 7 animales no estén vacunados,
f) Calcular la probabilidad de que haya entre un 40% y un 80% de animales vacunados.
g) Si se envían 200 animales al frigorífico, ¿cuál es la cantidad esperada de no vacunados?
13.- Se comprobó que cabras nacidas de cruzamientos consanguíneos presentan un 30% de prognatismo
superior y la consecuente muerte del animal por imposibilidad de succionar en forma normal. Para 10
hembras preñadas en esas condiciones,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) ¿Qué probabilidad hay de que 5 tengan sus crías normales?
d) ¿Qué probabilidad hay de que 4 tengan sus crías no normales?
e) ¿Qué probabilidad hay de que entre 5 y 7 tengan sus crías normales?
14.- Si el número de casos favorables al suceso A es 40 y el número de casos favorables al suceso no A
es 80, entonces la probabilidad de ocurrencia del suceso A, será (Seleccione la respuesta correcta y
argumente brevemente):
a) p(A) = 0,50 c) p (A) = 0,33
b) p(A) = 0,67 d) p (A) = 0,05
15.- Calcular la probabilidad que corresponde al área comprendida entre los siguientes valores tabulares y
representarla gráficamente:
a) Zα = -1,96 y Zα = 2,20
b) t20 = -1,725 y t20 = 2,845
c) χ 302 = 16,79 y χ 302 = 50,89
16.- La edad en meses en que aparece la parvovirosis tiene distribución normal, siendo la media de 5,5,
con un desvío estándar de 2 meses. Al recibir en consulta un perro enfermo, ¿cuál es la probabilidad de que
tenga:
a) entre 2 y 7,5 meses?
b) más de 4 meses?
c) menos de año?
17.- La probabilidad de que Juan Sonrisa se levante malhumorado, en la semana, es 0,1 y cada vez que
comienza un nuevo día es independiente de lo que haya sucedido el día anterior.
73
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
74
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
21.- Sea X una variable aleatoria que representa el nivel normal de glucosa en sangre. Se supone que esa
variable X tiene una distribución aproximadamente normal, con media µ = 95mg/100ml y desviación estándar
σ = 6mg/100ml. ¿Para qué nivel de glucosa en sangre se puede tener un 90% de probabilidad de encontrar
un individuo que lo supere?
22.- Se comprobó que el 20% de los perros adultos que llegan a consulta por motivos diversos, dan
respuesta positiva al análisis de materia fecal, sin presentar síntomas clínicos de parasitosis. Calcular, sobre
una muestra de 14 animales atendidos en forma sucesiva durante una jornada,
a) Definir la variable en estudio.
b) ¿Verifica la variable las condiciones de Binomialidad?
c) Calcular la probabilidad de hallar como máximo 7 animales parasitados.
d) Calcular la probabilidad de hallar exactamente 5 animales parasitados.
e) Calcular la probabilidad de hallar que 10 o más no estén parasitados.
23.- Un camión jaula que transporta 10 Shorthorn, 5 Polled Hereford, y 7 Aberdeen Angus para participar
en la Exposición Rural de Palermo, sufre un accidente y queda tumbado en la ruta. Se escapan 2 animales.
Calcular la probabilidad de que:
a) sean de la misma raza,
b) uno de ellos sea Polled Hereford,
c) sean de dos razas distintas.
24.- Un experimentador suministró a un grupo de ovejas una hierba tóxica. Se sabe que el tiempo (en hs.)
2
que transcurre desde la ingestión hasta su muerte se distribuye aproximadamente N(µ=15;σ =2). ¿Cuánto
tiempo transcurrió hasta que murió el 90% de la ovejas?
25.- Sea la función de densidad: f(x) = 2 (x - 3), en [ 3 , 4 ] y
0 para x < 3
2
Encontrar: F( X) = x − 6x + 9 para 3 ≤ x ≤ 4
a) P(x ≤ 3,5) e) P(3 < x < 3,5) 1
para x > 4
b) P(x > 3,5) f) P(3,8 < x < 4)
c) P(x < 3) g) F(X) es la función de............
d) P(x < 5)
26.- Un criadero industrial de conejos obtiene individuos de raza Neocelandés con un peso que se
distribuye normalmente con media igual a 2020 g y desvío estándar de 78 g.
a.- ¿Cuál es la probabilidad de que el promedio de peso de los animales de una muestra de 20 supere los 2
kg?
b.- Si se desea mantener como futuros reproductores a los de peso mayor a 2150 g, ¿Cuál es la
probabilidad de que un individuo supere los 2150 g?
27.- Un veterinario sospecha que una nueva hierba introducida en la región donde él se desempeña
produce toxicidad en ovinos. En la primera parte del estudio decide alimentar a un grupo de ovinos con fardo
más el agregado de cierta cantidad de la hierba, para medir el
tiempo que transcurre desde la ingestión hasta la muerte (en Intervalos Frecuencias
días). Al terminar el experimento obtiene la siguiente tabla: 7 - 10 2
10 - 13 4
a) ¿Cuál es la variable en estudio? Clasificarla. 13 - 16 3
b) Calcular: media, mediana, modo y C.V. 16 - 19 6
c) El “9/15” de la columna de Hi significa que se observaron:
a. De los 15 ovinos, hasta 9 murieron entre las 13 y las 16 horas de haber ingerido el fardo y la hierba
tóxica.
b. De los 15 ovinos, 9 murieron entre las 13 y las 16 horas de haber ingerido el fardo y la hierba
tóxica.
c. De los 15 ovinos, 9 murieron entre las 7 y las 16 horas de haber ingerido el fardo y la hierba tóxica.
d) El veterinario aplica los conocimientos de fisiología ruminal, por lo que decide cambiar el fardo por
una pastura verde, lo que aumentaría en 45% el tiempo que transcurre desde la ingestión hasta la muerte de
los ovinos.
d.1.- ¿Cuál es el valor numérico de la media?
75
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
Sea la función de densidad: f(x) = 3x – 12x + 12 para 1< x ≤ 2, con función de distribución
2
28.-
0 para x ≤ 1
F ( x ) = x 3 − 6 x 2 + 12 x − 7 para 1 < x ≤ 2
1 para x > 2
Calcular:
a) P ( 1 ≤ x < 2 ) d) P ( 0 ≤ x ≤ 1,5 )
b) P ( x > 1,5 ) e) P ( 1,5 ≤ x < 3 )
c) P ( x ≤ 1,75 )
29.- En un lote de 20 animales hay 10 normales, 6 con defectos importantes y 4 con defectos leves. Se
escoge uno al azar. Calcular la probabilidad de que sea:
a) sin defectos;
b) sin defectos o con defectos leves.
Suponga que se escoge un segundo animal sin reposición del primero, calcular la probabilidad de que sea:
c) normal, pero sabiendo que el primero escogido fue normal;
d) con defectos importantes, sabiendo que el primero fue con defectos leves.
30.- Encontrar los valores de la variable en la distribución Ji-cuadrado que satisfagan:
a) P( χ15; p1 ≤ χ15 ≤ χ15;
2 2 2
p
2
) = 0,95 y área equivalente en las colas.
b) P( χ ≤ χ
2 2
18 18; p ) = 0,025
c) P( χ ≥χ
2 2
46 46; p ) = 0,95
31.- Los siguientes datos corresponden al dosaje de urea, en mg%, obtenidos en 25 perros sometidos a
pruebas renales en el período operatorio.
[ ; ) 16,5 – 21,9 21,9 – 27,3 27,3 – 32,7 32,7 – 38,1 38,1 – 43,5
Fi 2 6 12 21 25
a) Definir la variable en estudio y clasificarla.
b) La unidad de observación es ....................................................................
c) Completar la tabla de frecuencias.
d) Realizar los gráficos correspondientes.
e) Calcular medidas de posición.
f) Calcular medidas de dispersión.
g) Indicar cuál o cuales son las medidas más representativas. ¿Por qué?
h) ¿Qué porcentaje de perros tienen menos de 27,3 mg% de urea? NO UTILIZAR REGLA DE TRES
SIMPLE!
32.- Si X es una variable aleatoria discreta, tal que:
xi 0 1 2 3 4
p(xi) 0,1 0,15 0,35 0,25 ....
76
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
Núm. de caras 0 1 2 3 4 5
hi 0,038 0,144 0,342 0,287 0,164 …….
a) Definir y clasificar la variable considerada.
b) Completar el dato faltante en la tabla.
c) Hallar la función de distribución acumulada.
d) ¿En cuántas tiradas se obtuvieron más de dos caras?
e) Calcular el valor esperado del número de caras en una tirada.
34.- Se detallan a continuación los pesos de 30 pollos, luego de la aplicación de una nueva formulación de
una dieta comercial, elegidos al azar, expresados en Kg.
[ ; ) 1,3 – 1,9 1,9 – 2,5 2,5 – 3,1 3,1 – 3,7 3,7 – 4,3
hi 3/30 8/30 6/30 6/30 7/30
a) Completar la tabla de frecuencias.
b) Realizar los gráficos de frecuencias absolutas.
c) Calcular la media, la mediana y el modo. ¿Cómo clasifica la distribución de la variable?
d) Calcular el coeficiente de variación.
e) En el establecimiento informan que la balanza no estaba calibrada, por lo que los datos deben
aumentarse 0,5 Kg. ¿Cuánto vale la media del peso de los pollos al hacer esta modificación?
Fórmula empleada Reemplazo numérico Resultado
35.- Suponiendo que la altura de los estudiantes de un colegio se distribuye normalmente, con media 1,75
m y desvío estándar 0,25 m.
a.- Calcular la probabilidad de que el promedio de altura, para una muestra de 36 individuos, sea: a.1.-
mayor que 1,67 m, a.2.- entre 1,65 y 1,80 m.
b.- Cuántos individuos de la muestra se espera que tengan:
b.1.- altura mayor a 1,85 m, b.2.- entre 1,65 y 180 m.
37.- En un estudio sobre tumores benignos y malignos en felinos se analizaron todos los casos que se
presentaron en el último año en el Hospital Escuela de la Facultad resultando:
Suponga que se seleccionan 2 felinos del grupo antes Estado de malignidad
citado para realizar ciertos estudios. benigno maligno
Lugar Cabeza 64 45
del Cara 21 18
¿Cuál es la probabilidad de que: Tumor Cuerpo 36 24
a.- ambos tengan tumores malignos?
Planteo simbólico Sustitución de valores Resultado
77
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
b.- el segundo tenga tumor maligno sabiendo que el primero tiene tumor benigno
Planteo simbólico Sustitución de valores Resultado
d.- el primero tenga un tumor benigno en la cara y el segundo un tumor maligno en el cuerpo.
Planteo simbólico Sustitución de valores Resultado
38.- Un criador de perros presenta tres de sus mejores perros en una competencia. Sean los eventos:
A1: el perro 1 está entre los tres primeros
A2: el perro 2 está entre los tres primeros
A3: el perro 3 está entre los tres primeros
Suponga que los eventos son independientes y que p(A1) = p (A2) = p (A3)= 0,1
Encuentre la probabilidad de que:
a) ninguno esté entre los tres primeros
b) por lo menos 1 esté entre los tres primeros
c) por lo menos 2 estén entre los tres primeros
d) todos estén entre los tres primeros
39.- Al personal técnico y profesional de un hospital se lo clasificó según la tarea que realiza y la edad,
obteniéndose la siguiente tabla:
Edad
Hasta 25 Desde 26 a 35 Mayor a 35 total
Médicos 0 70 120 190
Enfermeros 145 520 195 860
Tarea
Laboratoristas 65 42 33 140
Otras 35 260 15 310
Total 245 892 363 1500
a.- Del personal del hospital se elige una persona al azar. Aplicar la teoría clásica de probabilidades para
hallar la probabilidad de que:
a.1.- sea médico y tenga más de 35 años
a.2.- tenga más de 35 años
a.3.- sea médico sabiendo que tiene más de 35 años
b.- ¿Los sucesos “ser médico” y “tener más de 35 años” son independientes? ¿Por qué?
40.- Investigadores que han conducido un estudio de habitación en una cierta ciudad, examinan todas las
casas ubicadas en manzanas seleccionadas aleatoriamente. ¿Constituye esto una muestra simple aleatoria
de las casas de la ciudad?
41.- Para analizar el estado civil de los habitantes de una gran ciudad se tomó un grupo de 500 familias e
individuos solteros. ¿Le parece correcto seleccionar a esas 500 familias e individuos solteros, sólo de la zona
residencial de la ciudad? ¿Por qué?
78
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
UNIDADES 4 y 5
1.- Se toma una muestra de 25 cerdos en un núcleo de selección. A cada uno se le mide el volumen del
eyaculado, y con los datos se obtuvieron: x = 180 ml y s = 50 ml . Estimar la media y la varianza pobla-
2 2
cional mediante intervalos de confianza del 95%, sabiendo que la variable tiene distribución normal.
2.- En un cultivo de mejillón a mar abierto, se eligieron al azar 25 mejillones y se los pesó individualmente.
Esta variable, peso, tiene distribución aproximadamente normal. El peso medio fue de 16 g, y el desvío
estándar de 5 g. Con una confianza del 95%:
a.- Indicar la estimación puntual del peso medio de la población cultivada y con una confianza del 95%.
b.- Calcular el número de individuos necesarios para estimar el peso medio poblacional con un margen de
error de 1,5 g y con una confianza del 95%.
3.- Se tomó una muestra de 16 quesos de la producción del mes de agosto en el establecimiento CRUP SA,
con el objetivo de estimar el peso medio. Los quesos fueron pesados individualmente, y con los datos
obtenidos se estimó el peso medio en 15 kg y el CV en 10%. Suponga que la variable se distribuye
aproximadamente normal.
a) Definir la variable en estudio y la población de interés.
b) Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c) Indicar los valores tabulares empleados para el LI y el LS.
d) Estimar el peso medio poblacional mediante un intervalo de confianza del 95% y concluir.
4.- Con datos de una muestra de 25 pollos se estimó la varianza poblacional del peso individual de pollos,
2 2
obteniéndose el siguiente intervalo de confianza del 95%: (0,2342 g ; 0,7432 g ). ¿Cuál es el valor de la
estimación de la varianza?
5.- Se desea estimar la varianza del peso individual en una línea de conejos para carne con un coeficiente
de confianza del 95%. A partir de una muestra de 30 conejos se obtuvo una media de 2,40 kg y un desvío
estándar de 0,37 kg.
a.- Estimar la varianza poblacional del peso individual mediante un intervalo de confianza del 95% y concluir.
b.- Indicar la variable aleatoria empleada como pivotal expresando su distribución.
c.- Indicar los valores tabulares empleados para el LI y el LS.
d.- Definir la variable en estudio y la población de interés.
6.- En una muestra de 31 adolescentes que se prestaron como sujetos para un estudio inmunológico, una
variable de interés fue la prueba del diámetro de reacción de la piel a un antígeno. La media y la desviación
estándar obtenidas fueron, respectivamente, 21 y 11mm. ¿Es posible concluir a partir de estos datos y con
un nivel del 5%, que la media de la población es menor que 30mm?
Indique sólo: variable en estudio, supuesto de distribución requerido para ésta, hipótesis de trabajo, hipó-
tesis estadísticas, región crítica y población en estudio.
7.- En la estimación de la media poblacional de una variable con distribución normal, mediante un intervalo
de confianza del 95% se obtuvieron los siguientes límites: LI = 450 y LS = 550. Si dichos valores se
calcularon con una muestra de 30 elementos, determinar el valor de la media y de la varianza utilizados para
determinar dicho intervalo si σ es desconocida.
2
8.- Se tomó una muestra aleatoria de 16 informes de urgencias de los archivos de un servicio de
ambulancias. De ella se obtuvo que el tiempo medio en que las ambulancias llegaban a destino era de 13
minutos. Suponiendo que los tiempos de llegada de las ambulancias siguen una distribución normal con
2
varianza 9min , ¿es posible concluir, a un nivel del 5%, que la media de la población es mayor a 10 min?
Indique sólo: variable en estudio, hipótesis estadísticas, regla de decisión, decisión e interpretación
biológica del parámetro en estudio acorde a la decisión tomada.
9.- Un establecimiento avícola cuenta con 5000 gallinas ponedoras. A los fines de la organización, se desea
saber qué tamaño de muestra será necesario para estimar la media poblacional de huevos puestos por
semana, con un nivel de confianza del 95%, si se desea admitir un error no mayor a 0,8 huevos. En un
estudio previo se analizaron 28 gallinas y se obtuvo un promedio individual de 5,4 huevos por semana con
una desviación estándar de 1,8 huevos por semana. Suponiendo que la variable se distribuye noemalmente:
a.- Definir la variable en estudio.
b.- Hallar el tamaño de muestra necesario para satisfacer el nivel de confianza y el error a tolerar.
10.- Se supone que el nivel de proteínas totales en plasma de bovinos adultos se distribuye
aproximadamente normal. ¿Qué tamaño de muestra se tomará si se desea estimar el nivel medio de
79
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
proteínas totales, mediante un intervalo de confianza del 95%; con una semiamplitud de 0,7 g/ml; sabiendo
que en una muestra piloto de 10 bovinos, es obtuvo x = 9,7 g/ml y s = 1,303 g/ml?
11.- En una muestra aleatoria de 60 ovejas de una zona de la provincia de Santa Cruz, el 20% manifiesta
signos de "cabeza grande". ¿Cuál sería el margen de error de una estimación del 95% para la proporción de
ovejas con esta característica?
12.- Si en el ejercicio 1 (pág. 42) se deseara disminuir un 50% el margen de error en la estimación de µ
manteniendo el nivel de confianza:
a) ¿Cuál debería ser el tamaño de la muestra?
b) ¿Cuál sería el tamaño adecuado si Ud. sabe que el núcleo de selección cuenta con una población de 450
machos?
13.- Se compraron lechones para engorde en condiciones de crianza intensiva. Por compras anteriores,
2
se sabe que la varianza del peso es de 3600 g . ¿Cuántos lechones habría que tomar en una muestra
para estimar el peso promedio del lote con una confianza del 95% y un error no mayor a 20 g? Suponga
que la variable se distribuye aproximadamente normal.
14.- En un criadero industrial de conejos de Angora, se quiere saber con qué probabilidad el largo
promedio del pelo es de a lo sumo 5 cm, en muestras de tamaño 30.
Si bien se desconoce la distribución del largo del pelo de un conejo de Angora, se sabe que tiene un
promedio de 4,5 cm y un desvío de 2 cm. Justifique el procedimiento empleado.
15.- Los siguientes datos son los consumos de oxígeno (en ml) durante la incubación, de una muestra de
15 suspensiones celulares:
14,0 14,1 14,5 13,2 11,2 14,0 14,1 12,2
11,1 13,7 13,2 16,0 12,8 14,4 12,9
¿Proporcionan estos datos suficiente evidencia, a un nivel del 5%, de que la media de la población es de
al menos 12ml?
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
ConsumoOx 15 13,43 1,28 0,95 0,6693
Indique: verificación del supuesto requerido a la variable, hipótesis estadísticas, región crítica, regla de
decisión, decisión y población en estudio.
16.- Un grupo de 31 animales, elegidos al azar, recibe una ración por un período de dos semanas. Con los
aumentos de peso se obtuvo: x = 420g y s = 60g. ¿Qué tamaño de muestra se debe tomar si se desea un
margen de error que sea a lo sumo de 10g, para estimar el aumento medio de peso con una confianza de
95%?
17.- En una granja de pollos se desea experimentar con una nueva dieta de engorde. Si se sabe que el
desvío estándar del aumento de peso individual en un mes es igual a 60 g, ¿qué tamaño de muestra se debe
escoger para que la estimación del aumento medio de peso no contenga un margen de error mayor a 16 g,
con una confianza del 95%? Suponga que la variable se distribuye aproximadamente normal.
18.- De una población de vacas lecheras se obtiene una muestra de 1000 vacas que se someten a la
prueba de tuberculina en la tabla del cuello, resultando 90 vacas con resultado positivo. ¿Concuerda esta
información con la hipótesis de que la proporción (P) de positivos es 10% con un nivel de significación del
5%?
19.- De una población de bovinos se seleccionó una muestra de 25. Sesenta días después de vacunados
contra la fiebre aftosa, fueron sangrados y se determinó el título de anticuerpos contra esta enfermedad
mediante la técnica de seroneutralización en tubos (cultivo celular), obteniéndose una media de 2,3 y una
varianza de 0,64. ¿Confirman estos valores que el título promedio de anticuerpos poblacionales es de 2,5?
Suponga que la variable se distribuye aproximadamente normal y que α = 0,05.
20.- Por una experiencia se ha determinado que los valores de capacidad de cierto tipo de ampollas para
envasar vacunas sigue una distribución normal con media 10ml y desviación estándar 0,1 ml. Luego de dos
años de uso continuo, se toma una muestra de 25 ampollas, obteniéndose una media de 9 ml y una
desviación estándar de 0,2 ml. ¿Puede considerarse, con un nivel de significación del 5%, que se mantiene
la variabilidad luego de 2 años?
21.- Se ha establecido que la media y la desviación estándar de la longitud del cráneo humano son de
20,5cm y 3,3cm, respectivamente. Suponga que un explorador descubre una isla, en donde los nativos han
80
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
estado aislados del resto del mundo. Una muestra de 25 de estos nativos indica una longitud media del
cráneo de 24,6cm. ¿Tienen los investigadores suficiente evidencia para suponer que la longitud media del
cráneo de los habitantes de la isla es superior? Use α = 0,05 y suponga que la variable se distribuye
aproximadamente normal.
22.- Se estudió el tiempo al primer amamantamiento en 16 cerdos recién nacidos, obteniéndose los
siguientes resultados(en minutos):
7,8 8,0 9,0 10,0 10,9 8,5 9,5 7,0
6,3 8,7 9,1 10,3 9,3 9,7 9,9 9,8
Σ x i = 143,8 Σ x 2i = 1315,06
¿Concuerdan estos resultados con la afirmación de que la desviación estándar del tiempo al primer
amamantamiento es mayor a 1,1 min, con un nivel de significación del 5%?
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p (una cola)
Tiempo 16 8,99 1,23 0,95 0,6655
23.- Por razones económicas sólo se continuará fabricando determinado medicamento si es utilizado por
más del 25% de los establecimientos hospitalarios. Para esto se realizó un estudio sobre 150
establecimientos de los que 40 respondieron que lo usaban. ¿Qué aconsejaría al fabricante, al nivel del 5%?
24.- La longitud de la antena de una población de insectos de la especie X se distribuye normalmente con
media 3,2 cm y desvío estándar 1,8 cm. De una muestra aleatoria de 16 insectos tomados de la población se
obtuvo un promedio de 2,3 cm para la longitud de antena. ¿Puede suponerse, con un nivel de significación
del 5%, que hubo una disminución en la longitud promedio de la antena?
25.- En una muestra de 50 pollitos tratados con una vacuna, se encontraron 10 muertos, ¿cuál es el
número adecuado de pollitos para estimar la proporción de muertos con un error de hasta 10% y una
confianza del 95%?
26.- Al estimar el parámetro poblacional µ, con un nivel de confianza del 95% y una muestra de tamaño 20,
se tienen las siguientes alternativas:
s x
A 10 100
B 11 110
C 9 90
¿En cuál de ellas se tendrá un mayor margen de error en la estimación? Considere que provienen de
variables con distribución normal. Demuestre su respuesta.
27.- Se realizó un estudio para analizar la efectividad de un nuevo medicamento sobre cierta anomalía en
embriones de pollo. Se inyectaron 50 huevos fertilizados y en el vigésimo día de incubación se observó que
12 de ellos presentaban anomalía.
a.- Estimar la proporción poblacional de embriones sanos mediante un intervalo de confianza del 95%.
b.- ¿Qué cantidad de huevos habría que haber inyectado para que, con un nivel de confianza del 95%, se
pudiera estimar la proporción poblacional de embriones sanos de modo que el margen de error no sea mayor
que 0,1?
28.- Un laboratorio investiga sobre el consumo diario de aves en crecimiento. Con tal motivo se desea
determinar el tamaño de la muestra a tomar para que la semiamplitud de la estimación del consumo medio
diario no supere 5 g, suponiendo que se decide trabajar con una confianza del 95% y que en una muestra
2
piloto de 30 aves se obtuvo un promedio de 100 g y una varianza de 490 g .
29.- Se examinó una muestra de 100 empleados de un hospital que habían estado en contacto con sangre
o sus derivados, para averiguar si presentaban evidencia serológica de hepatitis B. Se encontró que en 23 de
ellos se obtuvieron resultados positivos. ¿Es posible concluir a partir de estos datos que la proporción de
individuos que presentaron resultados positivos es a lo sumo del 15%? (α=0.01)
Indique: variable en estudio, supuesto de distribución requerido para ésta, hipótesis de trabajo, hipótesis
estadísticas, región crítica, decisión, interpretación biológica del parámetro en estudio acorde a la decisión
tomada y población.
30.- Como parte de un proyecto de investigación, se seleccionó una muestra de 25 niños nacidos en los
hospitales de un área metropolitana. La desviación estándar de los pesos de los niños obtenida fue de
81
Elementos de Estadística 2011 Fac. Cs. Veterinarias (U. B. A.)
150 g. ¿Proporcionan estos datos la evidencia suficiente para afirmar que el desvío poblacional es
superior a 100g? Suponga que la variable se distribuye aproximadamente normal y que α = 0,05.
Indique: variable en estudio, hipótesis estadísticas, región crítica, decisión, interpretación biológica del
parámetro en estudio acorde a la decisión tomada y respuesta a la pregunta planteada.
31.- Un establecimiento dedicado a la elaboración de alimentos balanceados para aves, afirma que su
producto, si bien aumenta el peso promedio de las aves, no influye en la variabilidad del mismo. En una
muestra de 16 aves que habían consumido el alimento se obtuvo un peso promedio de 85g con una
2
varianza de 225g . ¿Se puede suponer que la afirmación del establecimiento en cuanto a la variabilidad
2
es correcta, teniendo como dato que la varianza del peso de las aves es de 200g ? (α=0.05). Suponiendo
que la variable se distribuye normalmente.
Indique: hipótesis de trabajo, hipótesis estadísticas, región crítica, decisión, interpretación del nivel de
significación y población en estudio.
32.- Antes del inicio de un programa de inmunización contra la rubéola realizado en un área metropolitana,
una encuesta reveló que 150 integrantes de una muestra de 500 niños de primaria habían sido inmunizados
contra esta enfermedad. ¿Son compatibles estos datos con el punto de vista de que el 50% de los niños de
primaria de dicha área habían sido inmunizados contra la rubéola? (α=0,10)
Indique: hipótesis de trabajo, hipótesis estadísticas, región crítica, decisión, interpretación del nivel de
significación y población en estudio.
33.- El espesor de la la cáscara de huevo es una variable aleatoria que, en una determinada raza de
ponedoras, tiene una media de 0,20mm y un desvío estándar de 0,08mm.
a) ¿Cuál es la probabilidad de que el espesor medio sea de al menos 0,18mm si se toma una muestra
de 100 huevos?
b) Indicar la variable en estudio
c) ¿En qué supuestos se basó para resolver el problema?
34.- Se sabe luego de consumir un alimento balanceado, las aves de un establecimiento presentan un
2
peso medio de 85g y una varianza de 225g . En una muestra de 64 aves
a) Hallar la probabilidad de que tengan un peso medio que esté entre 80 y 90g.
b) ¿Cuál es el peso medio que superan el 95% de las aves?
35.- ¿Existe alguna diferencia entre el cálculo de probabilidades de los ejercicios anteriores con
respecto a los resueltos en la Unidad 3 también referidos al promedio? Si su respuesta es afirmativa, ¿en
qué consiste?
82