Professional Documents
Culture Documents
PDF Guia de Estadistica General 2021 Compress
PDF Guia de Estadistica General 2021 Compress
Estadística
General
Área de Estadística
Lima – Perú
2021
Lima-Perú 610-6400
2
Vicerector Académico
Joyce del Pino
Director Departamento Cursos Básicos
Mg. Sarita Bocanegra Gonzales
Coordinador del Área de Matemática, Física y Estadística
Mg. Sarita Bocanegra Gonzales
Responsable del Curso de Estadística General
3
CONTENIDO
UNIDAD 1
Capítulo 1: Conceptos 6
UNIDAD 2
UNIDAD 3
Capítulo 10: Distr
istrib
ibuc
ució
iónn Norma
ormall 72
Capítulo 11: Distribución Muestral 83
UNIDAD 4
4
5
Elaboración propia
6
CONCEPTOS ESTADÍSTICOS
Estadística. -
Es una ciencia que nos ofrece un conjunto de métodos y técnicas para: recolectar, clasificar,
procesar, presentar, analizar e interpretar un conjunto de datos, con la finalidad de conocer el
problema, obtener algunas conclusiones y finalmente tomar
tomar decisiones.
Es una herramienta fundamental para realizar investigación científica.
Estadística Descriptiva. -
Es un conjunto de métodos que nos permiten describir y resumir los datos observados mediante
gráficos o cuadros y realizando algunos cálculos de indicadores.
Estadística Inferencial. -
Es un conjunto de métodos que nos permiten hacer generalizaciones o inferencias acerca de una
población a partir de lo observado
observado en una muestra.
Población. -
Es la totalidad de individuos o de elementos (empresas, personas, objetos etc.) que cumplen o
satisfacen la o las características en estudio.
Por el número de elementos que la componen la población se clasifica en finita e infinita. La
población es finita
fi nita si tiene un número determinado de elementos en caso contrario es infinita. En la
práctica una población finita con un gran número de elementos se considera como una población
infinita; por otro lado el tamaño de una población va a depender del objetivo trazado por el
investigador.
Muestra. -
Es
Está
tá co
cons
nstit
titui
uida
da po
porr un
unaa part
partee de los
los indiv
individu
iduos
os o elem
elemenento
toss que
que comp
compon
onen
en la pobl
poblac
ació
ión,
n,
seleccionada de acuerdo a cierta técnica con el fin de obtener información acerca de la población, de
la cual proviene. La muestra debe ser seleccionada de manera que sea representativa, es decir tenga
características similares a las de su población.
Parámetro.-
Es una medida descriptiva que resume una característica de la población, es decir constituye el valor
real, verdadero; su cálculo implica utilizar toda la información contenida en la población; entre los
más conocidos tenemos:
La media poblacional ( μ )
La varianza poblacional ( σ 2 )
La proporción poblacional ( ) etc.
Estadístico.-
.- Es
Es una medida que describe una característica de la muestra, se calcula a partir de los
datos observados en la muestra; es decir constituyen los estimadores de cada uno de sus respectivos
parámetros; entre estos tenemos:
tenemos:
La media muestral ( X )
La varianza muestral ( S2 )
La proporción muestral ( p )
Variable.-
.- Es una característica definida en la población de acuerdo a cierto interés en una
investigación estadística, que puede tomar dos o más valores (cualidades o números). Puede ser una
característica medible
civil, calidad, color, (peso,
sexo etc). precio, ingresos,
Se representa contemperatura etc) o unaX,cualidad
las letras mayúsculas Y, Z. no medible (estado
7
VARIABLE CATEGORIAS
Color Azul, rojo, blanco, verde, negro, amarillo etc.
Estado Civil Soltero, casado, conviviente, viudo, divorciado.
Distrito Lima, La Victoria, Breña, Miraflores, San Isidro, Lince etc
Género Masculino, femenino
Calidad Buena, mala.
Morosidad No Moroso, moroso
Banco donde le depositan Interbank, Pichincha, Scotiabank
su sueldo:
VARIABLES ORDINAL
VARIABLES ORDINALES ES. - Son aquellas en donde existe un orden preestablecido entre las
categorías de la variable.
Ejemplos:
VARIABLE CATEGORÏAS
Gra
rado
do de In
Instru
strucc
cció
iónn Prim
imaaria,
ria, Secun
ecunddaria
aria,, Sup
Super
erio
ior
r
Orden de Mérito Primero, Segundo, Tercero etc.
Nivel Socioeconómico Bajo, Medio, Alto etc.
También podemos considerar como variables ordinales por ejemplo el grado de satisfacción de
un servicio
servicio 5(1= Muy
Satisfecho; = Mu
Muyy insat
insatisfec
isfecho;
satisfecho) oho; 2 = elInsat
también Insatisfec
isfecho;
grado deho; 3 = Ni etc.
depresión, sa
satisfec
tisfecho
ho ni insa
insatisfe
tisfecho;
cho; 4 =
VARIABLES DISCRETAS
Son aquellas cuyos valores resultan como consecuencia de conteos, y por lo tanto solo pueden
asumir valores enteros positivos, incluido el cero. Ejemplos
Número de empresas, número de hospitales, número de trabajadores, número de comprobantes
de pago, número de máquinas, número de conservas etc.
VARIABLES CONTINUAS
8
Son aqu
aquell
ellas
as cuy
cuyos
os val
valore
oress se obt
obtien
ienen
en por med
mediciición,
ón, pue
pueden
den asu
asumir
mir valo
valores
res dec
decima
imales
les..
Ejemplos:
Los sueldos, el precio, la temperatura, el volumen, el tiempo, el peso, la estatura, la presión etc.
a) ESCALA NOMINAL Se tiene una escala nominal si dos o más valores de una variable
sólo permiten percibir las diferencias o semejanzas de las unidades estadísticas que se midan Tales
valores son como etiquetas que identifican a las unidades estadísticas y las hacen iguales o diferentes
entre sí. Ejemplo: Color de ojos, género, Especialidad de los estudiantes.
b) ESCALA ORDINAL Cuando los datos pueden acomodarse en algún orden, las diferencias entre
los datos carecen de significado: A es más alto que B, pero no se puede restar A menos B.
Ejemplo: Grado de Instrucción, grado de satisfacción de los clientes.
d) ESCALA DE RAZON Se parece al nivel intervalo con la diferencia que el cero implica ausencia
d)
de la propiedad que se estudia. Ejemplo: Peso, precio, Número de hijos
a) VAR
VARIABL
IABLE
E DEPE
DEPENDIE
NDIENTE
NTE
La variable dependiente es aquella determinada por el investigador para estudiarla en función de
otras variables denominadas independientes. Generalmente se simboliza esta variable con la letra Y.
b) VAR
VARIABL
IABLE
E INDEPENDI
INDEPENDIENTE
ENTE
- El co
costo
sto de pproduc
roducción
ción de uunn ar
artículo
tículo,, det
determin
erminaa su precio de vventa.
enta. En es
este
te ca
caso
so las variab
variables
les
son:
Costo de producción = X Precio de venta = Y
Podemos notar que el rol que asuma una determinada variable como dependiente o independiente en
una investigación, va a depender con qué variable se le asocie.
E J ER CI C IO S P R OP U ES T OS
9
a. El año pa
pasado
sado eenn la UCS
UCSUR
UR el pu
puntaje
ntaje ppromed
romedio
io del ex
examen
amen de aadmis
dmisión
ión fue 885.
5.
b. El Dr. García, un ecólogo, informó que en cierto río del oriente peruano, la carne de los
peces contienen un promedio de 300 unidades de mercur
mercurio.
io.
c. La comp
compañía
añía “R
“RM”
M” pre
predijo
dijo qu
quién
ién ser
sería
ía el gan
ganador
ador en uuna
na elec
elección
ción pr
preside
esidencial
ncial ddespué
espuéss de
conocer los resultados de las votaciones de 25 mesas de sufragio de las 2 800 mesas que
hubo en total.
a. Indiquedeelservicio
4. Tiempo tipo de variable usando lade
de los empleados clasificación
una empresa.según su medición:
b. Número de cheques
cheques girados por una empres
empresaa diariamente en un mes.
10
6. Utilice los términos que aparecen en la siguiente tabla, para asociarlos a las definiciones que
aparecen a continuación:
Variable cualitava
2 ordinal Es un subconjunto de la población.
5 Pará
Paráme
metr
tro
o Gr
Grad
ado
o acad
académ
émic
ico
o de lo
loss doce
docent
ntes
es de la Fa
Facu
cult
ltad
ad de Cont
Contab
abil
ilid
idad
ad..
Estadísca Método que generaliza resultados para una población analizando una
6 Inerencial parte de ella.
Variable cuantava
7 discreta Valor que resulta de resumir los datos de una muestra.
11
PRESENTACIÓN DE DATOS
Luego de la recolección de información se debe clasificar u organizar los datos para realizar el
análisis y la interpretación de los resultados. Para facilitar este procedimiento se deberá agrupar la
información en categorías o clases.
Una forma sencilla de agrupar los datos es construyendo tablas de distribución de frecuencias.
Presentación de tablas:
Todo gráfico debe presentar la siguiente
estructura:
1. Numeración
2. Título
3. Contenido
4. Fuente
12
Ejemplo:
El restaurante “Don Tito” busca evaluar el grado de satisfacción de sus clientes: donde B es
Bueno, R es Regular, D es Deficiente. Se tienen los resultados en el siguiente cuadro:
R R R R B B D D B R R
R R R D D R R B R R D
R R R R R R R R D D B
Interpretación: De los 23 comensales encuestados del restaurante “Don Tito” más de la mitad
(65%) manifestaron estar regularmente satisfechos con los servicios y otro porcentaje menor (4% )
dijeron estar bien satisfechos.
13
Ejemplo:
20 22 21 19 18 18 20 22 20 19 20 19
23 19 18 20 21 22 19 20 18 23 20 21
19 22 23 20 21 19 22 18 19 20 21 24
21 20 21 20 24 23 20 21 19 20 22 21
21 22
a) Pres
Presentar
entar dicho
dichoss da
datos
tos en uuna
na ttabla
abla de fr
frecuen
ecuencias
cias
b) Interpretar f1 , F4, h3
h3%
% y H2%
Solución:
En este casoo notamos que la variable edad, apenas está tomando solamente siete
este cas
valores distintos que van desde 18 hasta 24
Variable: Xi
Frecuencias Absolutas: fi
Frecuencias Absolutas Acumuladas: Fi
Frecuencias Relativas: hi
Frecuencias Relativas Acumuladas:
Acumuladas: Hi
18 5 5 10.00 10.00
19 9 14 18.00 28.00
20 13 27 26.00 54.00
21 10 37 20.00 74.00
22 7 44 14.00 88.00
23 4 48 8.00 96.00
24 2 50 4.00 100.00
Total 50 100.00
Interpretación: Se observa que el 26% de los estudiantes tienen 20 años de edad mientras que solo
un 4% tienen 24 años. También podemos observar que el 54% de los estudiantes tiene una edad
máxima de 20 años.
14
f1=5
Interpretación: Hay 5 estudiantes de los 50 que tienen 18 años.
F4=37
Interpretación: Hay 37 estudiantes de los 50 que tienen como máximo 21 años.
h3%=26%
Interpretación: El 26% de los estudiantes tienen una edad de 20 años.
H2%=28%
Interpretación: El 28% de los estudiantes tienen como máximo 19 años
b) Tabla de frecuencias para Datos Agrupados.- Es apropiada cuando los valores distintos
que toma la variable es muy numeroso. Se siguen los siguientes pasos:
1) Calcu
Calcular
lar el rang
rangoo de la varia
variable:
ble: R = Valo
Valorr máximo – V Valor
alor mín
mínimo
imo
2) Elegir el número de intervalos de clases: K se sugiere entre 5 y 10 inclusive
3) Calcu
Calcular
lar la ampl
amplitud
itud de los iinterv
ntervalos
alos de cla
clases:
ses: C
C= R cuy
cuyoo ccoci
ocient
entee en lo po
posib
sible
le deb
deberá
erá ser exa
exacto
cto,, caso
caso con
contra
trario
rio deb
deberá
erá
K trab
trabaj
ajar
arse
se con
con los
los llam
llamad
ados
os “exc
“exces
esos
os””
Ejemplo 1:
Como control de la ética publicitaria, se requiere que el rendimiento en millas/galón, de gasolina esté
basado en un buen número de pruebas efectuadas en diversas condiciones. Al tomar una muestra de
50 automóviles se registraron las siguientes observaciones en millas por galón
35.6 27.9 29.3 31.8 22.5 34.2 32.7 26.5 26.4 31.0 31.6 28.0 33.7
32.0 28.5 27.5 29.8 34.2 31.2 28.7 30.0 28.7 33.2 30.5 27.9 31.2
29.5 28.7 23.0 30.1 30.5 31.3 24.9 26.8 29.9 28.7 30.4 31.3 32.7
30.3 33.5 30.5 30.6 35.1 28.6 30.1 30.3 29.6 31.4 32.4
Solución:
Rango: R
Si k = 6 C = 13.1 = 2.1833…………
2.2
6
Si k = 7 C = 13.1 = 1.8714…………
1.9
7
Exceso E = (7 x 1.9) – 13.1 = 13.3 – 13.1 = 0.2
15
Si k = 8 C = 13.1 = 1.6375
1.7
8
Eligie
igienndo K=6 por tener el menor exceso
Rendimiento Xi fi Fi hi Hi
(millas/galón)
22.5 - 24.7 23.6 2 2 0.04 0.04
24.7 - 26.9 25.8 4 6 0.08 0.12
26.9 - 29.1 28.0 10 16 0.20 0.32
29.1 - 31.3 30.2 20 36 0.40 0.72
31.3 - 33.5 32.4 9 45 0.18 0.90
33.5 - 35.7 34.6 5 50 0.10 1.00
T O T A L 50 1.00
Se observa que el 60% de los automó
automóviles
viles tienen un rendimiento entre aproximadamente 27 y 31.3
millas por galón de gasolina.
Ejemplo 2
61 50 65 70 45 60 80 65 60 65 64 54 65
67 48 64 56 60 61 62 62 57 75 53 58 59
56 54 67 68 60 63 56 53 61 62 69 70 44
47 65 56 57 58 55 51 43 79 72 48
Solución
R = 80 – 43 = 37
Si k = 6 C = 37 = 6.1666…………
7
6
Exceso E = (6 x 7) – 37 = 42 - 37 = 5
Si k = 7 C = 37 = 5.2857………..
6
7
16
Exceso E = (7 x 6) – 37 = 42 - 37 = 5
Si k = 8 C = 37 = 4.625
5
8
Exceso E = (8 x 5) – 37 = 40 - 37 = 3
Eligie
igienndo K =8 por tener el menor exceso
Puntaje Xi fi Fi hi Hi
42 – 46 44 3 3 0.06 0.06
47 – 51 49 5 8 0.1 0.16
52 – 56 54 9 17 0.18 0.34
57 – 61 59 12 29 0.24 0.58
62 – 66 64 11 40 0.22 0.8
67 – 71 69 6 46 0.12 0.92
72 – 76 74 2 48 0.04 0.96
77 - 81 79 2 50 0.04 1
Total 50 1
Poco menos de la mitad de los estudiantes (46%) han obtenido entre 57 y 66 puntos.
Ejemplo 1.- Se realizó un estudio para determinar la cantidad de personas que obtienen un empleo.
La siguiente tabla incluye datos de 400 sujetos seleccionados al azar:
Anuncios clasificados 56 14
Empresas de búsqueda de ejecutivos 44 11
Contactos profesionales 280 70
Correo masivo 20 5
Total 400 100
17
Fuentes de Empleo
100 100
80 80
e
j e
j
a a
t 60 60 t
n n
e e
c c
r r
o 40 40 o
P P
20 20
0 0
Fuentes de Empleo
19
EJERCICIOS PROPUESTOS
1.- Al contar el número de materias reprobadas por los alumnos de cierta Universidad, se han
obtenido los siguientes datos:
1, 1, 2, 3, 2, 6, 0, 0, 1, 0, 4, 5, 0, 0, 0, 3, 2, 1, 3, 1, 1, 1, 0, 1, 2, 0,
0, 5, 4, 2.
a) Construya una tabla de frecuencias.
b) A partir de la tabla de frecuencia complete la siguiente tabla:
2.- En un colegio “X” se piensa en la posibilidad de cambiar el timbre por unos acordes de música
rock. Se ha preguntado a 20 alumnos cual es su opinión acerca de estos acordes, según la escala: No
me gusta nada ( 1 ), Me
Me gusta poco ( 2 ), M
Mee es indiferente ( 3 ), Me
Me gusta bastante ( 4 )
Me gusta muchísimo ( 5 ). Estos han opinado de la siguiente manera (codificada):
5, 4, 1, 2, 2, 4, 2, 5, 3 , 5, 3, 5, 1, 1, 3, 1, 2, 5, 3, 3
Construir la tabla de distribución de frecuencias adecuada para responder las siguientes preguntas:
a) ¿A qué porcentaje
porcentaje de alu
alumnos
mnos les gu
gusta
sta poco es
estos
tos acord
acordes?
es?
b) ¿A cuántos alumnos les gusta bastante los acordes?
acordes?
c) ¿Cuál es la proporci
proporción
ón de alumno
alumnoss a los que les es indif
indiferente
erente lo
loss acorde
acordes?
s?
d) ¿Cuál es la proporción de alumnos a los que les gusta poco o no les gusta nada los acordes?
e) ¿Cuál es la proporción de alumnos a los que a lo más les gusta bastante los acordes?
3.- El gerente de una tienda comercial está interesado en el número de veces que 52 clientes han ido
a comprar en su almacén durante un período de dos semanas. Los datos que se registraron fueron:
5 3 3 1 4 4 5 6 4 2 6 6 1
1 14 1 2 4 4 5 6 3 5 3 6 8
410 87 96 25 192 511 73 612 44 57 614 51 16
4.- Los siguientes datos proporcionan los ingresos anuales en miles de dólares de 50 personas:
7.9 10.3 45.7 9.5 43.0 56.0 38.0 6.7 48.0 30.5 25.0 40.0
30.0 25.5 50.0 17.1 25.5 43.5 31.6 59.0 41.5 13.5 12.0 9.2
42.0 41.9 35.0 11.7 55.3 27.0 58.4 57.0 29.6 38.5 26.0 16.5
20
18.0 24.9 20.0 28.0 28.5 36.4 39.5 5.0 9.0 5.0 6.9 7.0
12.0 8.3
a) Presentar dichos datos en una tabla de distribución de frecuencias, usando 6 intervalos de
clase.
b) Estime la proporción de ingresos que están entre 12,500 dólares y 52,500 dólares.
c) Estimar la proporción de ingresos que están debajo de 50,000 dólares.
F3
h2%
6.- Cierto investigador especialista en salud pública afirma que el nivel de plomo en sangre en niños
en edad escolar de una cierta región, se ha incrementado. Para verificar este supuesto se toma una
muestra de 120 niños en edad escolar, obteniendo los siguientes resultados:
27.88 28.42 45.81 6.55 6.4 6.14 3.73 26.88 31.93 14.85 26.88 38.35
34.26 38.97 7.22 5.24 15.4 3.73 31.93 28.34 10.79 26.88 6.32 33.09
28.24 4.67 6.07 9.77 5.35 28.34 33.43 14.85 28.84 3.27 4.88 47
6.56 49.24 6.82 35.49 33.43 27.38 11.33 5.44 9.28 4.36 35.6 9.17
34.26 28.84 26.53 7.92 27.96 6.28 38.62 6.55 4.4 10.79 33.09 28.42
27.38 34.47 5.91 33.1 12.04 34.26 4.24 7.22 45.16 5.91 34.94 5.04
27.6 28.42 33.09 13.38 37.47 38.41 4.67 36.23 33.09 6.67 36.71 33.83
54..0648 3245..9281 64..5668 3365.56 98..1875 2259..1373 44..8828 2384..8246 3344..1939 64..2882 41.78.896 87..792
51.24 5.84 34.72 33.83 35.09 28.42 30.83 4.79 5.44 7.17 29.29 32.29
21
8.- Los siguientes datos corresponde a una muestra de 20 clien tes del Banco de Crédito de la
ciudad de Chimbote según sus inversiones mensuales en dólares en el programa Credifondo:
5500 4000 3000 3100 2000 3600 1000 3900 2500 3500
6000 4500 4800 3300 3400 3700 1500 3800 2900 3600
La información fue obtenida mediante una encuesta realizada por la empresa Aries S.A. en enero de
2004. Se pide
a) Identificar la unidad de análisis y la variable de estudio.
b) Construir una distribución de frecuencia. Utilice la regla de Sturges para determinar el número de
intervalos.
c)Interpretar f2, F2, h2%, H2%.
d)Determine qué porcentaje de clientes invierten mensualmente $4000 o más pero menos de $6000.
e) Determinar qué porcentaje de clientes invierten $3500 mensualmente.
9.- Una tienda comercial, ubicada en Lima Metropolitana, vende ropa de moda para damas y
caballeros además de una amplia
amplia gama de productos domést
domésticos.
icos. A continuación, se presentan llas
as
ventas
ven tas net
netas
as obs
información. observ
ervada
adass dur
durant
antee los año
añoss del 200
20022 al 200
2006.
6. Rep
Repres
resent
entee grá
gráfic
ficame
amente
nte dic
dicha
ha
Año Vent
Ventas
as neta
netass (mi
(millo
llones
nes de S/.)
2002 500.0
2003 519.2
2004 535.8
2005 560.9
2006 544.1
RESPUESTAS %
10.- Se ha hecho una encuest
encuestaa para saber con qué regul
regularida
aridadd
se lee el periódico en Lima, y los resultados fueron estos: Todos los días 37.5
Una vez por semana 29
Una vez al mes 10.5
a) ¿Qu
¿Quéé tan
tanto
to por ccien
iento
to de pe
perso
rsonas
nas rresp
espond
ondier
ieron
on “n
“nunc
unca”?
a”? Alguna vez al año 12
b) Si las personas que no contestaron fueron 6, ¿cuántas Nunca
No contesta 0.4
personas fueron encuestadas?
encuestadas?
c) Las ppers
ersona
onass en
encue
cuesta
stadas
das,, ¿so
¿sonn mue
muestr
straa o pob
poblac
lación
ión??
22
80.6 65.8 49.6 79.1 84.4 66.2 79.3 59.4 72.9 73.6
53.2 60.2 91.2 74.8 78.6 81.4 58.6 68.2 67.4 55.6
7868..93 7974..46 6577..93 6837..73 4794..93 4763..42 6980..84 6776..33 7522..37 7751..87
75.6 41.8 73.6 71.4 83.2 67.4 99.3 62.3 89.2 86.8
65.2 62.1 44.8 82.9 81.7 70.4 74.6 76.9 85.7 40.9
54.2 75.3 50.1 61.1 42.3 68.6 56.2 70.8 47.3 66.9
80.2 60.2 71.6 77.1 94.9 61.4 82.1 78.3 51.2 79.3
Se pide:
a) Elaborar una distribución de frecuencias
b) ¿Cuántos empleados tiene pesos entre 45 y 60 kg?
c) ¿Qué porcentaje de empleados tienen pesos mayores a 75 kg?
d)La empresa promotora obsequia uniformes de trabajo a los empleados voluntarios. Suponiendo que
los pesos de los empleados voluntarios es menor igual a 80 kg. ¿Cuántos uniformes deben ser
devueltos?
14. La fábrica de chocolates “Glamour S.A.” produce una gran gama de chocolates. Desea
determinar si realmente el tipo de choconut es el que presenta el mayor porcentaje de defectuosos
con la finalidad de capacitar al personal en la elaboración de este producto. Para ello el gerente de
control de calidad les pregunta a los
l os trabajadores su opinión acerca del tipo de chocolate que
presenta el mayor número
número de defectuosos. En la siguiente
siguiente tabla se presentan las respuestas de los
trabajadores:
23
E B B R E M B E
B
M R
E R
R R
R M
B B
B B
E E
R
R B B E R M E E
B E B B R M R E
24
25
X
xi
(Muestral) µ
xi
(Poblacional)
n N
Datos Agrupados: Se utiliza cuando agrupamos datos en una tabla de frecuencias por intervalos o
sin intervalos, se halla multiplicando la marca de clase por la frecuencia absoluta de cada categoría
(cuando se encuentran en intervalos de clase) y sin intervalos se multiplica el valor de la variable por
la frecuencia absoluta, después se debe sumar todos los resultados y dividirlos entre el número total
de datos, así como se expresa en lal a fórmula:
X
x f (Muestral)
i i
µ
x f (Poblacional)
i i
n N
Ejemplo 1. Calcular la media aritmética de las notas obtenidas en un examen por una
muestra de 8 estudiantes.
12 15 10 13 10 11 16 09
8
12 15 ............... 09 x
i 1
i
96
X 12
8 8 8
Ejemplo 2. Calcular la media aritmética del número de artículos defectuosos observado en 200 lotes.
26
f X
i 1
i i
=
538
2.69 artículos / lote
X 200
n
Ejemplo 3. Hallar el peso promedio de 144 conservas de pescado “La Caserita”, cuyos pesos se
encuentran presentados en la siguiente tabla de frecuencias.
Peso (g
(gramos) xi Nº de conservas
conservas ( f i ) Producto ( f ixi )
153 - 155 154 8 1232
155 – 157 156 17 2652
157 – 159 158 26 4108
159 – 161 160 40 6400
161 – 163 162 32 5184
163 – 165 164 16 2624
165 - 167 166 5 830
Total 144 23030
k
X
f x
i 1
i i
23030
160 gra
gramo
moss aproximadamente
n 144
Mediana (Me): Es la medida de tendencia central, que supera a no más del 50% de los datos y es
superado por el otro 50% restante.
Datos No Agrupados:
Primero ordenamos los datos de menor a mayor
Mediana: Datos no agrupados
Si el número de datos es impar: Si el número de datos es par:
La mediana es el valor central. La mediana es la semisuma de los dos valores
centrales.
Ejemplo 1 Se tienen los gastos mensuales en consumo de 7 familias (en soles):
470 600 500 580 450 600 650
Interpretación: Esto significa que el 50% de estas familias tienen un gasto mensual máximo de 580
soles y el 50% restante tienen un gasto mensual superior a 580 soles.
Interpretación: El 50% de los gastos mensuales de estas familias son menores o iguales a 590 soles
y el otro 50% son mayores a 590 soles.
27
Datos agrupados por frecuencias: La mediana se halla aplicando el mismo procedimiento que para
datos no agrupados.
Por tratarse de un número par de datos, la mediana será el valor central; es decir el promedio de
12 13
12.5
2
n
2 F i 1
Me Li c
f
i
Ejemplo. La siguiente tabla nos muestra los sueldos en dólares de 68 trabajadores de una fábrica.
Calcular la mediana
Sueldo
ldos ( $ ) Nº de trabajadores Fi
500 – 700 13 13
700 – 1000 25 38
1000 – 1500 15 53
1500 – 2000 10 63
2000 - 3000 05 68
Total 68
Solución
Primeramente hallamos los Fi y como sabemos que n = 68 entonces se tiene que n/2 = 34; luego
28
13
700 300
34
Me 952
25
Moda (Mo): Es el valor más frecuente de la variable, el que se observa mayor número de veces.
Datos No Agrupados o agrupados por frecuencias: Se ubica el dato que más se repite.
Nº de Nº de
hijos familias
0 80
1 120
2 210
3 380
1 180
5 60
6 ó más 40
Total 1070
La moda en este caso es 3; esto significa que estas familias tienen generalmente tres
hijos.
Ejemplo La siguiente tabla nos muestra los sueldos en dólares de 68 trabajadores de una
fábrica. Calcular la mediana
Sueldo
Sueldoss ( $ ) Nº de trab
trabaj
ajad
ador
ores
es
500 – 700 13
700 – 1000 25
1000 – 1500 15
1500 – 2000 10
T2000
otal - 3000 6058
29
12
Mo
700 300 863 .6
12 10
Esto significa que el sueldo que comúnmente se ha registrado entre los trabajadores ha sido de 863.6
dólares.
Ejemplo. En una encuesta de consumidores de bebidas gaseosas se obtuvo los siguientes resultados:
Marcas de Nº de
gaseosa consumidores
Coca Cola 140
Inca Kola 160
Pepsi Cola 90
Sprite 100
Total 490
En este caso la moda es Inca Kola, ya que es la bebida gaseosa que ha tenido mayor
preferencia entre los
los consumidores.
consumidores.
2.- En una Compañía que maneja cuatro productos; los márgenes de utilidad y las totales de ventas
observados durante el año pasado aparecen en la siguiente tabla.
30
30
Solución:
Considerando que las ventas totales no son las mismas para cada producto, utilizaremos un promedio
ponderado
Solución:
Máquinas
A Costo por
S/. 3unidad Cantidad producida
2x Precio de3.6
venta
B 4 x 4.8
C 5 0.8x 6.0
Ingreso
Ingreso per
percápi
cápita
ta : X p n1 x1 n2 x2 $315 Ingr
Ingreso
eso total 315 n
n
Sector Púb
Público : n1 0.55 n
lico Sector no Púb
Público : n2 0.45 n
lico
x
x1
n1
1
x 1 n1 x1 Ingreso total del Sector Público x1 0.18 (315 n) 56.7 n
luego x1
x 1
56.7n
103.09 dólares ( Ingreso promedio del Sector Público )
n1 0.55n
315 n1 x1 n2 x2 56.7 n 0.45 n ( x 2 ) 315 56.7 0.45 x 2 x2 574 dólares
n n
31
6.- Una estación de servicio automotriz gasta $500 en la compra de latas de aceite que cuestan $10 llaa
docena; $500 en latas que cuestan $12.5 la docena; otros $500 en latas que cuestan $20 la docena y
$500 en otras que cuestan $25 la docena.
Determinar el costo promedio por docena de las latas de aceite.
Solución:
2000 dólares
X 14.8 dólares / docena
135 docenas
Este tipo de medidas llamadas a veces Medidas de Posición No Central, simplemente dividen a todo
un conjunto de datos en partes iguales.
Los Cuantiles más comunes son los: Cuartiles, Deciles, y Percentiles.
El Cuartil es el número que divide al conjunto de datos en 4 partes iguales, y se representa con la
letra Q. Entonces en un conjunto de datos existen tres cuartiles: Q1, Q2, y Q3, los que dividirán en
cuatro partes iguales a toda la muestra de datos.
La forma más sencilla de trabajar con cuartiles implica ordenar todos los datos (de menor a mayor),
y enseguida proceder a determinar:
Primer cuartil (Q1) que viene a ser el valor máximo del 25% inferior.
Segundo cuartil (Q2) que viene a ser el valor máximo del 50% de los datos previamente ordenados
de menor a mayor y es equivalente a la mediana
Tercer cuartil (Q3) que corresponde al valor máximo del 75% de los datos o también el valor mínimo
del 25% superior.
Ordenando: 4 5 7 7 9 10 11 12 18 21 33
(n 1)
Si no es un ent
entero
ero entonces hacemos una interpolación lineal entre los dos valores
4
correspondiente a las dos observaciones entre las cuales se encuentra la fracción.
Ejemplo:
2210, 2255, 2350, 2380, 2380, 2390, 2420, 2440, 2450, 2550, 2630 2825
( n 1) 1)
(12
Como n = 12 entonces = = 3.25
4 4
En general para un número de “n” observaciones en el que los datos no están presentados en clases,
una vez ordenados los datos, la posición de los cuartiles se pueden localizar de la siguiente forma.
k ( n 1)
k = 1,2,3
4
N° de hijos fi Fi
0 5 5
1 8 13
2 11 24
3 9 33
4 5 38
5 2 40
Total 40
Me = 2
k n F
4 i 1
Qk Li C f k = 1, 2, 3
i
Sueldo
ldos ( $ ) Nº de trabajadores Fi
500 – 700 13 13
700 – 1000 25 38
1000 – 1500 15 53
1500 – 2000 10 63
2000 - 3000 05 68
Total 68
En este caso n/4 = 68/4 = 17 luego:
68 13
Q1 700 300 4 748
74 8
25
Esto
de losnos indica queganan
trabajadores el 25 % dede
más los748
trabajadores
dólares. ganan menos de 748 dólares y que el 75 % restante
34
El Decil es el número que divide al conjunto de datos en 10 partes iguales, y se representa con la
letra D. Entonces en un conjunto de datos existen nueve deciles: D1, D2,……,D9, los que dividirán
en diez partes iguales a toda la muestra de datos.
El Percentil es el número que divide al conjunto de datos en 100 partes iguales, y se representa con
la letra P. Entonces en un conjunto de datos existen noventa y nueve percentiles: P1, P2, P3,
….,P99 los que dividirán
dividirán en cien partes iguales a toda la mues
muestra
tra de datos.
La forma más sencilla de trabajar con cuartiles implica ordenar todos los datos (de menor a mayor),
y enseguida proceder a determinar:
Percentil 50 (P50) que corresponde al 50% del total de datos y es equivalente a la mediana, cuartil 2
y decil 5.
NOTA.- A través del cálculo de los percentiles podemos hallar también deciles y cuartiles.
Para un número de “n” observaciones en el que los datos no son presentados en clases, una vez
ordenados los datos, la posición de los percentiles se pueden localizar de la siguiente forma.
k ( n 1)
k = 1,2,3,….,99
100
Ejemplo. Los siguientes datos son los gastos realizados por la compra de medicamentos observado
en una muestra de 16 pacientes atendidos en una farmacia:
30 70 25 90 14 25 62 35 40 28 50 24
41 25 80 60
a) Cal
Calcul
culee e int
interp
erpret
retee el Per
Percen
centil
til 70 o D7
Primeramente ordenamos los datos de menor a mayor
14 24 25 25 25 28 30 35 40 41 50 60 62
1 2 3 4 5 6 7 8 9 10 11 12 13
70 80 90
14 15 16
b) Cal
Calcul
culee e int
interp
erpret
retee el cua
cuarti
rtill 3 o P75
Hallamos el 0.75(17) = 12.75
35
El gasto mínimo del 20% superior de los gastos, estará dado por el percentil 80 o decil 8
Hallamos el 0.8(17) = 13.6
Ejemplo: En la siguien
siguiente
te tabla hallar el percentil 50 y 90
N° de hijos fi Fi
0 5 5
1 8 13
2 11 24
3 9 33
4 5 38
5 2 40
Total 40
Percentil 50 = Mediana = D5
Hallamos el 0.5(41) = 20.5
Percentil 90 = D9
k = 1,2,3,…99
Colesterol Nº personas Fi
(mg/100mL)
45 – 90 04 4
90 – 135 06 10
135 – 180 11 21
180 – 225 16 37
225 – 270 21 58
270 – 315 10 68
315 – 360 08 76
360 - 405 04 80
To
Total 80
a) ¿Cuál es la ccantida
antidadd mínim
mínimaa de coles
colesterol
terol de
dell 25% de las pperson
ersonas
as de más al
alto
to dosa
dosaje?
je?
58
60
P 75 270 45 279
10
Hallaremos 0.9(80) = 72
EJERCICIOS PROPUESTOS
2. Sobre las equivalencias que se presentan a continuación, indique cuales son VERDADERA
VERDADERAS
Sy
cuáles son FALSAS. Marque con un aspa la opción correcta.
AFIRMACIONES V F
Q1=P25
El segundo cuartil es la mediana
El noveno decil es igual al percentil 9
D7 = P70
tercer cuartil
El segundo equivale
cuartil al percentil
es menor 75
que el percentil 48
El séptimo decil es menor que el tercer cuartil
El 80% central de los datos se encuentra comprendido entre el decil 2 y el
decil 6
El 90% central de los datos se encuentra comprendido entre el percentil 5 y
el percentil 95
Q3 = P3
4. Los datos de la tabla muestran información sobre la variable X que representa el número de años
de consumo de estupefacientes en una muestra de pacientes del Hospital Nacional del Centro.
Completar los datos que faltan en la siguiente tabla estadística:
Xi fi hi Fi
1 4 0.08
2 4
3 0.16 16
4 7 0.14
5 5 28
6 38
7 7 45
8
Total
A partir de los datos encuentre los valores de los siguientes cuantiles:
5.Se realiza una estadística en la Institución Educativa “Fé y Alegría”, referente a la nota global de
cada uno de los estudiantes que van a acudir a los exámenes de selectividad. Las distribuciones de
frecuencias son las siguientes:
67..55 1250
8.5 30
7. Millones de estadounidenses trabajan para sus empresas desde sus hogares. A continuación, se
presenta una muestra de datos que dan las edades de estas personas que
que trabajan desde sus
hogares.
18 54 20 46 25 48 53 27 26 37
40 36 42 25 27 33 28 40 45 25
¿Calcule la edad máxima del 30% de las personas más jóvenes que trabajan desde sus hogares?
8.Se analizan los salarios en una de las
l as áreas de una compañía y se obtiene información de 7 salarios
en nuevos soles: 850.000, 740.000, 1350.000, 5565.000, 750.000, 650,000, 680.000.
Calcular el salario mínimo del 30% de los salarios más altos.
50-54 7 7
54-58 10 17
58-62 16 33
22-66 20 53
66-70 18 71
70-74 11 82
74-78 8 90
Total 90
11.La siguiente tabla, incompleta, muestra la distribución de los años de servicios del
personal de una
una empresa. La tabla tiene interva
intervalos
los de igual amplitud
amplitud..
Intervalos Punto medio fi Fi
3 8
20
50
90
24 - 110
120
Total 120
a) Complete
Complete la tabl
tablaa de distr
distribució
ibuciónn de frecu
frecuencias
encias..
b) Calcule el promedio y la mediana, ¿estaría usted en condiciones de afirmar que la distribución
de la variable es asimétrica positiva? Presente sus resultados.
c) Se ha dec
decidi
idido
do invita
invitarr al 30% de traba
trabajad
jadore
oress (los
(los más antig
antiguos
uos)) al retiro volu
volunta
ntario
rio con
incentivos. ¿Cuántos años de servicio como mínimo debe tener un trabajador para estar
comprendido en este grupo?
12. La siguiente distribución muestra las edades de los trabajadores de una empresa.
Edad N° de
trabajadores
18 – 23 8
23 – 28 15
28 – 33 20
33 – 38 25
38 – 43 18
43 – 48 8
48 - 53 6
Por política de la empresa, la gerencia decide despedir al 20% de trabajadores más jóvenes y el
30% de los trabajadores de mayor edad; después de esta reducción.
a) Encuentre
Encuentre loloss límite
límitess para sser
er desp
despedido
edido..
b) ¿Cuál es la edad mediana de los trabajadores de la empresa?
13. La distribución de las puntuaciones en una escala de hostilidad, de 160 sujetos de una muestra,
ha sido la siguiente:
Puntuación fi
0 - 10 10
10 – 20 22
20 – 30 32
30 – 40 44 40
40 – 50 28
50 – 60 20
60 – 70 4
14. A continuación
continuación se presenta la distribución de 200 empresas cajamarquinas de acuerdo a su
ganancia neta en miles de dólares durante el primer trimestre del año 2011. Esta información ha
originado el siguiente cuadro de distribución de frecuencias:
Ganancia fi Hi
%
0-4 20
4-8 50
8 - 12 80
1126 -- 1260 3155
Total
Calcular:
a)¿Cuánto ganan como máximo el 15 % de las empresas con menores ganancias?
b)¿Cuánto ganan como mínimo
mínimo el 20 % de las empres
empresas
as con mayores ganan
ganancias?
cias?
15. A continuación, se muestra las calificaciones de 120 estudiantes en un examen de Ingles del
BRITANICO.
Calificación N° de
estudiantes
4300 –- 4500 33
50 – 60 10
60 – 70 22
70 – 80 43
80 – 90 32
90 – 100 7
Determinar:
c) La calificación
calificación más bbaja
aja logra
lograda
da por el 25% sup
superior
erior de la clas
clase.
e.
d) La calificación
calificación más aalta
lta lograd
logradaa por el 10% infer
inferior
ior de la clase
clase..
41
Medidas de Dispersión
Una medida de variabilidad es un número que nos indica el grado de dispersión en un conjunto de
datos. Si el valor es pequeño (respecto a un valor central) entonces hay una gran uniformidad entre
los datos (homogénea).
Por el contrario, un gran valor nos indica poca uniformidad (heterogénea). Cuando es cero quiere
decir que todos los datos son iguales.
2
( x i x)2
S
n 1 2 ( x )
i
2
N
DATOS AGRUPADOS
Para eliminar el problema de la elevación al cuadrado de los datos en la varianza, se realiza una
transformación que consiste en calcular la raíz cuadrada de la varianza con lo que obtendríamos la
desviación estándar o típica.
DATOS NO AGRUPADOS
S 2 S
2
DATOS AGRUPADOS
S 2
S
2
Con lo que la desviación estándar o típica vendrá dada en las mismas unidades que los valores de la
variable.
La
La desviación
desviación estándar
estándar oo típica
típica siempre es positiva
es la medida porque óptima,
de dispersión la varianza
mástambién lo es.estable y más
exacta, más
utilizada, sirviendo de base para las medidas de asimetría y correlación.
42
Ejemplo 1. Los siguientes datos son los pesos en onzas obtenidos a partir de una muestra de 7
frascos:
4 2 5 4 5 2 6 onzas
Solución
Aplicamos la fórmula:
2
n
n n
X i
X X X i i1
2
2
i n
i 1 i 1
S
2
n 1 n 1
X = 4 + 2 + 5 + ……………….+ 6 = 28
2
126 ( 28)
S
2 7 2.33
7 1
Dado que las unidades obtenidas están elevadas al cuadrado, es necesario expresarlo en sus
unidades respectivas, por lo que sacaremos su raíz cuadrada.
= 1.73
S= = 1.3153 años
Lo cual significa que la edad promedio de estas personas es de 20.2 años con una desviación media
de 1.3 años.
4661550 4172411.25
S2 = 6191.63
79
S = 78.7 mg/100mL
Propiedades de la Varianza:
6. Las unidades de medida de la varianza son las unidades de los datos al cuadrado.
Rango o amplitud: Es la medida de variabilidad más sencilla entre todas las mencionadas.
El rango de un conjunto de datos es la diferencia entre dato mayor
m ayor y el dato menor:
Coeficiente
variación en de Variación
diferentes : Es unademedida
conjuntos de dispersión
datos que no vienen relativa
dadas enque
lassemismas
usa para comparar
unidades la las
o que
medias no son iguales, el cual mide la magnitud de la desviación estándar en relación a la media
aritmética, expresada como porcentaje:
S
CV=
x
Ejemplo 1. Supongamos que un grupo de niños de 7 años tenga una talla media de 45 pulgadas con
σ = 2.5 y un peso medio de 50 libras con σ = 6 libras. ¿En cuál de las dos características es más
variable este grupo?
Otros ejemplos:
1.- El coeficiente de variación de los ingresos mensuales de 100
empleados de una compañía es 0.6. Después de un aumento general
de S/.
S/. 90 memens
nsua
uale
less para
para cada
cada uno
uno de los
los trab
trabaj
ajad
ador
ores
es de la
compañía, el coeficiente de variación es ahora de 0.55. Determinar la
cantidad de dinero que necesitará mensualmente la compañía para
pagar los sueldos después loss aumentos.
después de hacer efectivos lo
Antes Después
Después
S S
C .V 0.6 C .V 0.55
X X 90
Igualand
ando
o las desviaciones estándar
n1 70 n2 30
X 120 X 125
1 2
S 1 6 S 2 5
S
Hallaremos : C .V .
X
70 ( 120 ) 30 ( 125 )
n1 X 1 n2 X 2 = 121.5
en este caso X 70 30
n1 n2
X 2
Sabemos que : S
2 X 2
n
n 1
X
X
2 2 X X
1 2
2
X 2
8400
2
X 1
2
1
n1 X 2
70
X
1
S 12 36 2
1010484
n1 1
1
69
X
X 2
3750 2
2 2
2 n2 X 22
2 30 2
S
2
n 2 25
2
469475
29
X
1479959 12150
2
6.14
Por lo tan to C .V x 100% 5.05%
121.5
47
EJERCICIOS PROPUESTOS
1.La cadena de gimnasios Millenium Fit Spa ha evaluado el pago por concepto de membresía (en
dólares), de sus clientes de tres tipos: Estándar, Ejecutiva y Premium, encontrando la siguiente
información para una muestra de 200 clientes de cada tipo de membresía
Dato Membresía
Estándar Membresía
Ejecutiva Membresía
Premiun
Valor promedio (dólares) 130 240 350
Valor mínimo 80 180 280
Valor máximo 280 300 400
Q1 150 210 320
10% de los clientes pagan un valor
100 195 300
de membresía menor o igual a
75% de los clientes tienen valor de
250 260 360
membresía menor o igual a
Varianza (dólares2) 1024 256 40000
El 90% de los clientes pagan un
265 290 385
valor de membresía menor o igual a
Nro AFIRMAC
AFIRMACION ION VóF SUSTENTO
1 Los clientes del tipo de
membresía estándar muestran
una dispersión relativa alta.
2 El 50
50% cceentral ddee lo
los cl
clientes
con
membresía
menos ejecutiva son
dispersos que el 50% central
de los
clientes con membresía
Premium
4 El rango intercuartílico
ico de los
clientes de membresía
ejecutiva es 30
48
Nro AFIRMAC
AFIRMACION
ION VóF SUSTENTO
5 La desviación están
tándar de los
clientes con membresía
Premium es de 20
a) Defin
Definaa la vvariab
ariable
le en estud
estudio,
io, ti
tipo
po y escal
escalaa de m
medici
edición.
ón.
Varianza
Desviación
Estándar
Coeficiente de
Variación
c) El Mini
Ministr
stroo ha señ
señala
alado
do que dado qu
quee el gob
gobier
ierno
no plan
plantea
tea el incr
increme
emento
nto del sal
salari
arioo de los
controladores aéreos en 4000 dólares al año, esto permitirá que los salarios sean más
homogéneos. Señale como afectaría este incremento a las medidas de dispersión (tanto
absolutas como relativas) de la variable en estudio.
3. De las mediciones biométricas efectuadas con cierto número de estudiantes se han extraído los
siguientes datos:
Los varones de 17 años tienen un peso medio de 60.8 kg. con una desviación estándar de 6.69 kg.
Los varones de 10 años tienen un peso medio de 30.5 kg y una desviación estándar de 5.37 kg
A partir de los datos anteriores se puede afirmar que el peso es más variable a los 10 años que a los
17 años. Rpta. Efectivamente el peso es más variable a los 10 años.
4. Se tiene la siguiente información sobre una distribución de frecuencias de los pesos en kg de 50
elementos de un determinado material. La amplitud de los intervalos de clase es igual a 20:
5.Cierta fábrica tiene un departamento de producción y otro de ventas. Las tablas que se muestran a
continuación muestran los salarios percibidos hasta fines de mayo de este año (expresado en miles de
soles):
50
a. Halla
Hallarr la
la ddesvia
esviación
ción típica corre
correspon
spondiente
diente a ca
cada
da ddeparta
epartamento
mento..
6. Dos países son igual de ricos, porque tienen la misma renta per cápita (o renta media), de 8.000
dólares al año. Pero en el país A la desviación típica es de 1.000 dólares y en el país B es de 4.000
dólares. ¿Qué podemos decir sobre la distribución de la riqueza de ambos países gracias a este dato?
7. Determinar la varianza del conjunto de observaciones x 1, x2, x3, x4, x5, a los cuales se les ha restado
4, obteniéndose el siguiente conjunto: 3, 0, 2, 4, 1.
8.La empresa Atención SAC, se preocupa por brindar un servicio adecuado a sus clientes y brinda
especial interés a los reclamos que presentan sus clientes, así como el tiempo que les toma atender
dichos reclamos. El servicio de atención a los clientes se brinda en dos turnos, mañana y tarde, por
dos grupos distintos de analistas. El jefe de calidad ha considerado importante analizar los resultados
de la atención en cada uno de estos turnos, a fin de determinar si existe variación, por lo que obtuvo
información del tiempo que demoró la atención a los clientes:
Turno Mañana
12 12 13 13 14 14 14 14 14 15
15 16 16 16 18 18 18 19 19 19
20 20 20 20 20 21 22 22 22 23
23 23 24 24 24 24 24 24 24 24
Turno Tarde
8 8 9 9 10 10 10 10 10 12
12 13 13 13 15 15 15 16 16 16
17 17 17 17 17 18 19 19 19 20
20 20 21 21 21 24 24 25 26 26
a) ¿En qué rango se encuentra el tiempo de atención a los clientes en cada turno?
b) Calcule la varianza en los turnos mañana y tarde.
51
ASIMETRÍA Y CURTOSIS
ASIMETRÍA
Si:
Si:
As < 0 Distribución Asimetría negava
As = 0 Distribución Simétrica
As > 0 Distribución Asimetría posiva
c) Medida de Fisher
Datos sin agrupar:
52
Cálculo en el SPSS:
CURTOSIS
K<0 Platicurtica
K = 0 Mesocurtica
K>0 Leptocurtica
Cálculo en SPSS
EJERCICIOS PROPUESTOS
2.La Di
Dire
recc
cció
iónn Ge
Gene
nera
rall de ES
ESSA
SALU
LUD
D es
está
tá inte
intere
resa
sada
da en
estudiar los casos de varicela en los niños. Para ello selecciona
una muestra aleatoria de niños que acaban de salir del proceso
de la enfermedad (grupo I) del distrito de Miraflores y otro
grupo de niños (grupo II) del distrito de Breña. Se registró la
edad en que se presentó la mencionada enfermedad en ambos
grupos de niños. Los datos se muestran a continuación:
2 5 3 4 1 2 0 3 4 2
Determine el coeficiente de asimetría y curtosis. Realice la gráfica
respectiva.
3.Se evalúo a una sección de estudiantes que llevaron el curso de Estadística en el Ciclo Verano de
una universidad peruana. Determine la asimetría y curtosis que presentan los siguientes datos.
Notas fi
0–5 3
5 – 10 5
10 – 15 12
15 – 20 10
Total
4.Los siguientes
trabajadoras datosfemenino
del sexo corresponden al número
del Centro de hijos
de Salud “El de las
Olivar”
Número de
Número de hijos
trabajadoras
0 13
1 20
2 25
3 20
4 11
2 1 3 3 4 5 7 2
Determine el tipo de distribución que presentan los datos.
6.Un grupo de jóvenes de la Facultad de Ingeniería han sido encuestados en relación a su estatura.
Los datos se han procesado mediante el IBM SPSS. Los resultados se muestran en la tabla adjunta.
Calcule los coeficientes de asimetría de Pearson e indique si la distribució n de estaturas es
simétrica o asimétrica.
ESTATURA DEL ENCUESTADO
Nº Validos 50
Perdidos 0
Media 1.633
54
Mediana 1.64
Moda 1.64
Desv. Tip. 0.627
Varianza 0.004
8. Dadas las siguientes mediciones de la emisión diaria (en toneladas) de óxido de azufre en una
planta industrial: Construya
Construya una distribución de frecuencias
frecuencias y luego calcule los coeficientes de
asimetría y curtosis:
PROBABILIDADES
DISTRIBUCIONES:
BINOMIAL, POISSON,
NORMAL, MUESTRAL.
56
PROBABILIDADES
Conceptos básicos:
Experimento aleatorio: Es un proceso cuyo resultado no puede ser predicho de anterioridad con
seguridad.
Ejemplo:
a) lanzamiento de una moneda
b) lanzamiento de un dado
Ejemplo:
a) A = {obtener un número impar al lanzar un dado}
A = {1, 3, 5}
Notación de probabilidades:
P: denota una probabilidad.
A, B, y C. denotan eventos específicos.
P(A): denota la probabilidad de que ocurra el evento A.
Probabilidad de un evento
La probabilidad del evento A es el cociente entre el número de resultados favorable a la ocurrencia
del evento A y el número de resultados posibles.
Características
Sea un espacio muestral y sean A y B dos eventos cualesquiera de este:
P(Ω) = 1 P(Փ ) = 0
0 ≤ P(A) ≤ 1
Si A y B son eveneventos
tos no disjuntos de Ω, se cumple que: P(A ∪ B) = P(A) + P(B) -
P(A∩B)
Si A y B son eveneventos
tos disjuntos de Ω, se cumple que: P(A ∪ B) = P(A) + P(B)
57
Ejercicios de probabilidades
1.- En una compañía hay 6 varones y 4 damas que aspiran a ser
miembros de un comité. Si se debe escoger dos al azar. ¿Cuál es la
probabilidad de que:
a) Los dos sean hombres
b) Sean un hombre y una mujer o dos mujere
mujeres.
s.
Solución:
a) Sea el ev
event
entoo A = {{Los
Los dos sean
sean ho
hombr
mbres}
es}
6
P ( A)
2
1
10 3
2
P(Rechazar el lote) = P ( X = 1 ) + P ( X = 2 ) + P ( X = 3 ) + P ( X = 4 ) + P ( X = 5 )
= 1 – P ( X = 0 ) = 1 – P ( Aceptar el lote )
80
5
en donde P ( Aceptar ) 0.32 P ( Re chazar ) 1 0.32 0.68
100
5
15 1 14
40 40 40
15 14 29
Luego
Lu ego P ( A B ' B A' ) 0.72
7255
40 40
4
P ( X 3 )
3
10
4
120
0.033
3
b) P ( X 2 ) P X 2 ) P ( X 3 ) X : N º de pacientes no exp uestos a contraer
6 4 6
2 1 60 3 20
P ( X 2 ) P ( X 3 )
10 120 10 120
3 3
60 20
Luego P ( X 2 ) 0.667
120
PROBABILIDAD CONDICIONAL
Se trata de dos eventos A y B definidos en un mismo espacio muestral, en donde uno de ellos
(evento B) ya ocurrió, es decir se conoce su resultado.
P( A B )
P( A / B )
P( B )
D
P(D/A) = 00.08
.08
A P(D’/A) = 0.92
P(A) = 0.40
D’
P(B)=0.35 P(D/B) = 0.09
B D
P(D’/B) = 0.91
P(C) = 0.25
D’
C P(D/C) = 0.10
D
P(D’/C) = 0.9
D’
a) Ahora hallar
hallaremos
emos llaa proba
probabilid
bilidad
ad de ob
obtener
tener uunn artíc
artículo
ulo de
defectuo
fectuoso
so
b) Ahora hallaremos la probabilidad que un artículo sea proveniente del proveedor A, sabiendo
que el artículo seleccionado salió defectuoso.
Ejemplo 2.- Una cierta prueba médica tiene una efectividad de 99%
para descubrir la presencia o no de una enfermedad (resultado
positivo cuando realmente lo tiene o negativo cuando realmente no
lo tiene). Se aplica masivamente la prueba a una población en la cual
hay 1% de individuos con la enfermedad; se desea saber qué
porcentaje de los individuos con resultados positivos tendrán
efectivamente la enfermedad.
Solución: Sean los eventos
61
P { Re sulta
sultado
do sea posiivo }
E { Person
Personaa tenga la enfermedad } P ( E ) 0.01
Tien
Tienee la
la eenf
nfer
erme
meda
dad:
d: E No tien
tienee la
la eenf
nfer
erme
meda
dad:
d: E’ Total
Resultado Positivo: P 0.0099 0.0099 0.0198
Resultado Negativo: P’ 0.0001 0.9801 0.9802
Total 0.01 0.99 1.000
P
E P E P 0.0099 0.5
Luego
P P P 0.0198
P
P ( P/E ) = 0.99
E P ( P’/E ) = 0.01
P ( E ) = 0.01
P’
P
P ( E’) = 0.99 P ( P/E’ ) = 0.01
E’
P ( P’/E’) = 0.99
62
P’
Ahora hallaremos la probabilidad que un resultado sea positivo, sabiendo que realmente tiene la
enfermedad.
EVENTOS INDEPENDIENTES
Dos eventos A y B son independientes si la ocurrencia de uno no afecta la ocurrencia del otro
P ( A B ) P
( A) P ( B )
Ejempl
Ejemploo 1.- La proporción general de artículos defectuosos en un
proceso continuo es 0.10. Cuál es la probabilidad de que elegidos
dos al azar:
a) Ninguno sea defectuoso
b) Cuando menos uno
uno no tenga defectos
a) Hallar
Hallaremos
emos la pr probab
obabilidad
ilidad que ningu
ninguno
no ssea
ea ddefectu
efectuoso
oso
P ( A' B ' ) P ( A' ) x P ( B ' ) Por ser eventos independientes
0.90 x 0.90 0.81
b) Ahora hallaremos la probabilidad
probabilidad de que cuando menos
menos uno no tenga defec
defectos
tos
P ( A' B ' ) P ( A B )' 1 P ( A B )
1 ( 0.10 ) x ( 0.10 ) 1 0.01 0.99
OtroMétodo :
Esto implica que por lo menos uno de los dos artículos no tenga defectos
P ( A' B ) P ( A B ' ) P ( A' B ' )
( 0.09 ) ( 0.10 ) ( 0.10 x 0.90 ) ( 0.90 ) ( 0.90 ) 0.99
63
EJERCICIOS PROPUESTOS
2.- A conti
continuaci
nuación,
ón, se pres
presenta
enta una tabla en el cual se
Hábito de Rendimiento en
han clasificado a 100 alumnos según hábito de fumar y fumar matemáticas Total
rendimiento en el curso de matemática:
Malo Bueno
De este grupo seleccionamos un estudiante al azar, se
pide contestar las preguntas:
preguntas:
Si 25 5 30
arendimiento
) Calcular malo
la en
promatemáticas;
babilida
idad dedado
quede ten
tengafuma
que un
cigarrillos. No 15 55 70
Total 40 60 100
64
b) Calcular la probabilidad de que no fume cigarrillos si se sabe que tiene un buen rendimiento en
matemáticas.
4.- Se estima que el 30% de los habitantes de EEUU son obesos y que el 3% sufre de diabetes.
El 2% son obesos y sufren de diabetes. Calcular la probabilidad de que una persona elegida al azar.
a) Sea obesa o sufra de diabetes? Rpta. 0.31
b) Sea obesa pero no sufra de diabetes? Rpta 0.28
5.- De todos los pacientes con cáncer, el 52% son mujeres. El 40% de todos los pacientes sobrevive
al menos 5 años desde el momento del diagnóstico. No obstante, esta tasa de sobrevivencia es válida
solamente para el 35% de las mujeres. ¿Cuál es la probabilidad de que un paciente con cáncer
seleccionado aleatoriamente sea mujer y sobreviva al menos 5 años? Rpta. 0.182
6.- Un
Unaa em
empr
pres
esaa cons
constru
truct
ctor
oraa del
del prprog
ogra
rama
ma MI VI VIVI
VIEN
ENDADA
descubrió que sólo el 20% de todos los trabajos se terminaban a
tiempo
tiempo;; mie
mientr
ntras
as que el 30% suf sufrían
rían sob
sobrec
recost
ostos.
os. Ad
Ademá
emás,
s, los
sobrecostos se presentaban el 75% de las veces en las que se
terminaban el trabajo a tiempo. El propietario de la empresa desea
conocer la probabilidad de que un trabajo:
a) Tenga sobrecostos y se termine a tiempo Rpta. 0.15
b) Tenga sobrecostos o se termine a tiempo. Rpta. 0.35
c) Se termine a tiempo, dado que no tiene sobrecostos. Rpta. 0.0714
7.- La distribución de los tipos de sangre en EEUU entre los individuos de raza blanca es
ap
apro
roxi
xima
mada
damen
mente
te la sigu
siguie
ient
nte:
e: A: 40
40%
% B = 11%
11% AB = 4% O = 45%
45%
Tras un accidente automovilístico, un individuo de raza blanca es conducido a una clínica de
emergencia. Se le hace un análisis de sangre para establecer el grupo al que pertenece. ¿Cuál es la
probabilidad de que sea del tipo A o del B? Rpta. 0.51
Rpta.
c) Tenga 0.36
una madre alcohólica; si se sabe que el padre no lo es.
Rpta. 0.033
65
9.- De 1000 jóvenes de 18 años, 600 tienen empleo y 800 son bachilleres. De los 800 bachilleres,
500 tienen trabajo. ¿Cuál es la probabilidad de que un joven de 18 años tomado aleatoriamente sea:
a) Un bachiller empleado
b) Empleado pero no bachiller
bachiller
c) Desempleado o un bachiller
d) Desempleado o no bachiller
14.- Sólo el 60% de los estudiantes de la clase de matemática del Profesor X pasaron la primera
prueba. De quienes pasaron el 80% estudiaron
estudiaron,, el 20% de quienes no pasaron si estudiaron.
a) ¿Cuál es la probabilidad de que un estudiante pase o estudie?
b) ¿Cuál es la probabilidad
probabilidad de que un estudiante pase
pase,, pero no estudie?
15.- El 5% de las unidades producidas en una fábrica se encuentran defectuosas cuando el proceso de
fabricación se encuentra bajo control. Si el proceso se encuentra fuera de control, se produce un 30%
de unidades defectuosas. La probabilidad marginal de que el proceso se encuentre bajo control es de
0.92. Si se escoge aleatoriamente una unidad y se encuentra que es defectuosa, ¿Cuál es la
probabilidad de que el proceso
proceso se encuentre bajo con
control?
trol?
17.- Se estima que la probabilidad de que una Cía. B tenga éxito al comercializar un producto es de
0.95 si su competidora la compañía A no interviene en el mercado; y es de 0.15 si la compañía A
interviene en el mercado. Si se estima que A intervendría en el mercado con probabilidad de 0.7
a) ¿Cuál es la probabilidad de que la compañía B tenga éxito? Rpta. 0.39
b) Si la Cía. B no tuviera éxito ¿En cuánto se estima la probabilidad de que A intervenga en el
mercado? Rpta. 0.975
18.- Contratistas S.A. está negociando dos contratos. La Gerencia piensa que la probabilidad de
ganar el primer contrato es de 60% y que el ganador tendrá ventaja definitiva en la negociación del
segundo contrato. La Gerencia cree que si Contratistas S.A gana el primer contrato va a tener un
70% de probabilidad de ganar el segundo contrato, en caso contrario disminuirá a 0.10.
a) ¿Cuál es la probabilidad de que Contratistas S.A. pierda ambos contratos? Rpta. 0.36
b) ¿Cuál es la probabilidad
probabilidad que gane el segundo con trato? Rpta. 0.46
contrato?
19.-
19.- Una Compañía tiene 1000 repuestos para cierto ensamblado.
El 20% de las partes son defectuosas; además el 40% se compraron a
proveedores de fuera y el resto
resto fue fabricado por la misma compañía.
compañía.
De los comprados fuera de la compañía el 80% son buenos. Si se
elig
eligee un re
repu
pues
esto
to al azar
azar entr
entree es
esta
ta exis
existe
tenc
ncia
ia.. ¿Cuá
¿Cuáll es la
probabilidad de que:
a) Sea fabricado por la Compañía y esté buena. Rpta. 0.48
b) Seasea
c) No defectuosa
fabricadao por
comprada
comprada . Rpta.ni0.52
la Compañía sea buena. Rpta. 0.08
d) Sea comprada, siendo defectuosa. Rpta. 0.4
21.- Se ha determinado que el porcentaje de televidentes que ven los programas A, B y C son
respectivamente 0.4. 0.5 y 0.3. Cada televidente ve los programas independientemente uno del otro.
Si se elige al azar a uno de tales televidentes. ¿Qué probabilidad hay de que vea:
a) Dos de los tres programas. Rpta. 0.29
b) Al menos uno de los tres programas. Rpta. 0.79
22.- En cierta región la probabilidad de que llueva en cualquier día del año es 0.1. Suponiendo la
independencia de un día con otro. ¿Cuál es la probabilidad de que la primera lluvia ocurra después
de 14 días sin lluvia? Rpta. 0.023
23.-El
.-El gere
gerennte de INGINGENIER IEROS ME METATAC C S.A.C
.A.C., ., es una
una
orga
organi
niza
zaci
ción
ón orie
orient
ntad
adaa a sumisumini
nist
stra
rarr prod
producucto
tos,
s, serv
servici
icios
os y
desarrollo de soluciones de ingeniería aplicada, considera que la
probabilidad de que los accidentes en Transmisiones & Ejes hayan
sido ocasionados por las conexiones eléctricas es 0,24, por falla
mecánica es 0,18 y por conexiones eléctricas o falla mecánica es
0,39
,39. Si se selecelecci
cion
onaa al azaazar un acciacciddente
ente pr prooduc
ducido
ido en
Transmisiones & Ejes y definiendo los eventos de interés:
E = {Acci
{Acciden
dentes
tes ppor
or co
conex
nexion
iones
es eléct
eléctric
ricas}
as},, M = {A {Acci
cciden
dentes
tes ppor
or ffall
allaa mec
mecáni
ánica}
ca}
67
P ( E ) = 0,
0,24
24 y P ( M ) = 0, 0,18
18 P ( E M ) = 0,39
a) Determine la probabilidad que se haya producido por ambos tipos de falla.
b) ¿Cuál es la probabilidad
probabilidad de que el accidente se haya producido
producido por solo un tipo de falla?
24.-Después de una política de mejora de la calidad de la producción de Chemi-latex, tanto en el
área de llenado como el de sellado, los trabajadores fueron sensibilizados para realizar sus labores de
producción de la mejor manera y así disminuir los productos defectuosos en la producción. Para
corroborar
corroborarlo
lo se toma una muest
muestra
ra de 80 produ
productos,
ctos, encontr
encontrándo
ándose
se que 25 presentan defec
defectos
tos en el
llenado, 32 presentan defectos en el sellado y 30 no presentaban defectos. Si se selecciona un
producto al azar.
a) Determine la probabilidad de que se hayan producido ambos tipos de defectos.
b) ¿Cuál es la probabilidad
probabilidad de que se haya produ
producido
cido solo uno de los tipos de defectos?
c) ¿Los eventos defecto en el sellado y defecto en llenado son mutuamente excluyentes? Explique.
25.-Una caja contiene 24 resistencias con etiqueta negra y 24 con
etiqueta roja; de los de etiqueta negra cinco son de 5 ohmios y el
resto de 8 ohmios; mientras que los de etiqueta roja doce son de 5
ohmios y el resto de 8 ohmios:
a)Si se selecciona una resistencia al azar de la caja, ¿cuál es la
probabilidad que la resistencia
resistencia sea de 8 ohmios?
b) Si se seleccionan al azar dos resistencias de la caja, ¿cuál es la probabilidad que las dos sean de
igual color.
c)Si se seleccionan al azar tres resistencias de la caja, ¿cuál es la probabilidad que dos sean de 5
ohmios y una de 8 ohmios?
26. En un estudio de 420 000 usuarios de teléfono celular de
Movistar, se encontró que 135 desarrollaron cáncer cerebral o del
sistema nervioso. Estime la probabilidad de que un usuario de
teléfono celular que se seleccionó al azar desarrolle un cáncer de
este tipo. ¿Qué sugiere el resultado acerca de los teléfonos celulares
como causantes de cáncer de este tipo?
27. En la fabricación de un cierto
ciert o tipo de clavos, aparecen un cierto nº de ellos defectuosos. Se han
estudiado 200 lotes de 500 clavos cada uno obteniendo:
Clavos deectuosos 1 2 3 4 5 6 7 8
Nº de lotes 5 15 38 42
42 49 32 17 2
32. -En un laboratorio hay tres jaulas. En la jaula I hay 4 conejos negros y 2 blancos, la jaula II tiene
4 conejos negros y 4 blancos y la jaula III contiene 5 conejos negros y 6 blancos. Se selecciona al
azar una de las jaulas y se saca un conejo al azar de esa jaula. ¿Cuál es la probabilidad que el conejo
escogido sea blanco?
33.-El 70% del ganado es inyectado con una vacuna para combatir
una enfermedad grave. La probabilidad de recuperarse de la
enfermedad es 1 en 20 si no ha habido tratamiento y de 1 en 5 si
hubo tratamiento.
probabilidad Si haya
de que un animal infectado
recibido se recupera,
la vacuna ¿Cuál es la
preventiva?
34.-Una unidad de producción de enlatados de atún marca “Campomar” produce 9000 envases
diarios. La máquina A produce 3000 de estos envases, de los cuales 2% son defectuosos y la
maquina B produce el resto, se sabe que de la maquina B, el 4% son defectuosos. Calcular:
a) La probabilidad de que un envase elegido al azar este defectuoso.
b) La probabilidad de que
que proceda de la maquina B, ssii el envase tiene defectos.
c) La probabilidad de que proceda de la maquina A, si el envase tiene defectos.
DISTRIBUCIÓN DISCRETA
DISTRIBUCIÓN BINOMIAL
Una distribución de probabilidad binomial resulta de un procedimiento que cumple con todos los
siguientes requisitos:
1. El procedimiento tiene un número fijo de ensayos.
2. Los ensayos deben ser independientes. (El resultado de cualquier ensayo individual no afecta las
probabilidades de los demás
demás ensayos).
3. Todos los resultados de cada ensayo deben estar clasificados en dos categorías (generalmente
llamadas éxito y fracaso).
4. La probabilidad de un éxito permanece igual en todos los ensayos.
n x n x
P ( X x) p q x 0,1, 2, 3,................., , n
x
n n!
Donde :
x x !(n x)!
20
P ( X 0) (0.05) 0 (0.95) 20 0.36
0
Solución:
a) Exactamente dos compren una aspiradora
luego hallaremos
hallaremos P(X
P(X=2)
=2) en donde X: NúNúmero
mero de mujeres que compran aspiradoras.
aspiradoras.
6 2 4
P ( X 2 ) 2 (0.2) (0.8) 0.24576
Po r lo tan to P ( X 1 ) 1 0.26214 0 .73 8
P ( X 1 ) P ( X 0 ) P ( X 1 ) X : N º de amas de casa que no compran la aspiradora
6
0
P ( X 0 ) 0
( 0.8 ) ( 0.2 )
6
0.000064
6
P ( X 1 ) ( 0.8 ) 1 ( 0.2 ) 5 0.001536
1
Luego P ( X 1 ) 0.0016
Ej
Ejem
emplploo y3.-
hombres - Enmujeres;
3.20% unaa em
un emprpres
esaa aptos
están dond
do ndepara
e los
losjubilarse
em
empl
plea
eado
dos
el s10%
so
sonnde80
80%
%
las
mujeres y el 15% de los hombres. De 5 solicitudes para jubilarse
¿Cuál es la probabilidad de que al menos dos estén aptos para
jubilarse?
Solución:
Sea X : N º de e
Sea emp
mple
lead
ados
os apto
aptoss pa
para
ra ju
jubi
bila
lars
rse
e
P( X 2 ) 1 P( X 0) P( X 1)
5
P( X 0) ( p) (q) en donde p : probabilid
probabilidad
ad que una pers
persona
ona esté apto para jubila
jubilarse
rse
0 5
0
luego p 0.15 (0.
(0.8) 0.1(0.2) 0.14
1(0.2)
5
En con sec uenc
uencia
ia (0.86) 0.4704
P( X 0 ) ( 0.14 ) (0.
0 5
0
5
P( X 1) ( 0.14 ) ( 0.86 ) 0.3829
1 4
1
Por lo tan to P( X 2 ) 1 0.8533 0.1467
Interpretación: El 14.67% de las veces que 5 personas presentan sus solicitudes para jubilarse; por
lo menos dos de ellas estarán aptos para jubilarse.
a) Sea X: Nº de multa
multass impue
impuestas
stas
La desviación estándar
estándar será: 10.315 (2) = 20.63
Ej
Ejem
empl
ploo 5.
5.-- La pr
prob
obab
abil
ilid
idad
ad de cura
cura de un unaa enfe
enferm
rmed
edad
ad
normalmente mortal con cierto medicamente, se estima en 0.30. Si
72
cinco enfermos se tratan con este medicamento. ¿Cuál es la probabilidad de que al menos cuatro se
curen?
Solución:
a) Hallaremos P ( X ≥ 4 )
n x n x
en donde X: Nº de pacientes que se curan
P X x
p q x 0 , 1, 2, 3,.................................n
x
5
P ( X 4 )
( 0 .3 ) ( 0. 7 ) 0. 02835
4 1
4
5
P ( X 5 )
5 ( 0. 3 ) ( 0 .7 ) 0. 00243
5 0
10
P ( X 8)
8
(0.5)
8
( 0.5) 2 0.043945
10
P ( X 9)
(0.5)
9
(0.5)1 0.009765
9
10
P ( X 10)
(0.5)10 (0.5) 0
0.000976
10
DISTRIBUCIÓN DE POISSON
Una distribución de probabilidad Poisson resulta de un procedimiento que cumple con todos
t odos los
siguientes requisitos:
1. El experimento consiste en contar el número “x” de veces que ocurre un evento en particular
durante una unidad de tiempo dada, o en un área o volumen dado.
2. La probabilidad de que un evento ocurra en una unidad dada de tiempo, área o volumen es la
misma para todas las unidades.
3. El número de eventos que ocurren en una unidad de tiempo, área o volumen es independiente del
número de los que ocurren en otras unidades.
4. El número medio (o esperado) de eventos en cada unidad se denota por la letra griega µ (“mu” )
73
Estudia a los eventos independientes que suceden con muy poca frecuencia y que ocurren en un
determinado espacio, volumen o tiempo.
X= 0, 1, 2, 3.4 ……………….
Ejemplo 1.- El promedio de llamadas telefónicas en una hora es de
3. ¿Cuál es la probabilidad de recibir:
a) Exactamente 2 llamadas en una hora
b) Dos o más llamadas
llamadas en 90 minutos
Solución:
a) Hallaremos P (X = 2)
X: Nº de llamadas en una hora µ=3
e 3 3 2
Luego P ( X 2 ) 0.224
2!
Solución:
74
a) Este es un p
proble
roblema
ma de tipo bbinom
inomial
ial pero da
dado
do que np ≤ 1 pu
puede
ede ser res
resuelto
uelto ttamb
ambién
ién
a través de Poisson; con el cual hallaremos un resultado bastante aproximado
0 ) e 1 e 1
1 0
P ( X
0!
e 111
P ( X 1) e 1
1!
1
e 112 e
P ( X 2)
2! 2
Luego
Lue go P ( X 3 ) 2.5 e 1 0.92
Solución:
Donde:
µ= Promedio
Promedio de bacterias en 1/3 de cc = 1
e 1 10
Luego P ( X 0)
e 1 0.368
0!
Respuesta: La probabilidad de que no contenga bacteria alguna una muestra de 1/3 de cc es 36.8%.
b ) P ( X 1 ) 1 P ( X 0 )
X : N º de bacterias en una muestra de 2 cc
µ = Promedio de bacte
bacterias
rias en 2 de cc = 6
e 6 60
P ( X 0) e 6
0!
Respuesta:: La probabilidad de que contenga por lo menos una bacteria una muestra de 2 cc es
Respuesta
99.75%.
Interpretación: El número promedio de niños que no queden inmunizados contra la polio en un
grupo de 10,
10, 000 niños vacunados es 1.
b ) P ( X 2 ) P ( X 0 ) P ( X 1 )
e 1 10
P ( X 0) e 1
0!
e 111
P ( X 1) e 1
1!
Lue go P ( X 2) 2 e 1 0 .7358
Interpretación: Si se aplicara esta vacuna a 10,000 niños varias veces, en el 73.58% de estas veces
menos de dos niños no quedarán inmunizados.
76
DISTRIBUCIÓN CONTINUA
DISTRIBUCIÓN NORMAL
Es una distribución de probabilidad que se diferencia de las anteriores por ser de variable aleatoria
continua. Es una de las más importantes
i mportantes ya que la mayoría de los
l os trabajos de investigación están
basados en muestras aleatorias provenientes de po
poblaciones
blaciones que se distribuyen
distribuyen normalmente.
•Tiene forma de campana y posee una sola cima en el centro de la distribución. La media aritmética,
la mediana y la moda son iguales, y se localizan en el centro de la distribución.
Estandarización
Si la variable aleatoria X tiene una distribución X∼ N(µ, ) , entonces la variable aleator
aleatoria
ia
x
z
Tiene distribución normal estándar.
Distribución
sus parámetrosNormal 0 y 2 : 1Una
son µ =Estándar . variable aleatoria X tiene una distribución normal estándar, si
77
Solución:
Consideremos a X: Cantidad descargada por la máquina vendedora de refrescos, la cual se distribuye
normalmente con µ = 196 gr y σ = 14 gr.
Hallaremos:
218.4 )
P ( X
Estandarizando
Estandarizando la variable continua
X 218.4 196
Z Z 1.6
14
Interpretación: El 5.48% de los vasos tendrán una cantidad mayor de 218.4 gramos.
b) Si los vasos pueden contener solo 224 gramos sin que haya derrame. ¿En cuántos vasos de 200
vendidos es probable que el líquido se derrame?
Solución:
224 196
P ( X 224 ) Z 2 luego P ( Z 2) 0.0228
14
E ( x) np 200 ( 0.0228 ) 4.56
Ej
Ejem
empl
ploo 2.-
2.- La puntuación media en un examen final de una
asignatura fue de 72 y la varianza 81. El 10% superior de los
alumnos reciben
un estudiante debecalificación A. ¿Cuál
tener para recibir unaescalificación
la ficación
cali puntuación
A? mínima que
Solución:
X X 72
Z 1.28 X 83.5
9
Respuesta: La puntuación mínima que un estudiante debe tener para recibir una calificación A es
83.5.
Ejemplo 3.- Una variable aleatoria tiene una distribuc
distribución
ión normal con σ = 21.5. HHallar
allar su media si la
probabilidad de que la variable
variable aleatoria tome un valor menor que
que 120.5 es de 0.8849
78
Solución:
Se sabe que P ( X 120
.5) 0.8849
X 120.5
Z 1.2 94.7
21.5
X 99.6 80
Z 1.96 10
55 80 98 80
Z 1 2. 5 Z 2 1.8
10 10
P (2.5 Z 1.8 ) 0.4938 0.4641 0.9579 95.79 %
Solución:
a) Consideremos a X: Puntaje del coeficiente ddee inteligencia, la cual se distribuye nor
normalmente
malmente
con µ = 105 y σ = 12
Hallaremos
P ( X 90 ) es tan darizando el valor de X mediante la fórmu la :
X 90 1 05
Z Z 1.25
12
80%
X 105
0.84 X 94.92 o sea aproximadamente 95 punt
puntos
os
12
Ejemplo
inferiores6.-
a 47Eny una
28%distribución
superiores anormal
70. hay 47 % de valores
Calcular la proporción de valores entre 57 y 86.
Solución
80
47 70
0.08 0.58
0.08 47 0.58 70
57 49.79 86 49.79
Ahora Z 1 0.21 Z 2 1.04
34.85 34.85
EJERCICIOS PROPUESTOS
2.- Se determina que un 25% de los niños expuestos a un determinado agente infeccioso contraerán
la enfermedad producida por dicho agente. Entre un grupo de 4 niños igualmente
i gualmente expuestos al agente
infeccioso. ¿Cuál es la probabilidad de que:
a) Exactamente 2 niños se enfermen. Rpta. 0.211
b) Por lo menos un niño se enferme. Rpta. 0.684
3.- En cierto país en desarrollo el 30% de los niños están desnutridos; en una muestra aleatoria de 25
niños de esa área. ¿Cuál es la probabilidad de que el número de niños desnutridos sea:
81
4.- La probabilidad de que un paciente se recupere de una rara enfermedad sanguínea es 0.8. Si se
sabe que 15 personas contraen esta enfermedad. ¿Cuál es la probabilidad:
a) Que sobrevivan de 4 a 7.
b) No sobrevivan exactamente 5.
5.-Se tiene información que en la comisaria de Chorrillos, el 25% de los detenidos se encuentran allí
por delitos menores. Se selecciona una muestra aleatoria de 24. ¿Cuál es la probabilidad de que el
número de detenidos por delitos menores en esa muestra sea 10?
8.- La encargada de los préstamos del banco “INTERBANK” estima, con base en sus años de
experiencia, que la probabilidad de que un solicitante no sea capaz de pagar su préstamo es 0.035. El
mes pasado realizó 45 préstamos. ¿Cuál es la probabilidad de que 3 préstamos no sean pagados
oportunamente?
10.- “CAJA RURAL APU” informó que el 30% de los préstamos garantizados con joyería
vencieron. Si se toma una muestra aleatoria de 10 préstamos
a)¿Cuál es la probabilidad de que ninguno esté vencido?
b)¿Cuál es la probabilidad de que 2 estén vencidos?
11.-
11.- El 28%
28% de loslos torn
tornil
illo
loss de la úl
últi
tima
ma pr
prod
oduc
ucci
ción
ón para
para la em
empr
pres
esaa “M
“MAE
AEST
STRO
RO”” es
está
tánn
defectuosos. Determinar la probabilidad de que de 8 tornillos seleccionados aleatoriamente por lo
menos 3 estén defectuosos.
82
12.- Un prominente médico afirma que 70% de las personas con cáncer de pulmón son fumadores
empedernidos. Si su afirmación es correcta:
Encuentre la probabilidad que de 10 de tales pacientes admitidos recientemente en un hospital,
menos de 3 sean fumadores empedernidos.
13.- Si la probabilidad de que un individuo sufra una reacción desfavorable por una inyección de
cierto suero es de 0.001. Determinar la probabilidad de que de 200 personas:
a) Exactamente
b) su3fran
sufran
Dos o más sufran la reacción.
la reacción. Rpta.Rpta. 0.0011
0.0175
15.- En Caja Sullana se analiza la cantidad de clientes que se atiende en las ventanillas, se obtuvo
que la cantidad de clientes promedio que se atiende en esta institución financiera en un lapso de 50
minutos es de 20 clientes.
a) ¿Cuál es la probabilidad de que se atiendan a 10 clientes en 25 minutos?
b) ¿Cuál es la probabilidad
probabilidad de que se atiendan a 7 clientes en 10 minutos?
16.- En una investigación realizada en la calle Miramar, se ha determinado que el número de muertes
debido a accidentes de tránsito ha sido en promedio 10 en dos meses. Suponiendo que el número de
muertes sigue una distribución de Poisson.
a) Hallar la probabilidad de que en un determinado mes mueran 3 personas.
b) Hallar la probabilidad de
de que en un determinado mes nono mueran 4 personas
personas..
II. Calcular
a) P ( Zel> valor
zo ) =de0.025
Zo en las siguientes expresiones:
b) P ( Z < zo ) = 0.15
c) P ( Z ≥ zzoo ) = 0.85
83
d) P ( Z < zo ) = 0.10
e) P ( - zo < Z < zo ) = 0.8
f) P ( - zo < Z < zo ) = 0.98
20.-Una población normal tiene una media de 12.2 y una desviación estándar de 2.5.
a) Calcule el valor de z asociado con 14.3.
b) ¿Qué proporción de la población se encuentra eentre
ntre 12.2 y 14.3?
c) ¿Qué proporción de la población es menor que 10?
24.-
24.-Un
Un es
estu
tudi
dioo reci
recien
ente
te con
con resp
respec
ecto
to a sala
salario
rioss por
por hora
hora de
integrantes
importantes de equiposquedeelmantenimiento
demostró de hora
salario medio por las aerolíneas más
era de $20.50,
con una desviación estándar de $3.50. Suponga que la distribución
de los salarios por hora es una distribución de probabilidad normal.
Si elige un integrante de un equipo al azar, ¿cuál es la probabilidad
de que gane:
a) Entre $20.50 y $24.00 la hora?
b) Más de $24.00 la hora?
c)Menos de $19.00 la hora?
25.-Entre las ciudades de Estados Unidos con una población de más de 250 000 habitantes, la media
del tiempo de viaje de ida al trabajo es de 24.3 minutos. El tiempo de viaje más largo pertenece a la
ciudad de Nueva York, donde el tiempo medio es de 38.3 minutos. Suponga que la distribución de
los tiempos de viaje en la ciudad de Nueva York tiene una distribución de probabilidad normal y la
desviación estándar es de 7.5 minutos.
a) ¿Qué porcentaje de viajes en la ciudad de Nueva York consumen menos de 30 minutos?
b) ¿Qué porcentaje de viajes
viajes consumen entre 30 y 3355 minutos?
c) ¿Qué porcentaje de viajes consumen entre 30 y 40 minutos?
84
27.- Supóngase que se sabe que los niveles de glucosa en sangre extraída a 150 niños en ayunas están
distribuidos normalmente con una media de 66 y una varianza de 42.
a) Cuál es la probabilidad de un niño seleccionado al azar presente un nivel de glucosa en sangre
mayor o igual a 71?
b) Cuántos niños presen
presentan
tan un nivel de glucosa en ssangre
angre menor o igual a 61?
c) Determinar la median
medianaa y la moda de la distribución.
29.- El nivel de colesterol en los trabajadores administrativos tiene distribución normal. Por otro lado
se sabe que el 5% superior de los trabajadores su colesterol está por encima de 280 y que el 10%
inferior de los trabajadores su colesterol está por debajo de 170. Se pide determinar los valores de la
media y varianza de la distribución normal. Si de esta población seleccionamos un trabajador al azar,
cuál es la probabilidad de que su colesterol sea mayor a 250.
31.- De una variable normal N(µ; σ) se sabe que P (X ≤ 7 ) = 0.9772 y P (X ≤ 6.5) = 0.8413.
Calcular:
a) µ y σ.
b) P (5.65 ≤ X ≤ 6.25)
c) El número k tal que P (X > k) = 0.3
33.- Las calificaciones de una prueba final de una cierta signatura tienen distribución normal con
media de 12. Si el 95.44% de los examinados obtuvieron calificaciones entre 8 y 16.
a) Calcule la desviación estándar. Rpta. 2
85
34.-. El número promedio de personas que comen en un restaurante es aproximadamente normal, con
una media de 250 y una desviación estándar de 20 por día.
a) Si el consumo promedio por cliente es de $4 ¿Cuál es el consumo diario esperado? Rpta. $1000
b) ¿Cuál es la probabilidad exceda a $1,100? Rpta. 0.1056
probabilidad de que el consumo exceda
35.- Suponga que la demanda mensual de un bien de consumo se distribuye normalmente con una
media de 650 kg y una desviación estándar de 100 kg.
a) ¿Qué probabilidad hay de que la demanda no supere los 500 kg? Rpta. 0.0668
b) ¿Qué cantidad del bien debe
debe haber mensualmente a fin de
de satisfacer la demanda máxima en un
89.8 %? Rpta. 777 Kg
37.- En base a pruebas y la experiencia, un fabricante de lavadoras mecánicas modelo 101XE, decide
que la vida media con uso familiar normal es de 5.8 años, con desviación
desviación estándar de 2 años. Si la
vida de este modelo presenta distribución normal:
a) ¿Qué garantía debe ofrecer si está dispuesto a reparar únicamente al 1% de las lavadoras
vendidas?
b) Si da una garantía de dos años ¿Qué porcentaje de llas
as máquinas necesitarán reparación antes que
expire el período de garantía?
38.- Una máquina automática que expende café llena los vasos con 6 onzas de café, con desviación
estándar de 0.40 onzas. Si se usan vasos de 7 onzas ¿Qué porcentaje de ellas se derramarán?
39.- Suponga que el ingreso familiar mensual en una comunidad tiene distribución normal con media
de $400 y desviación estándar $50.
a) Si el 10% de las familias debe pagar un impuesto. ¿A partir de qué ingreso familiar se debe pagar
el impuesto? Rpta. $464
b) Si el ahorro familiar está
está dado por la relación Y = X - 50
4
¿Cuál es la probabilidad de que el ahorro sea superior a $75? Rpta. 0.0228
DISTRIBUCIONES MUESTRALES
86
La distribución
(media de la
muestral), media que
valores muestral es la distribución
se obtienen a partir dedetodas
todoslaslosposibles
valores que toma el
muestras deestadístico
tamaño n
tomadas de la población.
A continuación, se presentan dos resultados importantes:
• Si la variable aleatoria X sigue una distribución Normal, la distribución de la variable aleatoria x
es Normal, es decir:
2
• Si X ~ N ( , 2 ) entonces X ~ N ( , ) Si la variable aleatoria X no sigue una distribución
n
Normal, entonces por el teorema del límite central, para n suficientemente grande (n > 30), la
distribución de la variable aleatoria x es aproximadamente Normal, es decir:
2
X N ( , )
n
La media de la med
media
ia mue
muestr
stral
al y la var
varian
ianza
za de la med
media
ia mue
muestr
stral
al se repre
represen
senta
ta como X y
respectivamente, además:
X
2
2
X
n
TEOREMA: Si la variable aleatoria X sigue una distribución N(μ, 2 ), la variable aleatoria:
x
z
n
Donde:
x : media muestral
: media poblaciona
poblacionall
: desviación estándar poblacional
poblacional
n: tamaño de la muestra.
Ejemplo 1.- La distribución de la cantidad de cereal que una máquina vierte en cajas de tamaño
económico, tiene un peso X que se distribuye normalmente con media 0.999 kg y desviación
estándar 0.05 kg. Si se eligen 4 cajas al azar. ¿Cuál es la probabilidad de que el promedio de los
pesos netos de las 4 cajas esté entre 0.999 y 1.049
1.049 kg?
Solución
x
z
Sabemos que
n
87
0.999 0.999 1.049 0.999
Hallaremos P ( 0.999 X 1.049) P Z
0.05 4 0.05
4
Ejemplo 2. Si la distribución del peso de los caballeros que viajan por avión entre dos ciudades tiene
una media de 163 libras y una desviación estándar de 18 libras. ¿Cuál es la probabilidad de que el
peso total combinado de 36 de esos pasajeros sea mayor de 6,000 libras?
36
Solución: Hallaremos P X i 6000
i 1
n
X n
i 1
i
6,000 36 ( 163 )
Z 1.22
2 2
n 36 (18 )
X n
i 1
i
X 6000
Otro método: Z en donde X 166.67
n
2 36
n
x
z
Enseguida aplicamos la fórmula
n
166.67 163
Z 1.22
18
36
90.2 100 109
109.8 100
P Z 0.95
15 15
n n
Lo cual significa que P(-1.96 ≤ Z ≤ 1.96 ) = 0.95
109.8 100 15
1.96 1.96 9.8
Por lo tanto 15 n
n
29.4
9.8 n 3 n9
n
Ejemplo 4. Los tiempos de espera para los clientes que pasan por una caja registradora a la salida
de una tienda de menudeo son variables aleatorias independientes con una media de 1.5 minutos y
una varianza de 1. Estime la probabilidad de que se pueda atender a 100 clientes en menos de 2
horas.
Solución
Z
X i n 12
0 100
120 100 (1.5
1.5)
3 P( Z 3) 0, 00135
2
n 100 (1
(1))
120
Otro método: Se sabe que X 1, 2
100
.2 1.5
1
allaremos P( X 1.2) Z
3
1
100
Sea X
1 , X 2 , n una muestra aleatoria de tamaño n
X 3 ,…., X n,, con distribución Bernoulli con
con
parámetro π, donde: π : Proporción de éxitos en la población
Si la proporción de éxitos en la muestra (p), sigue una distribución Binomial. Entonces, la media y la
varianza de p se obtienen de la siguiente manera:
89
p
(1 )
2 p
n
OBSERVACIÓN
p
z
(1 )
n
Donde:
p: proporción muestral
muestral
: proporción poblaciona
poblacionall
n: tamaño de la muestra.
Ejemplo 1. La persona encargada de recibir los pedidos de cierto artículo tiene la siguiente política:
selecciona una muestra de 400 artículos; si 3 % ó más de los artículos son defectuosos rechaza el
pedido, en caso contrario, lo acepta. Hallar la probabilidad de rechazar un pedido si en toda la
población el 2 % de artículos
artículos son defectuosos.
Solución
Hallaremos P p 3 %
Luego P ( Z 1.4
1.433 ) = 0.0764
ˆ 0.30
P p
ˆ
p p
Z
pq N n
n
N 1
90
30 0.20
0.3
0.
Z 2.63
0.8 10 00 1 00
0 .2 x 0.8
1 00
9 99
P ( Z 2, 6
63
3) 0.00427
EJERCICIOS PROPUESTOS
2. La distribución de los ingresos anuales de todos los administrativos de una determinada institución
educativa y con cinco años de experiencia sigue una distribución normal con una media de $19,000 y
una desviación estándar de $2,000. Si extraemos una muestra aleatoria de 30 administrativos ¿cuál es
la probabilidad de que sus ingresos promedios sean más de $19,750 anualmente?
3. En una muestra de 25 observaciones a partir de una distribución normal con media 98.6 y
desviación estándar 17.2,
a) ¿Cuánto vale P(92 < x < 102)?
b) Encuentre la probabilidad
probabilidad correspondiente dada una
una muestra de 36.
3. Dionis
Dionisio
io Rom
Romero
ero P
Paol
aolett
ettii dueño de una gran compañía de tarjetas
de crédito
$112 sabe que elestándar
y la desviación saldo promedio
es $56. mensual de un
Si Dionisio cliente
audita 50 dado es
cuentas
seleccionadas al azar, encuentre la probabilidad de que el saldo
promedio mensual de la muestra
muestra sea:
a) Menor que $100.
b) Entre $100 y $130.
$130.
5. A partir
partir de una pobla
població
ciónn de 125 artíc
artículo
uloss con med
media
ia de 105 y des
desvia
viació
ciónn están
estándar
dar de 17, se
eligieron 64 artículos.
a) ¿Cuál es el error estándar de la muestra?
b) ¿Cuál es la P(107.5
P(107.5 < x < 109)?
91
8. Supo
Supong
ngaa que
que la pr
prop
opor
orción de padr
ción padres
es as
asis
iste
tent
ntes
es a las
las
reuniones del colegio “ABC” en la población es en realidad igual a
0.55. En una muestra de 45 padres de familias ¿cuál es la
probabilidad que la proporción muestral de padres asistentes a las
reuniones del colegio “ABC” sea mayor al 60%?
9. Reportajes en periódicos nos dicen que el estadounidense tiene sobrepeso. Muchos de nosotros
hemos tratado de bajar de peso cuando terminamos la preparatoria o la universidad. Y en efecto, sólo
19% de adultos dicen que no sufren de problemas de pérdida de peso. Suponga que la cifra de 19%
es correcta y que se selecciona una muestra aleatoria de n= 100 adultos.
a. La distribución de p, es decir, la proporción muestral de adultos que no sufren de excesos de peso,
tiene una distribución normal aproximada ¿cuál es su media y desviación estándar?
b. ¿Cuál es la probabilidad de que la proporción muestral p exceda a 0.25?
15. Se toma una muestra aleatoria de 200 unidades producidas en una hora por una máquina. Se sabe
que el 10% de las unidades producidas son defectuosas. ¿Cuál es la probabilidad de que en la
muestra tomada, 16 o más artículos resulten defectuosos?
17. Se tiene establecido que las facturas de los clientes tienen una desviación estándar de S/. 45. Si se
toma una muestra de 225 facturas. ¿Cuál es la probprobabilid
abilidad
ad de que el valor medio de la muestra se
desvíe de la media de todas las 2,000 facturas por S/: 7.5 soles o más? Rpta. 0.008
18. Una investigadora de una empresa cafetalera sabe que el consumo mensual de café por casa está
normalmente distribuida, con una media desconocida y una desviación estándar de 0.3 kg.
Si se toma una muestra aleatoria de 36 casas y se registra su consumo de café durante un mes. ¿Cuál
es la probabilidad de que la media de la muestra difiera de la verdadera media en menos de 100
gramos? Rpta. 0.9544
93
INTERVALOS DE CONFIANZA
TAMAÑO DE LA MUESTRA Y
MUESTREO.PRUEBA
MUESTREO.PRUE BA DE HIPÓTESIS.
ANÁLISI DE VARIANZA.
REGRESIÓN Y CORRELACIÓN
LINEAL. CHI CUADRADO
94
X Z X Z
2 n 2 n
El nivel de confianza (1- α) es la probabilidad de que la estimación efectuada se ajuste a la realidad;
es decir, que caiga dentro de un intervalo determinado basado en el estimador y que capte el valor
verdadero del parámetro a medir.
Nota
- Cuando la población es finita de tamaño N y el tamaño de la muestra es mayor del 5 % con
respecto a N, se debe usar el factor de corrección para población finita.
Ejemplo 1.- Un director de producción sabe que la cantidad de impurezas contenida en los envases
de cierta sustancia química sigue una distribución normal con una desviación estándar de 3.8 gr. Se
extrae una muestra aleatoria de 9 envases cuyos contenidos de impurezas son los siguientes:
18.2 16.6 13.7 12.3 15.9 18 17.4 16.2 y 21.8
Determinar un intervalo de confianza del 95% para a media
Solución: Dado que σ es conocida utilizaremos la variable Z para dicha estimación
X Z X Z
2 n 2 n
95
luego los límites de confianza estarán dados por X Z / 2 x
3.8
16.67 1.96 16.67 2.48 14.2 19.2
9
Ejemplo 2.- Supongamos que un investigador está interesado en estimar el nivel medio de alguna
enzima en cierta población, toma una muestra de 10 individuos, determina el nivel de la enzima de
cada uno y obtiene una media igual a 22. Suponga además que la variable de interés está distribuida
normalmente con varianza de 45. Encuentre un intervalo de confianza del 98% para la media
poblacional.
luego los lí
lím
mites de con
confi
fia
anza estarán dados por X Z /2 x
6.7082
22 2.33 22 4.94 17.06 26.94
10
La cantidad
cantidad promedio
promedio de dicha
dicha enzima estaría entre 17 y 27 aproxim
enzima estaría aproximada
adame
mente
nte
X
T cuya distribuci ón es t de Student con n 1 grados de libertad
S
n
Ejemplo 1.- En el departamento de personal de una compañía grande se requiere estimar los gastos
familiares
familiares en odontolog
odontologíaía de sus empleados para determ
determinar
inar la factib
factibilidad
ilidad de proporcio
proporcionarles
narles un
plan de seguro dental. Una muestra aleatoria de 10 empleados reveló los siguientes gastos (en
dólares) durante el año anterior:
110 362 246 85 510 208 173 425 316 179
Establezca un intervalo de confianza del 90% para el gasto promedio familiar en odontología
Solución: En este caso como la varianza σ2 es desconocida utilizaremos la variable T de Student:
s s
X t X t
2 n 2 n
Cálculos
Para n 10 se tiene que X 261.4 S 138 .8
luego los límites de confianza estarán dados por X t / 2 S x
138.8
261.4 1.8331 261.4 80.46 180.9 341.9
10
Podemos concluir con un 90% de confiabilidad que el gasto promedio familiar en odontología en
dicha empresa es de 261.4 dólares con un margen
m argen de error de 80.46 dólares.
También podemos concluir con un 90% de confiabilidad de que el gasto promedio familiar en
odontología en dicha empresa estaría entre 181 y342 dólares.
Ejemplo 2.- Una compañía emplea 200 agentes de ventas; en una muestra aleatoria de 25 los
auditores encontraron un gasto promedio de $220 con una desviación estándar de $20 en sus cuentas
de gasto de representación en una semana. Establezca un intervalo de confianza del 98% para el
gasto promedio semanal.
n
Solución: En este caso dado que N es conocido y 5% usaremos el factor de corrección para
N
poblaciones finitas; por lo tanto:
Los límites de confianza estarán dados por X t / 2 S x
20 200 25
220 2.4922 220 9.3 210.7 229.3
25 200
Ejemplo 3.- Se desea determinar el peso total de una partida de 10,000 naranjas. Como solo se tiene
una balanza pequeña y además no se dispone de tiempo; se selecciona una muestra aleatoria de 16
naranjas, la cual da una media de 175 gramos y una desviación estándar de 25 gr. Determinar un
intervalo de confianza del 98% para el peso total de la partida de naranjas.
Solución:
El peso total estimado estará dado por:
N X 10,000
( 175 ) 1750000
gr o sea 1,750 kg .
Ahora estimaremos un intervalo de confianza para el peso total de las naranjas; para lo cual
primeramente estimaremos un intervalo de confianza para el peso
peso promedio por naranja.
97
Loss límites de confianza
Lo estarán dados por X t / 2 S x
25 10,000 16
175 2.6025 175 16 .2526 158 .7474 191 .2526
16 10,000
Luego
Lu ego 10,000 ( 158 .7474 ) N 10 ,000 ( 191 .2526 )
1587474 N 1912526 o sea 1587.5 N 1912.5
Es decir el peso total de las naranjas estaría entre 1,587 .5 y 1,912 .5 kg
Ejemplo 4.- Un sondeo efectuado en 400 familias de cierta clase social de una ciudad encontró un
gasto mensual promedio de S/74 en productos de tocador con desviación estándar de S/ 40.
¿Con qué nivel de confianza se puede afirmar que el gasto promedio mensual en artículos de tocador
está entre 71 y 77?
Solución: En este caso utilizaremos la variable Z por ser una muestra muy grande
Sabemos que el m arg en de error : e está dado por Z / 2 x
S
En este caso ˆ x
Z / 2 e Z / 2 e
n
40
Z / 2 3 Z / 2 ( 2 ) 3 Z / 2 1.5
400
Luego el nivel de confianza estará dado por : P ( 1.5 Z 1.5 ) 0.8664
98
Sea X1, X2, X3,………………………,Xn una muestra aleatoria de tamaño n escogida de una
población de Bernoulli B(1,p) cuy
cuyoo parámetro p es la proporción de ééxitos
xitos en la población.
población.
El estimador puntual de p es:
X
n
i
i 1 X N º de éxitos en la muestra
ˆ
p
n n n
Sabemos que:
E p
ˆ p
p q p (1 p )
V p
ˆ n n
ˆ p
p
Z tiene distribución aproximadamente N (0,1)
p (1 p)
n
ˆ qˆ
p ˆ qˆ
p
ˆ Z / 2
p n p
pˆ Z / 2 n
n
Nota.- Si el muestreo es sin reemplazo en una población finita de tamaño N y 5%
N
entonces resulta adecuado
adecuado usar el factor de corrección por población finita.
Ejemplo 1.- En cierta ciudad, se entrevistó a una muestra de 500 bebedores de cerveza, hallándose
que 114 de ellos preferían la marca X a la de Y. Hállese el intervalo de confianza del 98% para la
fracción de bebedores de cerveza de esa ciudad que prefieren la marca X.
Solución:
x N º de bebedores de cerveza que prefieren la marca X
ˆ
Sea p propo
proporción
rción muestral pˆ
n Tamaño de muestra
114
luego ˆ
p 0.228
500
99
ˆ (1 p
p ˆ) ˆ (1 p
p ˆ)
ˆ Z
p p pˆ Z
2 n 2 n
ˆ ( 1 p
p ˆ) 0.228 x 0.772
ˆ
p Z 0.228 2.33
2 n 500
Ejemplo 2.- De una lista de opinión pública, se invita a 100 personas de un total de 1,000 a expresar
su preferencia por los productos A y B; 30 personas prefirieron A, de esto se concluye que entre 210
y 390 de la población prefieren el producto A. ¿Qué nivel de significación se usa en este informe?
Solución:
n
En este caso dado que N es conocido y 5% usaremos el factor de corrección para poblaciones
N
finitas.
30
Se tiene que : n 100 N 1, 000 ˆ
p 0.30
100
ˆ (1 p
p ˆ) N n 0.30 x 0.70 1,000 100
ˆ Z
p Z / 2 0.09
2 n N 10
100
0 1,000
Ejercicios Propuestos
1. Una encuesta efectuada a una muestra aleatoria de 150 familias en cierta comunidad
urbana reveló que, en el 87 por ciento de los casos, por lo menos uno de los miembros de la
familia tenía alguna forma de seguro relacionado con la salud. Construir un intervalo de
100
confianza del 99 por ciento para la proporción real ( P ) de familias en la comunidad con las
características de interés.
2. Una muestra
muestra de 100 hombhombres
res adulto
adultoss aparent
aparentemente
emente san
sanos,
os, de 25 años de edad, muestran
muestran una
presión sistólica sanguínea media de 125. Si se supone que la desviación estándar de la población es
de 15, calcular el intervalo de confianza del 90 por ciento para .
3. En un estudio diseñado para establecer la relación entre un medicamento y cierta anomalía en los
embriones de pollo, se inyectaron con el medicamento 50 huevos fecundados al cuarto día de
incubación. En el vigésimo día de incubación se examinaron los embriones y se observó la presencia
de la anomalía en 12 de ellos.
ellos. Encontrar un intervalo de confianza
confianza del 90 por ciento para P.
4. En una muestra de 60 pacientes la cantidad mínima requerida para que un anestésico surta efecto
en una intervención quirúrgica fue por término medio de 50 mg, con una desviación típica de
10,2 mg, Obtener un intervalo de confianza para la media al 95%, suponiendo que la muestra fue
extraída mediante muestreo aleatorio simple sobre una población normal
5. Un psicólogo advierte que el tiempo medio de reacción de 36 ratas a un choque eléctrico de 18
voltioss es de 0.45 segundo
voltio segundos,
s, con desv
desviación
iación estánda
estándarr de 0.06 segundo
segundos.
s. Encu
Encuentre
entre un inter
intervalo
valo de
confianza del 90% para el tiempo medio de reacción de todas las ratas de la misma cepa a un choque
de 18 voltios?
6. Un estudio de 50 hogares de cuatro personas cada uno, tomados aleatoriamente, que viven en
cierta ciudad, mostró un gasto promedio de 76 dólares por semana en alimentos, con desviación
estándar de 3 dólares. Encuentre el gasto semanal promedio en alimentos en todos los hogares de
cuatro personas en dicha ciudad, con una confianza de un 98%.
7. Una muestra aleatoria de 49 personas que habitan en apartamentos de dos piezas en cierta ciudad,
mostró que pagaban un alquiler mensual promedio de $129.5 con desviación estándar de $18.75
Construya un intervalo de confianza del 99% para el alquiler promedio mensual pagado por
apartamentos de dos piezas en dicha ciudad. Rpta [122.3 ; 136.7]
8. Un analista de investigación de mercados escoge una muestra aleatoria de 100 clientes de un
conjunto
El de 500
encuentra clientes
que de una gran
los clientes de latienda que gastaron
muestra declaran sus
en ingresos
la tiendamayores a $800.de $2,500 por
un promedio
año. Si con este valor de la muestra se estima que el gasto promedio de la población varía entre
2,446 a 2554. ¿Qué nivel de confianza se utilizó? Suponga que la desviación estándar de la
$300. Rpta. 0.9556
población es de $300.
9. Para determinar el rendimiento anual de ciertos valores, un grupo de inversionistas tomó una
muestra aleatoria de 49 de tales valores encontrando una media de 8.71% y una desviación estándar
de 2.1%.
a) Estime el verdadero rendimiento anual promedio de tales valores mediante un intervalo de
confianza del 96%. Rpta. [8.1% ; 9.3%]
b) Calcule el nivel de significancia si el rendimiento anual promedio de todos los valores se estima
entre 7.96% y 9.46%. Rpta. 0.0124
10. El Gerente de ventas de la tienda “CREDITOS” quiere determinar el porcentaje de clientes
morosos por más de $100. Una muestra aleatoria de 200 de tales clientes de la tienda reveló que 50
de ellos eran morosos.
101
a) Halle un intervalo de confianza del 98% para la proporción de clientes morosos por más de $100?.
b) Si la estimación de la proporción de clientes mmorosos
orosos está en el intervalo [0.183 ; 0.317]. ¿Con
qué grado de confianza se realizó esta investigación?. Rpta. 0.9714
11. El consumo regular de cereales preendulzados contribuye a la caída de los dientes, enfermedades
del corazón y otros procesos degenerativos. En una muestra aleatoria de 20 porciones sencillas de un
cereal el contenido promedio de azúcar fue de 11.3 gr con desviación estándar de 2.45 gr.
Suponiendo que los contenidos de azúcar están distribuidos normalmente. Determine un intervalo de
confianza del 95% para el contenido promedio de azúcar en porciones sencillas de dicho cereal.
Rpta 10.15 < µ < 12.45
12. Algunos investigadores creen que la vitamina C puede ser útil para reducir el colesterol en las
paredes internas de las arterias. Se observa el nivel de colesterol de 50 personas (con niveles de
colesterol mayores que lo normal) antes y después de un tratamiento de un mes bajo un régimen de
500 mg de vitamina C por día, obteniéndose una media de 64.3 mg/100ml y desviación estándar de
18.9 mg en la disminución del nivel de colesterol. Estime la disminución promedio por persona del
nivel de colesterol, usando un intervalo de confianza del 90%. Rpta 59.8 < µ < 68
68.8
.8
13. Se determinaron los niveles del PH de la saliva en una muestra aleatoria de niños de escuela
primaria, los cuales presentaban
presentaban una alta incidencia de caries.
caries. Los resultados fueron los
los siguientes:
7.36 7.04 7.19 7.41 7.10 7.15 7.36 7.57 7.64 7.00 7.25 7.19
Halle un intervalo de confianza para la media con un 98% de confiabilidad.
14. Ciertos investigadores se interesan por la calidad del aire; uno de estos indicadores es el número
de microorganismos de partículas de suspensión por m 3. Para controlar la situación se hace una
lectura cada 6 días extrayendo 1m 3 de aire a través de un filtro y determinando el número de µg de
partículas concentradas en él. Los datos observado
observadoss para un período de 30 días fueron:
58 70 57 61 59.
Supóngase que por experiencias anteriores se sabe que la variable número de microorganismos de
partículas está distribuida normalmente con varianza de 9. Halle un intervalo de confianza para la
media con α = 0.01 Rpta 58 < µ < 64 aproximadamente
15. Se pretende estimar el número promedio de latidos por minuto para cierta población. Se encontró
que el número promedio de latidos por minuto para 49 personas era de 90. Considere que esos 49
pacientes constituyen una muestra aleatoria y que la población sigue una distribución normal, con
una desviación estándar de 10. Use α = 0.02 Rpta 87 < µ < 93
16. Entre 100 peces capturados en cierto lago 18 no eran comestibles debido a la contaminación del
medio ambiente. ¿Con qué confianza se puede asegurar que el error de estimación es a lo mucho de
0.065? Rpta. 0.909
17. En una muestra al azar de 127 niños de guarderías infantiles se han diagnosticado 7 niños con
sintomatología autista y 12 niños con enuresis nocturna. Utilizando α = 0.05.
a) Determine un intervalo de confianza para la proporción de niños autistas que hay en la población,
origen de la muestra. Rpta. 0.015 < p < 0.095
b) Determine un intervalo de confianza para la proporción
proporción de niños con enuresis nocturna que hay en
la población, origen de la muestra. Rpta. 0.043 < p < 00.14
.14
MUESTREO: Técnica estadística que permite seleccionar los elementos que se analizarán o
evaluarán de la población.
Se pueden realizar diferentes tipos de muestreo, que quedan clasificados en dos grandes grupos:
probabilísticos y no probabilísticos. En el muestreo probabilístico, todos los individuos o elementos
de la población tienen la misma probabilidad de ser incluidos en la muestra extraída, asegurándonos
la representatividad de la misma. En el muestreo no probabilístico, por su parte, los elementos de la
muestra se seleccionan siguiendo criterios determinados.
MUESTREO PROBABILISTICO
Muestreo aleat
Muestreo aleatorio simplee, cuan
orio simpl cuando
do todo
todoss los
los elem
elemen
ento
toss de la po pobl
blac
ació
iónn tiene
tienenn la mi
mism
smaa
probabilidad de ser seleccionados en la muestra y esta probabilidad es conocida. Este tipo de
muestreo es más recomendable, cuando las unidades de análisis son relativamente homogéneas. Para
seleccionar una muestra de este tipo se requiere tener en forma un listado
l istado de todos los elementos que
integran la población investigada y utilizar tablas de números aleatorios o un software estadístico.
Muestreo aleatorio sistemático , el cual es susceptible de ser más preciso que el muestreo aleatorio
simple. Se elige un primer elemento luego se van escogiendo los demás elementos a intervalos
constantes a partir del primero hasta completar el tamaño de la muestra.
Muestreo aleatorio estratificado, se usa para estimar parámetros de poblaciones muy heterogéneas,
consistes en la separación de las unidades de la población en grupos o estratos, de tal manera que
entre estratos haya cierta heterogeneidad,
heterogeneidad, pero además exista cierta homogeneidad dentro ddee cada
estrato. De cada estrato se extrae una muestra aleatoria simple.
Muestreo aleatorio conglomerado, no se necesita un marco muy específico como en el caso del
muestreo aleatorio simple en el que era necesario disponer de un listado de unidades de la población,
o como en el muestreo estratificado, donde era necesario disponer de listados de unidades por
estratos. Se divide previamente a la población en conglomerados o áreas convenientes, de los cuales
se seleccionará algunos de ellos para la muestra, con lo que sólo es necesario un marco de
conglomerados que será más fácil de conseguir y más barato. Se pueden utilizar como marco
divisiones territoriales ya establecidas por necesidades administrativas para las cuales existe ya
información. También se pueden utilizar como marco áreas geográficas cuyas características están ya
muy delimitadas.
Tamaño de muestra(n)
PARA ESTIMAR LA MEDIA PARA ESTIMAR LA PROPORCIÓN
SITUACIÓN
POBLACIONAL POBLACIONAL
2
z .
2
z 2 . p.q
N ES INFINITA n 2
n 2
e
2
e2
2 2
z . N .
z 2 . N . pq
N ES FINITA n 2
n 2
Donde:
103
Precisión de estimación (e) llamado también margen de error o error de muestreo y viene a ser la
diferencia máxima que existirá entre el valor del estadístico y el parámetro.
z es llamado coeficiente de confiabilidad cuyo valor se encuentra en la tabla de la distribución
2
normal estándar y va depender del nivel de confianza.
N corresponde al tamaño de la población.
2 es la varianza poblacional.
p es la proporción que posee la característica que se estudia.
q es la proporción que no posee la característica que se estudia. (q =1- p)
Ejercicios Desarrollados
a) ¿Qu
¿Quéé ni
nivel
vel de cconf
onfian
ianza
za ssee ut
utiliz
ilizó?
ó?
Datos
Z x e
2
Lueg
Luegoo el
el ni
nive
vell de conf
confia
ianz
nzaa sser
erá:
á: .233 Z 2.23 ) = 0.9743
P ( - 22.2
Es decir se tiene una confianza del 97.43 % de que la media muestral X $1,000 difiere de
la media verdadera en a lo más $ 60.
b) De qué tamaño tendrá que ser la muestra para que se tenga una confianza del 97 %
de que, al estimar la media de la población, el error de estimación no sea mayor a
$ 50.
Z 2 2 N
( 2.17 ) 2 ( 300 ) 2 500
n 2
126.8 127
2
Z
2
2 e2 ( N 1 ) 2 2
( 2.17 ) ( 300 ) ( 50 ) ( 499 ) 2
Ejemplo 4. En una determinada región se tomó una muestra aleatoria de 125 individuos, de
los cuales 12 padecían afecciones pulmonares
pulmonares..
a) Estímese la proporción de in
individuos
dividuos con afecciones
afecciones pulmonare
pulmonaress en dicha región; con un
95% de confiabilidad.
b) Si queremos estimar dicha proporción con un error máximo del 4%, con una confianza
del 95%, ¿qué tamaño de muestra debemos tomar?
105
p
ˆ qˆ
en con sec uencia los límites serán ˆ Z / 2
p
n
0.096 x0.904
0.096 1.96 luego 0.096 0.052
125
- Pod
Podemo
emoss afir
afirmar
mar co
conn un 95% de cconf
onfiab
iabili
ilidad
dad que
que la propor
proporcióciónn de person
personas
as que
que
padecen de afecciones pu
pulmonares
lmonares en dic
dicha
ha región estaría eentre
ntre el 4% y 15%
- Ta
Tamb
mbié
iénn po
pode
demo
moss afir
afirma
marr con
con un 95
95%% de co conf
nfia
iabi
bili
lida
dadd qu
quee la prprop
opor
orci
ción
ón de
personas que padecen de afecciones
afecciones pulmonares en dicha región es del 9.6%, con un
margen de error de 5.2%
b) Si quere
queremos
mos estim
estimar
ar dicha pr
propor
oporción
ción con un er
error
ror máx
máximo
imo del 3%, para un
unaa
confianza del 95%, ¿qué tamaño de muestra debemos tomar?
ˆ qˆ
p
Sabemos que Z / 2
n e (m arg en de error )
2
ˆ qˆ
Z / 2 p
luego n 2
Cuando no se conoce N
e
Con una muestra de 371 personas estaremos 95% seguro, que a partir de dicha muestra
obtendremos una proporción muestral cuyo valor diferirá de la verdadera proporción en a lo
más 0.03
.
EJERCICIOS PROPUESTOS
1. Se ha pr
proy
oyec
ecta
tado
do una
una encu
encues
esta
ta para
para dete
determ
rmin
inar
ar los
los gast
gastos
os
médicos anuales promedio por familia de los empleados de una
gran compañía. La administración de la compañía desea tener una
confianza del 95% de que el promedio de la muestra esté correcto
en una escala de ± $50 de los gastos reales promedio por familia.
106
Un estudio piloto señala que la desviación estándar se puede estimar como $400. ¿Qué tamaño de
muestra se necesita?
2. Si un ger
gerent
entee de contr
control
ol de cal
calida
idadd qu
quisie
isiera
ra estim
estimar
ar la vid
vidaa pro
promed
medio
io de un produ
producto
cto en una
escala ± 20 horas con una confianza del 95% y también supone que la desviación estándar del
proceso permanece en 100
100 horas ¿qué tamaño de de muestra se necesita?
4. Si una compañía
compañía de gas quisi
quisiera
era estim
estimar
ar el tiempo de espe
espera
ra promed
promedio
io en días, den
dentro
tro de ±5 días
con una confianza del 95% y si se supone que la desviación estándar de la población es de 20 días
¿qué tamaño de muestra se necesita?
5. Un analista
analista políti
político
co quisie
quisiera
ra estimar la pro
proporc
porción
ión de votan
votantes
tes
que elegirán al candidato demócrata en una campaña presidencial.
El analista quisiera tener una confianza del 90% de que su
predicción esté correcta en una escala de ±0.04 de la proporción
real. ¿Qué tamaño de muestra se necesita?
6. El geren
gerente
te de un banco quier
quieree tener una conf
confianza
ianza de
dell 90% de estar en lo correc
correcto
to en una escala
de ± 0.05 de la proporción real de depositantes, que tienen al mismo tiempo cuentas de ahorro y de
cheques. ¿Qué tamaño de muestra se necesita?
7. ¿Q¿Qué
ué tama
tamaño
ño de mu muesestr
traa se nece
necesi
sita
tará
rá si una
una comp
compañ
añía
ía de
autobuses
autobuses quisier
quisieraa reali
realizar
zar una encue
encuesta,
sta, en la que desearía tener
una confianza del 95% de estar en lo correcto en una escala de ±
0.02 de la proporción real de viajeros que utilizarían el servicio de
autobús? En base a la experiencia con otras rutas, se supone que la
proporción real es de
de aproximadamente 0.40.
8. Un equipo de investigación médica está seguro sobre un suero que han desarrollado, el cual
curará cerca del 75% de los pacientes que sufren de ciertas enfermedades. ¿Qué tamaño debe ser la
muestra para que el grupo pueda estar seguro en un 98% que la proporción muestral de los que se
curan esté dentro de ± 0.04 de la proporción de todos los casos que el suero curará? Rpta. n = 637
107
Nº de unidades deectuosas 0 1 2 3 4 5 10 12
Nº de cajas examinadas 27 15 12 12 6 4 2 2
13. Se desea estimar el promedio de pH de las lluvias en un área que experimenta una gran
contaminación por parte de la descarga del humo de una planta de energía eléctrica. Si se sabe que la
desviación estándar tiene un valor de 0.5 pH y se desea que la estimación difiera a lo más en 0.1 de
la media verdadera con una probabilidad de 0.95. ¿Cuántas lluvias deben incluirse aproximadamente
en la muestra (una lectura de pH por lluvia)? Rpta. n = 97 aprox.
108
Pruebas de Hipótesis
1° Caso:σCuando
varianza 2
conocidala muestra proviene de una población normal con
Sea X la media de una muestra aleatoria de tamaño n seleccionada de una población con media y
varianza 2 supuestamente conocida.
Si la población es normal, entonces la distribución de la estadística X es exactamente normal
N (, 2/ n)
X
Z
N (0, 1)
n
Solución A partir de los datos obtenemos X 22,32 luego plantearemos las hipótesis:
1) Hipótesis H 0 : 24
H 1 : 24
2) Nivel de significac
ión : 0.05
X 22.32 24
3)Variable estadístuca Z 3.54
1.5
n 10
4) Re gla de decisión : Re chazaremos H 0 si Z 1.64
645
5
109
Ejemplo 2. La estatura media de los alumnos de cierta universidad es de 1.68 m con desviación
estándar de 5 cm. ¿Hay razón para creer, que se ha producido un cambio en la estatura promedio, si
una muestra de 25 estudiantes
estudiantes dio una estatura prom
promedio
edio de 1.70 m? Use α = 0.05
Solución
1) Hipó
Hipótesis
tesis H 0 : 1.68 m
H 1 : 1.68 m
2) Nivel de significación : 0.05
Por
Po r lo tan to la decisión será rechazar la hipótesis H 0
X
T
S
n
Ejemplo 1.- Una máquina vendedora de refrescos se ajusta para servir 6 onzas por vaso. La máquina
se pone en funcionamiento y se analiza una muestra de 9 vasos obteniendo un llenado medio de 6.4
onzas con desviación estándar de 0.5 onzas. A un nivel de significancia de 0.05. ¿Esto evidencia de
que la máquina está llenando demasiado los vasos?
Solución
Sea X la variable aleatoria que denota la can
cantidad
tidad servida por la máquina.
máquina. Se supone que la va
variable
riable
X se distribuye normalmente con media µ y varianza σ2 desconocida.
110
1) Hipóte
Hipótesis
sis H 0 : 6 onzas
H 1 : 6 onzas
2) Nivel de significación : 0.05
X 6.4 6
3) Variable estadística : T T 2.4
S n 0.5 9
Ejemplo 2.- En su calidad de comprador comercial para una marca privada de un supermercado,
suponga que se toma una muestra aleatoria de 12 sobres de café de una empacadora. Se encuentra
que el peso promedio de café de cada sobre es de 15.97 gramos con desviación estándar de 0.15 gr.
Los empacadores afirman que el peso neto promedio mínimo de café es de 16 gr por sobre. ¿Puede
rechazarse esta afirmación con un nivel de significación del 5%?
Solución
1) Hipóte
Hipótesis
sis H 0 : 16 onzas
H 1 : 16 onzas
2) Nivel de significación : 0.05
X 15.97 16
3) Variable estadística : T T 0.69
S 0.15
n 12
Ej
Ejem
empl 3.-- Cuando funciona correctamente; un proceso produce frascos de mermelada, cuyo
ploo 3.
contenido pesa en promedio 200 gramos. Una muestra aleatoria de 9 frascos de una remesa presentó
los siguientes pesos (en gramos) para el contenido:
214 197 197 206 208 201 197 203 209
Contrastar la hipótesis nula, de que el proceso está funcionando correctamente, al nivel del 5%.
Solución
1) Hipó
Hipótesi
tesiss H 0 : 200 gram
gramos
os
111
Ejemploo 4.- En el pasado una planta química ha producido un promedio de 1,100 kg/día de un
Ejempl
compuesto. Los archivos del año pasado en base a 260 días de operación muestran lo siguiente:
X 1,060 kg / día S 340 kg
1) Hipó
Hipótesis
tesis H 0 : 1,100 kg
H 1 : 1,100 kg
2) Nivel de significación : 0.05
5) Conclusión : Lo
Loss datos de la muestra evidencian que
qu e la pro
produ
du cci
cción
ón bajó sig nific
ni ficat
at ivamente
Ejemplo 5.- Se ha valorado el tiocianato en el plasma de los individuos de una muestra formada por
38 fumadores y se ha observado una media de 1.1 mg/l y una desviación estándar de 0.4 mg. El
tiocianato en el plasma de la población adulta presenta una media de 0.9 mg/l.
¿El consumo de tabaco está relacionado con el nivel de tiocianato en el plasma? Use α = 0.05
Solución:
Sea X la variable aleatoria que denota la cantidad de tiocianato en el plasma. Se supone que la
variable X se distribuye normalmente con media µ y varianza σ 2 desconocida.
1) Hipót
Hipótesis
esis H 0 : 0.9 mg
H 1 : 0.9 mg
112
2) Nivel de significación : 0.05
4) Re gla
gl a de decisión: Re chazaremos H 0 si T Vt
en donde Vt 1.6871 (Valor hallado en la tabla t de Student ) con n 1 gr
grad
ados
os de libertad
Ejemploo 6.- Las especificaciones de determinado medicamento exigen 30% de aspirina en cada
Ejempl
comprimido. Se toman aleatoriamente y analizan 16 comprimidos; la concentración media de
aspirina es 30.4% con desviación estándar de 0.8%. ¿El fármaco, cumple las especificaciones a nivel
de significación de 0.01?
Solución:
1) Hipótesis H : 30
0
H 1 : 30
2) Nivel de significación : 0.01
X 30.4 30
3) Variable estadística : T T 2
S 0.8
n 16
en donde V t
2.9467 (Valor hallado en la tabla t de Stud
udeent ) con n 1 grados de libertad
5) Conclusión :Tenemos razones sufuciente s como para concluir que el fármaco si cumple
con las especificaciones establecid as.
113
pˆ p
Z
pq
n
Ejemplo 1.- Una industria lechera está estudiando la posibilidad de cambiar sus botellas para la
leche por envases de plástico; pero el cambio no se hará a no ser que por lo menos 70% de sus
clientes lo prefieran. Cuando se ha hecho una encuesta a 200 de sus clientes, 120 de ellos están a
favor del cambio. ¿Hará el cambio de envases a un nivel de significancia de 0.05?
Solución:
1) Hipóte
Hipótesis
sis H 0 : p 0.7
H 1 : p 0.7
2) Nivel de significación : 0.05
5) Conclusión : No tenemos suficiente razón como para sugerir se haga el cambio de envase
Ejemplo 2.- Un fabricante de lavadoras automáticas produce un modelo particular en tres colores A,
B y C. De las primeras 1,000 lavadoras vendidas, se nota que 400 eran del color A. ¿Concluiría que
los clientes tienen una preferencia por el color A? Use α = 0.01
Solución:
1) Hipót
Hipótesis
esis H 0 : p 0.33
H 1 : p 0.33
2) Nivel de significación : 0.01
Ej
Ejem
empl
ploo 3.
3.-- De una lista de 2,000 clientes de un banco comercial se seleccionó una muestra
aleatoria para obtener opinión acerca del servicio. En la muestra se halló que 215 no tenían quejas
del servicio, 25 tenían quejas y 10 no opinan al respecto. Tradicionalmente el 5% tenían quejas del
servicio, sin embargo, se cree que ahora este porcentaje aumentó. ¿Cuál es la situación actual si se
quiere una probabilidad de 0.008 de cometer error de tipo I?
Solución:
1) Hipót
Hipótesis
esis H 0 : p 0.05
H 1 : p 0.05
2) Nivel de significación : 0.008
ˆ p
p 25
3) Variable estadística : Z en donde ˆ
p 0.10
n
pq N 250
n N
0.10 0.05
Z 3.88
250
0.05 x 0.95 2,000
250 2,000
Ejemplo 4.- Una compañía farmacéutica afirma que un fármaco que elabora alivia los síntomas del
resfriado común durante un período de 10 horas en el 90% de quienes lo ingieren. En una muestra
aleatoria de 400 personas que ingirieron el fármaco, 350 aliviaron durante 10 horas. Al nivel de
significación de 0.05 la afirmación del fabricante es exacta?
Solución:
1) Hi
Hipó
pótes
tesis
is H 0 : p 0.9
H 1 : p 0.9
115
2) Nivel de significación : 0.05
ˆ p
p 0.875 0.9
3) Variable estadística : Z Z 1.67
pq 0.9 x 0.1
n 400
4) Decisión : No rechazar H 0 ya que V t 1.96
Ejercicios Propuestos
Datos:
116
2.- Los siguientes valores son las presiones sistólicas sanguíneas (en mm de Hg) de 12 pacientes que
experimentan terapia con drogas debido a que padecen de hipertensión.
183, 152, 178, 157, 194, 163, 144, 114, 178, 152, 118, 158
¿Puede concluirse a base de estos datos que la media de la población es menor que 165?.
Utilice = 0,05.
INTRODUCCIÓN
El nivel bajo de hemoglobina
hemoglobina en gestantes durante el embarazo es pprevisible
revisible por las modif
modificaciones
icaciones
fisiológicas que suceden en el sistema circulatorio materno al final del embarazo, modificaciones a
las que se tiene que adaptar el cuerpo de la gestante. El nivel bajo de hemoglobina en la sangre de la
gestante puede conllevar a muchas patologías durante el embarazo, parto y puerperio,
puerperio, entre ellas el
parto pretérmino.
En el Hospital Santa Rosa se observa que la mayoría de las gestantes que acuden en el tercer
trimestre presentan un nivel de hemoglobina por debajo de lo normal, así como también se reportan
con frecuencia casos de amenaza de parto pretérmino; por lo cual se desea realizar un estudio para
evaluar la relación que existe entre el nivel de hemoglobina y el parto pretérmino.
ANTECEDENTES:
117
10.9 11.2 9.8 11.6 9.9 10.0 11.2 10.2 10.8 9.5 10.0 10.9 11.5 10.4 10.9
10.3 11.7 11.2 9.8 10.4 11.4 11.3 10.5 10.2 11.1 10.6 9.9 8.9 10.8 9.5
4.- Un fabricante de cereales afirma que el peso promedio de cada caja de cereal es de 500 gramos.
¿Los datos que a continuación
continuación se le dan apoyan la afir
afirmación
mación del fabricante? Pruebe con α = 0.10
506, 508, 499, 503, 504, 510, 497, 512,
514, 505, 493, 496, 506, 502, 509, 496
6.-Los húmeros de animales de la misma especie tienden a tener aproximadamente las mismas
razones longitud/anchura. Cuando se descubren húmeros fósiles, los arqueólogos con frecuencia
pueden determinar
de los huesos. la especie
Se sabe a la queApertenece
que la especie tiene unaelrazón
animal examinando
media las razones
de 8,5. Suponga que longitud/anchura
se desenterraron
41 húmeros fósiles en una excavación del África Oriental, donde se cree que habitó la especie A. Se
midieron las razones longitud/anchura de los huesos y se presentan en la
l a siguiente tabla:
7.- Las especificaciones de construcción en cierta ciudad requieren que las tuberías de desagüe
empleadas en áreas residenciales tengan una resistencia media a la ruptura de más de 2.500 libras por
pie lineal. Un fabricante que quisiera proveer a la ciudad de tubos para desagüe ha presentado una
licitación junto con la siguiente información adicional: un contratista independiente seleccionó al
azar siete secciones de los tubos del fabricante y determinó su resistencia a la ruptura. Los resultados
(libras por pie lineal) son los siguientes:
2610 2750 2420 2510 2540 2490 2680
¿Hay suficientes pruebas para llegar a la conclusión de que los tubos de desagüe del fabricante
cumplen con las especificaciones requeridas? Utilice un nivel de significación de un 10%.
8.- Un fabricante de cigarrillos afirma que sus cigarrillos no contienen más de 25 mg. de nicotina.
Una muestra de 16 cigarrillos tiene una media de 26.4 y una desviación estándar igual a 2.
¿Proporcionan estos datos suficiente evidencia para no estar de acuerdo con la afirmación del
fabricante? Use α = 0.05
9.- Al investigar prácticas comerciales pretendidamente desleales, una comisión estatal toma una
muestra aleatoria de 49 barras de chocolate de “9 onzas” de un gran despacho. La media de los pesos
118
muestrales fue de 8.94 onz y la desviación estándar 0.12. Mostrar que a un nivel de significación de
0.05, la comisión tiene fundamentos para proceder contra el fabricante.
10.- Se encuentra que el número promedio de empleados para una muestra de 50 empresas de una
industria específica es de 420.4 con una desviación estándar de 55.7 Existe un total de 380
empresas en ese ramo industrial. Antes de recolectar los datos, se planteó la hipótesis de que el
número promedio de empleados por empresa en esa industria no era superior a 408.
Pruebe esa hipótesis con un nivel de ssignificación
ignificación de 0.05.
11.- Al gerente del departamento de crédito de una compañía petrolera le gustaría determinar si el
saldo promedio mensual en contra de los tarjetahabientes
tarjetahabientes es igual a $75. Un auditor selecciona una
muestra aleatoria de 100 cuentas y encuentra que la deuda promedio es de $83.4 con desviación
estándar de la muestra de $23.65. Utilizando el nivel de significación de 0.05 ¿Debería el auditor
llegar a la conclusión de que existe evidencia de que el saldo promedio es diferente de $75?
12.- Las cajas de un cereal producidas en una fábrica deben tener un contenido de 16 onzas. Un
inspector tomó una muestra que arrojó los siguientes pesos en onzas:
15.7 15.7 16.3 15.8 16.1 15.9 16.2 15.9 15.8 15.6
Indicar si es razonable que el inspector, usando un nivel de significación del 5 % ordene se multe al
fabricante.
X 1,150
i 1
i X
i 1
i
2
13,249.75
14.- Ante un reclamo sobre el tiempo de realización de una tarea, los empleados de una compañía
sostienen que en promedio ellos completan la tarea en a lo más 13 minutos. Si Ud. Es el gerente de
la compañía.
¿Qué conclusión obtiene si para una muestra de 400 tareas se obtiene un promedio de tiempo de
terminación de 14 minutos? Se sabe que por información de trabajos similares, que los tiempos de
ejecución de la tarea tiene una distribución normal, con desviación estándar de 10 min.
Use = 0.05
15.- Un vendedor de seguros de vida dice que en promedio un trabajador en la ciudad de Lima
Metropolitana tiene no más de S/ 25,000 de seguro de vida personal. Para probar esto, muestrea
aleatoriamente 100 trabajadores en L.M. y encuentra que esta muestra de trabajadores promedia
S/ 26,650 de seguro de vida personal y que la desviación estándar es S/ 12,000.
Determine si la prueba muestra suficiente evidencia para rechazar la hipótesis nula planteada por el
vendedor. Use = 0.05
16.- Al estudiar si conviene o no una sucursal en la ciudad de Tarapoto, la gerencia de una gran
tienda comercial de Lima, establece el siguiente criterio para tomar una decisión. Abrir la sucursal
solo si el ingreso promedio familiar mensual
mensual en dicha ciudad es no menos de $500 y no abrirla en
caso contrario. Si una muestra aleatoria de 100 ingresos familiares de esa ciudad ha dado una
media de $480. ¿Cuál es la decisión a tomar al nivel de significación del 5 %
119
17.- Los sacos de café que recibe un exportador de cierto proveedor deben tener un peso promedio
de 100 kilos. Un inspector tomó una muestra de 50 sacos de un lote de 500 sacos de café
encontrando una media de 99 kilos y una desviación estándar de 3 kilos.
Con = 0.01 ¿Es razonable que el exportador rechace el lote de sacos de café?.
18.- Un investigador está realizando una prueba para determinar si una nueva medicina tiene el
efecto colateral de elevar la temperatura del cuerpo. Se entiende que la temperatura del cuerpo
humano se distribuye normalmente con una media de 98.6 ºF. Se administra la nueva medicina a 9
pacientes, se toman las temperaturas y se obtiene una media de 99 ºF y una desviación estándar de
0.36 ºF.¿Debería permitirse a la compañía poner a la venta la nueva medicina, si el nivel de
significación se especifica en 0.01?
19.- Cinco hipertensos reciben un nuevo fármaco que disminuye la presión arterial en:
14 25 13 18 20 ppuuntos respectivamente.
¿El nuevo fármaco disminuye la presión arterial en por lo menos 20 puntos?
21.-
21.- Se llevó a cabo un estudio sobre nutrición en un país en desarrollo. Una muestra de 500
campesinos adultos reportó un consumo diario de 1985 calorías con una desviación estándar de 210.
¿Puede concluirse a partir de estos datos que la media de la población es menor que 2,000?
Use α = 0.05
22.- Antes el número medio de ataques de angina de pecho por semana entre los pacientes era de
1.03. Se está probando un nuevo medicamento y se espera que reduzca esta cifra. Los datos se
obtienen mediante la observación de una muestra de 20 pacientes que están utilizando el nuevo
fármaco.
1 3 0 1 1 1 0 2 2 0 0 1 0
0 0 1 1 1 1 0
23.- Un productor de cápsulas de uña de gato envía al mercado en promedio 1,000 por semana. La
demand
dem andaa tie
tiene
ne distr
distribu
ibució
ciónn nor
normal
mal;; sin emba
embargo
rgo en un estud
estudio
io rec
recien
iente,
te, una mues
muestra
tra de 36
semanas dio una demanda promedio de 850 cápsulas y una desviación estándar de 360 cápsulas.
En el nivel de significación de 0.05. ¿Es posible concluir que la media de la demanda semanal está
bajando?
24.- El gerente de un laboratorio farmacéutico quiere determinar si cierto somnífero aumenta las
horas de sueño en las personas. Para este fin, selecciona una muestra aleatoria de 10 pacientes y
registra el número de horas de sueño ganadas al aplicar el somnífero a cada paciente; los resultados
fueron:
Paciente: 1 2 3 4 5 6 7 8 9 1100
Nº de horas: 1.2 -1.3 1.7 0.9 2.4 0.8 -1.0 1.8 2.0 2.1
Suponiendo que las horas de sueño ganadas con el somnífero en cada paciente es una variable
aleatoria con distribución normal. Al nivel de significancia del 5%. ¿Hay prueba de que el
somnífero aumenta las horas de sueño?
120
25.- Se sospecha que una nueva medicina es eficaz en menos del 90% para curar cierta enfermedad,
pero el laboratorio que la fabrica cree que es efectiva por lo menos en un 90%. En una muestra de
400 personas que tenían la enfermedad, 320 se curaron con la aplicación de la medicina. ¿Se ha de
concluir que la medicina es eficaz por lo menos en un 90%? Use α = 0.05
26.- Un fabricante de televisores afirma que su póliza de garantía que en el pasado no más de 10%
de sus aparatos de televisión necesitaron reparación durante sus primeros dos años de operación.
Con el fin de probar la validez de esta afirmación, una agencia de pruebas del gobierno selecciona
una muestra
muestra de 100 apara
aparatos
tos de televi
televisió
siónn y enc
encuen
uentra
tra que 14 de ellos
ellos req
requir
uirier
ieron
on alg
alguna
una
reparación dentro de los dos primeros años de operación.
Utilizando un nivel de significación de 0.01
¿Es válida la afirmación del fabricante o existe evidencia de que ésta no es válida?
27.- Una cadena de tiendas de ropa está considerando la propuesta de un fabricante sobre la venta
de un gran lote de camisas, a precios de liquidación.
El fabricante afirma que no más del 2 % de las camisas tienen defectos de fabricación. Los
representantes de la cadena inspeccionan una muestra de 400 camisas del lote y encuentran 15
camisas con defectos de fabricación.
¿Deberá la cadena rechazar la propuesta del fabricante, si ha decidido comprar el lote, a condición
de que lo afirmado por el fabricante sea cierto con una probabilidad de 1 en 10?
121
El
objetivo
odello análisis
que es es
que el demcontrastar
lomism
lomis o la
hipótesis
0 de que las medias poblacionales son iguales:
1 2 1 2
Nota.- En caso de existir duda sobre la igualdad de las varianzas debe llevarse a cabo la prueba de
igualdad de varianzas.
Ejemploo 1.- Un fabricante de cigarrillos anuncia que el contenido de alquitrán de los cigarrillos
Ejempl
marca B es menor que los de la marca A. Para probarlo se anotan los contenidos de alquitrán:
Ma rca A ( mg ) :
Mar 12 9 13 11 14
Marca B ( mg ) : 8 10 7
Solución
1) Hip
Hipótes
ótesis
is H 0 : A B
H 1 : B A
2) Nivel de significación : 0.05
122
3) Variable estadístic a : T
X B
X A A B
( n A 1) S A2 ( n B 1) S B2 1 1
n A n B 2 n
A n B
8.33 11.8
T 2.64
4 ( 3.7 ) 2 ( 2.33 ) 1 1
5 3 2 5 3
Ejemplo 2.- Se aplicó un mismo test a dos grupos de personas con el objeto de analizar si existe o
no diferencia entre
entre las puntuaciones medias; elija α = 0.05
Solución
1) Hi
Hipót
pótesi
esiss H 0 : 1 2
H 1 : 1 2
2) Nivel de significación : 0.05
3) Variable estadística : T
X
1 X 2 1 2
( n1 1) S 1 ( n2 1) S 2 1 1
2 2
n1 n2 2 n
1 n 2
20.14 27.33
T 2.73
6 (12.143) 5 ( 34.667 ) 1 1
7 6 2 7 6
123
en donde V t 2.201 ( Valor hallado en la tabla t de Student con 11 grados de libertad )
Por lo tan to la decisión será rechazar la hipótesis H 0
Ejemplo 3. La Directora de presupuesto de una cierta Compañía desea comparar los gastos diarios
(en dólares) respecto al transporte del equipo de ventas y del personal de cobranza. Recopiló la
siguiente información muestral:
Al nivel de significancia de 0.05 ¿Puede concluirse que los gastos medios diarios del equipo de
ventas son mayores?
H0: µ1 = µ2
H1: µ1 > µ2
α = 0.05
Cálculos
x1 14
142
2.5 x2 130.3
s1 149.9 s2 24
2 2
249
9.24
Decisión.- No rechazar H0
Conclusión.- Los datos de la muestra evidencian que los gastos promedios diarios en
transporte del equipo de ventas y del personal de cobranza son iguales.
CASO: Muestras dependientes o datos apareados
124
En este caso se supone que las muestras aleatorias no son independientes y se tomaron
aleatoriamente de poblaciones normales. En realidad; no se trata de dos grupos aleatorios,
sino de un solo grupo de sujetos al que se toman dos medidas o una medida en dos
momentos distintos. No hay necesidad de probar la igualdad de varianzas ya que es una sola
la población; así por ejemplo:
d
d i
T en donde d i 1
S d n
n
2
n
n
d i
d 2 i 1
i n
S
2 i 1
n 1
d
Ejemplo 1.- Un fabricante de productos alimenticios hace una prueba previa con cierto tipo de salsa
envasada, que puede preparar en una forma más espesa (A) o en otra forma menos espesa (B). Para
medir la preferencia por uno y otro tipo de salsa, utiliza una muestra de diez amas de casa, quienes
manifiestan sus preferencias por dichos tipos de salsa, con los siguientes resultados en puntajes
Salsa A ( ptos ): 3 1 5 2 0 4 3 3 2 5
Salsa B ( ptos ): 2 4 4 7 3 4 6 5 5 8
Al nivel de significación del 5% ¿Se puede concluir que el tipo de salsa menos espesa ( B ) tiene
mayores oportunidades de funcionar en el mercado, que el tipo más espeso ( A )?.
Solución
1) Hip
Hipótes
ótesis
is H 0 : A B
H 1 : A B
2) Nivel de significación : 0.05
3) Var
Variab
iable
le es
estad
tadíst
ística
ica ddee la pprue
rueba:
ba:
125
d
T
S d
n
Salsa A ( ptos ): 3 1 5 2 0 4 3 3 2 5
Salsa B ( ptos ): 2 4 4 7 3 4 6 5 5 8
Diferencias: 1 -3 1 -5 -3 0 -3 -2 -3 -3
10 10
d 20
i 1
i d
i 1
i
2
76
Cálculos
76
20 2
10 20
S d 4 d 2 S d 2
2
9 10
d 2
Luego
Luego T 3.16
S d 2
n 10
en donde V t 1.8331 ( Valor hallado en la tabla t de Student con 9 grados de libertad )
Por lo tan to la decisión será rechazar la hipótesis H 0
Ejemplo 2.- Se desea analizar el efecto de una droga sobre la presión de la sangre para lo cual se
utiliza una muestra de 10 personas, obteniendo los siguientes datos (presión codificada). Utilice α =
0.05
Antes de la droga 14 15 12 9 14 12 10 9 13 12
Después de la droga 10 12 12 7 15 10 7 8 11 11
Solución
1) Hi
Hipót
pótesis
esis H 0 : A D
H 1 : A D
2) Nivel de significación : 0.05
3) Var
Variab
iable
le es
estad
tadíst
ística
ica ddee la pprue
rueba:
ba:
d
T
S d
n
126
Antes: 14 15 12 9 14 12 10 9 13 12
Después: 10 12 12 7 15 10 7 8 11 11
Diferencias: 4 3 0 2 -1 2 3 1 2 1
Cálculos
10 10
d i 17 d i2 49
i 1
i 1
49
17 2
10 2.233 17
S d d 1.7 S d 1.494
2
9 10
d 1.7
Luego
Luego T 3.6
S d 1.494
n 10
en donde V t 1.8331 ( Valor hallado en la tabla t de Student con 9 grados de libertad )
Por
Po r lo tan to la decisión será rechazar la hipótesis H 0
5) Conclusión : Lo
Loss resultados de la muestra evidencian qu
quee la droga sí tuvo efecto
signifi
sig nifica
cat
t ivo pa ra reducir la presi
presión
ón sang
sa nguín
uín ea
127
Ejercicios Propuestos
2.- Dos empresas dedicadas a servir comidas rápidas a domicilio han alcanzado una notable
popularidad en cierta ciudad. Se pide a siete clientes habituales de cada empresa que informen sobre
los tiempos (en minutos) que ha tardado su pedido, obteniéndose los siguientes resultados:
Empresa A: 15 23 30 22 22 29 25
Empresa B: 12 21 25 22 15 21 15
Con esta información y con un nivel de significación del 1%. ¿Se puede considerar que los tiempos
de entrega de los pedidos son iguales en ambas empresas?
3.- Se desea comparar la calidad de dos nuevas clases de trigo. Para ello se toman 10 fincas al azar,
plantando en cada una de ellas y en dos partes distintas ambas clases. Los datos sobre la producción
en las 10 fincas son los siguientes:
Clas e A: 57 49 60 55 57 48 50 61 52 56
Clase
Clase B: 55 48 58 56 54 48 52 56 50 58
¿Podemos aceptar que la producción es la misma para ambas clases de trigo con un 95% de
confianza, suponiendo que las distribuciones son normales?
4.- Los datos que siguen corresponden a 10 hombres entre 45 y 55 años. Se trata de lecturas del
colesterol tomadas tras 12 horas de ayuno y repetidas una hora después de comer.
S
Auyjuentoo 180 210 3195 4220 5210 6190 7225 8260 9200 12010
Después 185 225 200 225 200 180 235 265 195 220
5.- Se dividieron 30 pacientes de epilepsia en dos muestras aleatorias iguales. Al grupo A se les dio
un tratamiento que incluía dosis diarias de vitamina D. Al grupo B se le dio el mismo tratamiento
excepto que no recibió vitamina D sino un placebo en su lugar. Las medias del número de ataques
experimentados durante el tratamiento por los dos grupos fueron:
¿Hay suficiente evidencia que indique que la vitamina D reduce el número de ataques epilépticos?
Use α = 0.05 Rpta. La vitamina D si reduce el Nº de ataques
ataques epilépticos
6.- Los siguientes datos fueron recabados en un experimento que fue diseñado para verificar si existe
una diferencia sistemática en los pesos en gramos obtenidos con dos diferentes balanzas:
128
Ba
Bala
lanz
nzaa I: 11.2
11 .233 14.3
14 .366 8.
8.33
33 10.5
10.500 23
23.4
.422 9.15
9. 15 13
13.4
.477 6.47
6. 47 12
12.4
.400 19
19.3
.388
Balanza II: 11.27 14.41 8.35 10.52 23.41 9.17 13.52 6.46 12.45 19.35
¿Existe diferencia significativa entre los pesos obtenidos con las dos balanzas? Use = 0.05
7.- Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y mujeres para realizar
determinada tarea. Una muestra aleatoria de 9 hombres y 8 mujeres han dado los siguientes tiempos
en minutos:
Hombres: 12 28 10 25 24 19 22 33 17
Mujeres: 16 20 16 20 16 17 15 21
¿Se puede concluir que los hombres emplean mayor tiempo que las mujeres para hacer la ttarea?
area?
Use = 0.05
8.- Se desea determinar el contenido de grasa en la carne para poder fijar su precio de venta al
consumidor. Una compañía empacadora de carne está considerando el uso de dos métodos diferentes
para determinar el porcentaje de grasa. Ambos métodos fueron usados para evaluar el contenido de
grasa en doce diferentes muestras de carne. Los resultados se muestran en la siguiente tabla:
Mé
Méto
Método
todo
do A:
B: 224
24.1
3..17 28
28.1
27.1
.4 26
25.9 28
28.6
28.6
.2 23
23.2
23.2
.5 28
28.1
28.1
.4 24
24.2
24..26 25
25.7
25..74 22
22.8
22.8
.5 24
2 2254 28
27.2
¿Sugieren estos datos que los dos métodos difieren en su medición del contenido de grasa en la
carne? Use = 0.05
9.- Un gerente de publicidad de una compañía de cereales para el desayuno desea determinar si un
nuevo envase podría aumentar las ventas del producto. Para probar la factibilidad de la nueva forma
del envase se seleccionó una muestra de 40 tiendas similares y se asignaron en forma aleatoria, 20 de
ellas como mercado de prueba de la nueva forma del envase, en tanto que las otras 20 continuarían
recibiendo el envase antiguo. Las ventas semanales durante el tiempo del estudio fueron las
siguientes:
Nuevo Antiguo
Con α = 0.05. ¿La nueva forma del envase dio como resultado mayores ventas?
10.- Un investigador cree tener razón para creer que cierto medicamento aumentará el contenido de
hemoglobina en gr/100 ml para ello mide el contenido de hemoglobina de 8 sujetos antes y después
de la administración del medicamento.
Antes 10 9 1111 12 8 7 12 10
Después 12 11 13 14 9 10 12 14
129
Carne A: 30 2266 3300 1199 2255 3377 2277 3388 2266 3311
Carne B: 40 34 28 29 26 36 28 37 35 42
12.- Un psicólogo desea verificar que cierto fármaco aumenta el tiempo de reacción a un estímulo
dado. Para una muestra de 4 individuos se obtuvieron los siguientes tiempos de reacción en décimos
de segundo, antes y después de inyectarse el fármaco:
Tiempo de reacción
Individuo Antes Después
1 7 13
2 2 3
3 12 18
4 12 13
Con un nivel de significación del 5 % realice una prueba para determinar si el fármaco aumenta
significativamente el tiempo de reacción.
13.- Se desea
músicos comparar
excedidos dos45dietas.
de peso; Se seleccionaron
integrantes de este grupo80 individuos
recibieron al azar
la dieta en otros
A, los una población
35 la dieta de
B.
Las pérdidas de peso en libras durante un período de una semana resultaron ser los siguientes:
14.- Se administran dos nuevos medicamentos a pacientes con un padecimiento cardíaco. El primer
medicamento bajó la presión sanguínea de 16 pacientes en un promedio de 11 puntos con una
desviación estándar de 6. El segundo medicamento bajó la presión sanguínea de otros 20 pacientes
en un promedio de 12 puntos con una desviación estándar de 8.
¿Existe diferencia significativa entre los efectos de ambos medicamentos? Use α = 0.05
Rpta. No existe diferencia sign
significativa
ificativa
15.- Veinticuatro animales de laboratorio con deficiencia de vitamina D, se dividieron en dos grupos
iguales: El grupo I recibió un tratamiento consistente en una dieta que proporcionaba la vitamina D.
El grupo II no fue tratado. Al término del período experimental se hicieron las determinaciones del
calcio en el suero, obteniéndose los siguientes resultados:
GRUPO TRATADO GRUPO NO TRATADO
X 1 11.1mg / 100ml X 2 7.8mg / 100ml
S 1 1.5 mg S 2 2.0 mg
Suponiendo que las poblaciones son normales. ¿Existe diferencia significativa? Rpta. Sí
130
16.- El tiempo de recuperación fue observado para pacientes al azar y sometidos a dos tipos distintos
de procedimientos quirúrgicos. Los datos son los siguientes:
PROC
PROCED
EDIMIE
IMIE
NTO
NTO I PROC
PROCED
EDIMI
IMIE
E
NTO
NTO II
n1 21 n2 23
X 1 7.3 X 2 8.9
S 12 1.23 S 22 1.49
Presentan los datos suficiente evidencia para concluir que hay diferencia entre los tiempos medios de
recuperación de los dos procedimientos quirúrgicos?. Use α = 0.05
17.- Once estudiantes de medicina midieron la presión sanguínea del mismo paciente y repitieron la
medición al día siguiente. A continuación se listan las lecturas sistólicas en mmHg.
Día 1: 138 11330 11335 11440 11220 11225 11220 11330 11330 11444 11443
Día 2: 116 120 125 110 120 135 124 118 120 130 140
Unidad experimental
Es el sujeto u objeto, intervalo de espacio o tiempo, sobre el que se experimenta o se aplica el
tratamiento.
Ejemplo:
En el campo industrial: el trabajador, una máquina, un lote de material.
Factor
Es una variable independiente de interés del experimentador, en la cual se desea estudiar su efecto
sobre la variable respuesta. En la gran mayoría de las investigaciones de tipo cualitativo o
cuantitativo, se trabaja con más de una variable independiente.
• Factor cualitativo:
• Factor cuantitativo:
Niveles de un factor
Son los diferentes tipos o grados específicos del factor que se tendrán en cuenta en la realización del
experimento. Los niveles de un factor reciben el nombre de “tratamientos”.
Ejemplo:
Tratamientos
Un tratamiento es un efecto que se desea estudiar. Implica el nivel particular de
un factor que deben imponerse a una unidad experimental dentro del marco del
diseño seleccionado.
Ejemplo:
• Utilizar en el cultivo de trigo la variedad Buck Ponch.
• Utilizar el Droperidol como fármaco para la l a relajación muscular.
132
En el modelo de clclasificación
asificación de un factor completamente aleatorizado los valores Xij se registran
en la siguiente tabla.
Donde:
Ti◼: es la suma de datos de la muestra i.
Ti◼◼: es la suma total de datos de las k muestras
n: es el total observado en las k muestras
i◼: es la media de la muestra i
◼◼: es media total muestral
133
Ejemplo 1:
Se realizan cuatro mezclas experimentales para medir la resistencia de concreto y se sometieron a
cargas de compresión hasta romperse. ¿Hay evidencia estadística que permita concluir que los tipos
de mezcla influyen en la resistencia del concreto? Use un nivel de significación del 5%.
Resolución
2 2 2 2 2
SCT 2.3 2.2 2.25 .... 2.25 26.4 0.035
12
134
1.Planteamiento de Hipótesis
Ho: µ1 µ 2 µ3 µ 4 (la resistencia del concreto en los distintos tipos de mezclas es la misma).
H1: La resistencia del concreto
concreto en al menos uno de los cu cuatro
atro tipos de mezclas es diferente.
diferente.
2. Nivel de significancia
α = 0.05
3. Estadígrafo o estadístico
Total 0.035 11
4. Regla de Decisión
Región Crítica
La regióndecritica
El valor es: (4.07, a+∞).
2 no pertenece la región critica por lo tanto no se debe rechazar Ho.
5. Conclusión
Finalmente hay suficiente evidencia estadística para decir que no hay diferencias entre las
resistencias del concreto en los distintos tipos de mezclas.
Ejemplo 2:
La fábrica de pantalones A&M tiene cuatro trabajadores que se dedican exclusivamente a coser
pantalones previamente cortados. El gerente de A&M sospecha que los trabajadores no están
trabajando a un mismo nivel. Para probar su sospecha, el gerente decide registrar en forma aleatoria
el tiempo (en minutos) que demora cada trabajador en coser un pantalón. Cinco observaciones fueron
registradas para cada trabajador, obteniéndose la siguiente información:
135
Trabajador 1 Trab
Trabaj
ajad
ado
or 2 Trab
Trabaj
ajad
ado
or 3 Trab
Trabaj
ajad
ador
or 4
28 27 29 27
25 28 30 28
29 30 32 26
30 28 35 28
28 25 37 27
Resolución
6092
SCT 28 25 29 .... 27 596.95
2 2 2 2
20
1.Planteamiento de Hipótesis
Ho: µ1 µ 2 µ3 µ 4 (Los tiempos promedios que demoran los trabajadores
en coser un pantalón es el mismo).
H1: Al menos unos de los tiempos promedios que demoran los trabajadores en coser un pantalón es
diferente).
2. Nivel de significancia
α = 0.05
3. Estadígrafo o estadístico
Suma de Grados de Cuadrados Razón F
Fuente de Variación cuadrados libertad Medios calculada
136
24.15
Tratamientos 488.95 3 162.9833
Error 108 16 6.75
Total 596.95 19
19
4. Regla de Decisión
Región Crítica
Primero se encuentra el valor crítico que es F(1-α, k-1, n-k) = F(0.95 , 3, 16) =3.24.
La región critica es: (3.24, +∞).
El valor de 24.15 si pertenece a la región critica por lo tanto se debe rechazar Ho.
5. Conclusión
Finalmente hay suficiente evidencia estadística para decir que hay diferencias entre los tiempos
promedios que demoran
demoran los trabajadores en cos
coser
er un pantalón.
Ejemplo 3:
Los datos de la siguiente tabla representan el número de horas de alivio que proporcionan cinco
marcas diferentes de tabletas contra el dolor de cabeza que se administran a 25 sujetos que sufren de
fiebres de 38ºC o más.
Realice el análisis de varianza y pruebe la hipótesis, en el nivel de
significancia de 0.05 que el número promedio de horas de alivio que proporcionan las tabletas es el
mismo para las cinco marcas.
Tabletas
A B C D E
5 .2 9.1 3.2 2.4 7 .1
4 .7 7.1 5.8 3.4 6 .6
8 .1 8.2 2.2 4.1 9 .3
6 .2 6.0 3.1 1.0 4 .2
3 .0 9.1 7.2 4.0 7 .6
Solución
H 0 : 1 2 3 4 ( El número prom
promedi
edio
o de horas de alivio es el mismo pa
para
ra las cinco
marcas de tabletas )
H 1 : En al menos una
un a de las marcas de tabletas el tiempo prom
promedio
edio de alivio no es el mismo.
. α = 0.01
(137.9) 2
SCT (5.2) 2
( 4.7) ..................... (7.6)
2 2
25
= 898.61-760.66 = 137.95
137
Total 137.95 24
4. Regla de Decisión
Primero se encuentra el valor crítico que es F(1-α, k-1, n-k) = F(0.95 , 4, 20) =2.87.
La región critica es: (2.87, +∞).
El valor de 6.59 si pertenece a la región critica por lo tanto se debe rechazar Ho.
5. Conclusión
Hay suficiente evidencia estadística para concluir que existe diferencia significativa entre los efectos
de las tabletas con respecto al tiempo promedio de alivio.
7
o
i
v
i
l
a
e
d 6
o
i
d
e
m
o
r 5
p
s
a
r
o
H 4
A B C D E
Tabletas
EJERCICIOS PROPUESTOS
138
Porcentaje de algodón
15 20 25 30 35
a
r
u
7 12 14 19 7
t
p
u
r
7 17 18 25 10
e
d
15 12 18 22 11
n
ó
i
s 11 18 19 19 15
n
e
T
9 18 19 23 11
3.- Se recolectaron muestras de agua en 4 lugares distintos de un río, para determinar si la cantidad
de oxígeno disuelto, varía de un lugar a otro. Los lugares 1 y 2 se escogieron arriba de una planta
industrial, una cerca de la orilla y la otra a mitad del río; el lugar 3 se tomó adyacente a la descarga
del agua industrial de la planta y el lugar 4 se tomó río abajo a mitad del río. Los datos se presentan
en la siguiente tabla (a mayor contaminación, menor es la lectura de oxígeno):
Lugar Conteni
Contenido
do medio de oxígeno disuelt
disueltoo
Lugar 1: 5.9 6.1 6.3 6.1 6.0
Lugar 2: 6.3 6.6 6.4 6.4 6.5
Lugar 3: 4.8 4.3 5.0 4.7 5.1
Lugar
ug ar 4: 6.
6.00 6.
6.22 6.
6.11 5.
5.88
Al nivel de significación de 0.01 ¿Proporcionan los datos evidencia suficiente para indicar una
diferencia entre las cantidades medias de oxígeno disuelto para los
l os 4 lugares?
4.- La siguiente tabla muestra las concentraciones arteriales de epinefrina en plasma sanguíneo (en
-8
10 gramos
el que por mililitro)
estuvieron que se encontró
anestesiados, usando en 15 pacientes
3 tipos sometidos
diferentes a cirugía
de anestesia, durante un
aplicando período
cada en
tipo de
anestesia a cada uno de los 5 pacientes elegidos al azar de los 15:
Anes
neste
tessia P a c i e n t e s
Ti po 1 9 12 10 8 15
Tipo 2 20 21 23 17 30
Tipo 3 6 5 8 16 7
Tomando α = 0.01 ¿Se puede decir que si se observan diferencias en la concentración de epinefrina
según el tipo de anestesia usada?
5) Tres profesores dan clases teóricas en una misma autoescuela. Se desea contrastar, si existen
diferencias significativas en la forma de enseñanza de los tres profesores. Para ello se seleccionan
tres muestras de alumnos y se anota el número de preguntas correctas en el examen.
139
43 48 29
35 47 31
44 44 28
46 46 42
39 39 31
44 45 36
38 48 35
42 48 36
45 45 39
6.- Se realizó un estudio para determinar la proliferación de hongos debido al exceso de residuos
alimenticios de los peces. Se observaron estas condiciones con peces en estadíos de alevines,
juveniles y adultos. Los peces alevines, juveniles y adultos fueron alimentados con cantidades de
alimento que variaban entre 3, 6 y 9 gramos al día respectivamente. Los datos a continuación
representan el número de colonias de hongos presentes en cada acuario.
7) Un fabricante de cereales tiene que elegir entre tres colores para las cajas de cereales: rojo,
amarillo y azul. Para averiguar si el color influye en las ventas, se eligen 16 tiendas de tamaño
parecido. Se envían cajas rojas a 6 de estas tiendas, cajas amarillas a 5 y cajas azules a las 5
restantes. Después de unos días, se comprueba el número de cajas vendidas en cada tienda. La tabla
adjunta muestra los resultados (en decenas de cajas) obtenidos.
Comp
Comple
lete
te la tab
tabla
la de
dell an
anál
ális
isis
is de la va
vari
rian
anza
za y co
cont
ntra
rast
stee la hip6tes
hip6tesis nula de que las medias
poblacionales de los niveles
niveles de ventas de las cajas de los tres colores son iguales.
8) Un profesor tiene una c1ase de 23 estudiantes. Al comienzo de cada cuatrimestre asigna a cada
estudiante
140
aleatoriamente a uno de los cuatro profesores ayudantes que tiene: Sánchez, Hervás, Alarcos o
Blázquez. Anima a los estudiantes a reunirse con su profesor ayudante para que les explique la
materia difícil del curso. AI final del cuatrimestre, se hace un examen. La tabla adjunta muestra las
calificaciones obtenidas por los estudiantes que trabajan con estos profesores ayudantes.
72 78 80 79
69 93 68 70
84 79 59 61
76 97 75 74
64 88 82 85
81 68 63
9) Tr
Tres
es pr
prov
ovee
eedo
dore
ress su
sumin
minis
istr
tran
an pi
piez
ezas
as en en enví
víos
os de 50
5000 un
unid
idad
ades
es.. Se ha
hann co
comp
mpro
roba
bado
do
minuciosamente muestras aleatorias de seis envíos de cada uno de los tres proveedores y se ha
anotado el número de piezas que no se ajustan a las normas. La tabla muestra este número.
Contraste la hip6tesis nula de que la igualdad de las medias poblacionales del número de piezas por
envío de los tres proveedores no se ajusta a las normas.
10) La Aso
Asociac
ciación
ión Nac
Nacion
ional
al de com
comerc
ercian
iantes
tes en Au
Autom
tomóvi
óviles
les(A
(ANCA
NCA)) qui
quiere
ere com
compar
parar
ar el
comportamiento del gasto de gasolina de distintas marcas de auto, para ello obtuvo una muestra
aleatoria del consumo de gasolina en litros de dichos automóviles en 40 de sus distintos modelos.
Utilice α = 0.05. ¿El consumo de gasolina tiene un comportamiento similar?
Honda-Civic Honda-Accord Nissan-Sentra Nissan Tillda
50 35 40 37
30 32 36 40
39 33 38 42
47 38 42 30
35 48 65 33
53 35 38 38
48 43 46 40
42 40 45 46
40 50 50 49
55 49 50 50
Regresión y Correlación Lineal
141
El coeficiente de correlación de Pearson Es un número que indica el grado de asociación entre dos
variables cuantitativas (numéricas) y se define del siguiente modo:
r
XY X Y
n
Diagrama de dispersión Se utiliza para graficar la relación entre dos variables X e Y, consiste en
una nube de puntos que nos mostrará visualmente si existe o no correlación dependiendo de la
tendencia de los puntos.
Regresión Lineal El modelo de regresión lineal se usa para expresar la relación lineal que puede
existir entre los valores de una variable “ Y” y los valores de una variable “X”.
X: Variable independiente.
Y: Variable dependiente.
Modelo de regresión lineal simple Los modelos de regresión que relacionan valores x de una
variable independiente X con valores y de una variable dependiente Y, cuya forma es
Y 0
1 X
La ex
expr
presiónn 0 1 X es la pa
esió parte
rte estru
estructu
ctural
ral linea
lineal,l, mientras que resume la parte
mientras
aleatoria que influye débilmente en la variable dependiente Y. A la ecuación y 0 1 X
, que expresa la estructura lineal, se llama la ecuación de regresión lineal. A los
coeficientes 0 y 1 se les llama coeficiente de regresión.
Se considera de este modo que los puntos (x,y) no necesariamente esta sobre la recta
y 0 1 X sino que fluctúan aleatoriamente a su alrededor.
Se asume que
constante. es una variable aleatoria cuya distribución es normal de media 0 varianza
142
La estimación de los valores 0 y 1 se realiza usando el método de mínimos cuadrados
y los valores obtenidos de la muestra ( x1 , y1 ),.....,
( xn , y n )
ˆ 0 ˆ1 x
y
n n n
n xi y i xi y i
ˆ1
i 1 i 1 i 1
2
n 2 n
n x i xi
i 1 i 1
Coeficiente de Determinación( R
2
) Medida de Bondad
Bondad de Ajuste: Mide la proporció
proporciónn de la
variabilidad total de Y que es explicada por X a través del modelo de regresión lineal
simple. R 2 r 2
Ejemplo 1.- El costo de fabricar un lote de cierto producto depende del tamaño del lote, como se
aprecia en el siguiente conjunto de datos:
Cost
Co stoo ($10
$1 0): 30 70 1140
40 270 530 1010 250
25 00 5020
02 0
Tamaño del lote: 1 5 10 25 50 100 250 500
(100 unidades)
Solución
a) Di
Diag
agra
rama
ma de Di
Disp
sper
ersi
sión
ón
143
Gráfica
Gráfic a de d
dispersi
ispersión
ón de Y vs. X
5000
4000
Y
:
)
s
e
r 3000
a
l
ó
d
0
1
( 2000
o
t
s
o
C
1000
a
X Y X X
i
2
i i i Y i
n X X
2 2
i i
b
n X Y X Y
i i i i
n X X 2 2
i i
en donde :
X 94
941
1
Y 9570
X Y 3271030 X
2
i i i i i 325751
325751 ( 9570 ) 941 ( 3271030 )
Luego a 22.8987
8 ( 325751 ) 941 2
Por lo tan to la ecuación de regresión lineal será : ˆ
Y 22.8987 9.975 X
Interpretación: Al aumentar el tamaño del lote en 100 unidades, el costo aumentará en 9.975
decenas de dólar o sea aproximadamente en 100 dólares.
c) Grá
Gráfic
ficaa de llaa lín
línea
ea ddee reg
regres
resión
ión lineal
lineal
144
Gráfica
Gráfi ca de lí
línea
nea aju
ajustada
stada
Y = 22,90
22,90 + 9,9
9,975
75 X
S 12,0374
5000
R-c uad. 100,0%
R-cua
-cuad.
d.(a
(aju
jus
stado)
do) 100,0%
4000
)
Y 3000
(
o
t
s
o 2000
C
1000
0 100
100 200
200 300
300 400
400 500
500
Tamaño del lote ( X )
Es decir, el costo es
estimado
timado sería de 728 dólares.
S y / x Y 2
a Y b X Y
n 2
145
del medicamento y la variable dependiente es la diferencia entre la frecuencia cardíaca más baja
después de la administración del medicamento y un control antes de administrarlo. Se reunieron
los siguientes datos:
a) Grafique un diagrama de dispersión
b) Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.
c) Grafique sobre el diagrama de dispersión, la línea de regresión.
d) Estime la disminución de la frecuencia cardíaca para una dosis de 2 mg
e) Calcule el error estándar de estimación
f) Calcule e interprete el coeficiente de correlación.
g) Calcule e interprete el coeficiente de determinación
Solución:
a) Diagrama de Dispersión
a
X Y X X
i
2
i i i Y i
b
n X Y X Y
i i i i
146
n X X n X X
2 2 2 2
i i i i
Interpretación: Al aumentar la dosis del medicamento en 1 mg. la reducción de los latidos del
corazón,delsecorazón
latidos incrementan en 4 lat/min
se reducen apr
aproximadamente;
oximadamente; es decir por cada mg de la dosis, los
en 4 aproximadamente.
c) Gráfica de la línea de regresión lineal
Gráfica de línea ajustada
Y = 7.05
7.055
5 + 4.088 X
22 S 1.35579
Y
: R-cuad. 90.4%
a
c 20 R- cu
cu ad
ad .(
.( a
ajj u
us
stad o
o)
) 89.5%
a
í
d
r
a
c 18
a
i
c
n 16
e
u
c
e
r
f 14
a
l
e
d 12
n
ó
i
c 10
c
u
d
e
R 8
Es decir, para una dosis de 2 mg de dicho medicamento, se espera que la frecuencia cardíaca
disminuya en 15 lat/min aproximadamente.
e) Cálculo del Error Estándar de Estimación: S y/x
147
S y / x
Y 2
a Y b X Y
n 2
13 ( 442.5 ) ( 26 ) ( 198 )
r 0.9507
13 ( 63.375 ) ( 26 ) 2 13 ( 3226 ) (198 ) 2
Interpretación
Interpret ación:: Existe una correlación lineal positiva entre la dosis del medicamento y la
reducción de la frecuencia cardíaca; a medida que se aumenta la dosis del medicamento entonces
la reducción de la frecuencia también aumentará.
Determinación:: r 2 = 0.904
g) Cálculo del Coeficiente de Determinación
Interpretación
Interpret ación:: El 90.4% de las variaciones que se observa en la reducción de la frecuencia
cardíaca, se debe a la variación de la dosis del medicamento; el 9.6% restante se debe a la
influencia o efecto de alguna otra variable no tomada en cuenta en el presente estudio.
EJERCICIOS PROPUESTOS
148
hombre
a) Gra
Grafiq
fique
ue eell di
diagr
agrama
ama de ddisp
ispers
ersión
ión
b) Determine una ecuación qu quee describa la relación entre la frecuencia
frecuencia de accidentes y el nivel de
educación preventiva. Grafique esta ecuación.
c) Inter
Interprete
prete los vvalore
aloress de los ccoefic
oeficientes
ientes de re
regresi
gresión.
ón.
d)
e) Calcu
Calcule
le el errorprete
e inter están
estándar
interprete eldar ddee laiente
ccoefic
oeficienteeestima
stimación
de ción
correddel
el mod
modelo.
correlación . elo.
lación.
f) Cal
Calcul
culee e inter
interpre
prete
te el coe
coefic
ficien
ientete de det
determ
ermina
inació
ción.
n.
g) Estim
Estimee el número ddee acciden
accidentes tes si el núm
número
ero de ho
horas
ras de ins
instrucci
trucción
ón fues
fuesee 340.
5.- En un grupo de 8 pacientes se registran las medidas antropométricas peso (kg) y edad (años)
obteniendo el modelo de regresión:
Yˆ 20.61 2.83 X
a) Interprete la recta de regresión lineal
li neal
b) ¿Cómo cree Ud. que será el diagrama de dispe
dispersión?
rsión?
6.- Una cadena de restaurantes de comida rápida decide llevar a cabo un experimento para medir la
influencia del gasto en publicidad sobre las ventas. En 8 regiones del país, se realizaron diferentes
variaciones relativas en el gasto de publicidad, comparado con el año anterior y se observaron las
variaciones en los niveles de ventas resultantes. La tabla muestra los resultados:
149
a) Calcule
Calcule el coe
coeficien
ficiente
te de co
correlac
rrelación
ión line
lineal.
al.
b) Estimar la ecuación regresión lineal del incremento en las ventas sobre el incremento del gasto en
c) publicidad
Calcule
Calcule el err
error
or está
estándar
ndar ddee estim
estimación
ación..
d) Estime el incremento en las ventas, si el gasto en publicidad es del 10%.
a) Calcule
Calcule el coe
coeficien
ficiente
te de co
correlac
rrelación
ión line
lineal.
al.
b) Estimar la ecuación regresión linea
lineall
c) Calcule
Calcule el err
error
or está
estándar
ndar ddee estim
estimación
ación..
d) Estime la calificación para
para un estudiante que estudió 24 horas durante dicho período de tiempo.
8.- Un editor tomó una muestra de 7 libros anotando el precio y el número de páginas respectivo,
obteniendo los siguientes datos.
a) Calcule
Calcule el coe
coeficien
ficiente
te de co
correlac
rrelación
ión line
lineal.
al.
b) Estimar la ecuación regresión linea
lineall
c) Calcule
Calcule el err
error
or está
estándar
ndar ddee estim
estimación
ación..
d) Estimar
Estimar el precio de un libro de 300 pág páginas.
inas. Si a este libro
libro se le incremen
incrementa
ta 20 páginas en una
segunda edición. ¿En cuánto se incrementará su precio?
Te
Temp
mper
erat
atur
uraa 10 28 12 31 30 19 24 15
Pedidos 21 65 19 72 75 36 67 24
a) Calcule
Calcule el coe
coeficien
ficiente
te de co
correlac
rrelación
ión line
lineal.
al.
b) Halle la ecuación regresión linea
lineall
c) Calcule
Calcule el err
error
or está
estándar
ndar ddee estim
estimación
ación..
d) Estimar el pedido de refrescos para una semana cuya temperatura me
media
dia es de 20º
20ºC.
C.
150
10.- Se efectúa un experimento médico para determinar el efecto de la droga efedrina en las
pulsaciones del corazón. Un paciente recibe diversas dosis diarias de la droga durante seis días.
La tabla que sigue resume los resultados del experimento.
Dosis diaria total Nº de
de pul
pulsacio
saciones
nes
de efedrina (granos) por minut
minutoo
3 70
2 60
1 50
3 80
5 100
4 90
Nota. 1 grano = 0.06 gramos
a) Grafique un diagrama de dispersión
b) Determine la ecuación de regresión lineal. Interprete los coeficientes de regresión lineal.
Grafique sobre el diagrama de dispersión, la línea de regresión.
c) Estímese el número de pulsaciones ppara ara una dosis diaria de 4 ggranos
ranos de efedrina
efedrina..
d) Calcu
Calcule
le el erro
errorr está
estándar
ndar de la estim
estimación
ación del m modelo
odelo
e) Calcu
Calcule
le e inter
interprete
prete el ccoefic
oeficiente
iente de corre
correlación
lación..
f) Cal
Calcul
culee e inter
interpre
prete
te el coe
coefic
ficien
iente
te de det
determ
ermina
inació
ciónn
11.- La siguiente tabla ilustra los valores del consumo de metil mercurio y la cantidad total de
mercurio en la sangre de 12 individuos expuestos a la primera sustancia por haber consumido peces
contaminados.
a) Cal
Calcul
culee el coef
coefici
icient
entee de cor
correl
relaci
ación
ón lin
lineal
eal..
b) Estimar la ecuación regresión lineal de la cantidad de mercurio en la sangre sobre el
consumo de metil mercurio.
c) Cal
Calcul
culee el er
error
ror eestá
stánda
ndarr de es
estim
timaci
ación.
ón.
d) Es
Estim
timee la cant
cantid
idad
ad de memerc
rcur
urio
io en la sang
sangre
re,, cons
consid
ider
eran
ando
do una inge
ingest
staa de 300 µg de
mercurio.
Experi
Experienc
encia
ia eenn vvent
entas
as Vo
Volum
lumen
en de ven
ventas
tas
151
(años) ($10,000)
1 3
2 2
3 5
4 4
5 6
67 89
8 9
9 12
10 10
13.- En una
una mu
muesestr
traa de 8 paci
pacien
ente
tess se mide
midenn las
las cant
cantid
idad
ades
es antro
antropo
pomé
métr
tric
icas
as peso
peso y edad
edad
obteniéndose los siguientes resultados
E
Pedsaod ((kagñ)os) 1526 842 1501 511114 470 739 1409 151484
a) Calcu
Calcule
le e inter
interprete
prete el ccoefic
oeficiente
iente de corre
correlación
lación
b) Halle la ecuación de regresión lineal
c) Est
Estime
ime el peso
peso ppara
ara un ppaci
acient
entee de 10 añ
años
os de eedad
dad
d) Deter
Determine
mine e interp
interprete
rete eell coe
coeficien
ficiente
te de deter
determinaci
minación
ón
14.- Consideremos los siguientes datos respecto al precio de venta ($1,000) de una muestra de
viviendas y sus áreas (100 pies 2) correspondientes a cada una de ellas, en cierta ciudad.
Precio de venta: 41 32 24 44 42 36 35 40 29 26
Área de la vivienda: 13 10 08 14 14 12 10 12 10 08
a) Hal
Hallar
lar llaa ecu
ecuaci
ación
ón ddee re
regre
gresió
siónn lin
lineal
eal
b) Interprete el coeficiente de regresregresión
ión lineal
c) Estim
Estimee el pr precio
ecio ddee venta para uuna
na viv
vivienda
ienda cuya áárea
rea es de 1,0
1,000
00 pies2
pies
d) Calcu
Calcule
le e iinterp
nterprete
rete eell coef
coeficien
iciente
te de corre
correlación
lación lineal
e) Interp
Interpret
retee el coe
coefic
ficien
iente
te de de
deter
termin
minaci
ación
ón
152
CHI CUADRADO
PRUEBA DE INDEPENDENCIA
Es una prueb
pruebaa de
independientes hipótesis
entre sí. que tiene por objeto probar si dos variable
variabless cuali
cualitativa
tativass nomin
nominales
ales son
Hipótesis:
Estadístico de prueba:
r c o eij 2 n i n j
c
2 2
ij
~ r 1 c 1 eij
i 1 j 1 eij n
Criterio de rechazo:
c2 2 , r 1 c 1
Conclusión:
Ejemplo 1.- Se tiene la siguiente información obtenida de una muestra de 5,000 fallecidos.
DIAGNÓSTICO
Muerte por cáncer Muerte por otras Total
de pulmón causas
Se desea probar la hipótesis de que el fumar y la muerte por cáncer pulmonar son independientes con
α = 0.01
Solución
H 0 : No existe relación entre el hábito de fumar y la muerte por cáncer pulm
pulmona
onar
r
H 1 : Si existe relación entre el hábito de fumar y la muerte por cáncer pu
pulmona
lmona r
Nivel de significa
significanncia 0.01
DIAGNÓSTICO
Muert
Muertee por cán
cáncer
cer ddee pul
pulmón
món Mue
Muerte
rte ppor
or ootra
trass cau
causa
sass Total
153
Re gla de decisión : Re chazar H 0 si 2 Vt ( Valor hallado en la tabla 2 con 1 g ..l
En este caso Vt 6.635 Por lo tan to rechazarem os H 0
Conclusión: Los resultados muestrales proporcionan evidencia suficiente como para concluir que
ambos factores están relacionados.
PRUEBA DE HOMOGENEIDAD
Se caracteriza porque tiene como objetivo probar la igualdad de proporciones (probar si los datos de
cierta muestra provienen de la misma población).
Además, los totales ya sea de filas o columnas son determinados o fijados de antemano por el
investigador.
Hipótesis:
Estadístico de prueba:
r c o eij 2 n i n j
c2 2
ij
~ r 1 c 1 eij
e
i 1 j 1 ij
n
Criterio de rechazo:
c2 2 , r 1 c 1
Ejemplo 1.- El Director de compras de una fábrica grande debe decidir por la compra de una de las
cuatro marcas que hay en el mercado. Para probar si existe diferencia significativa en la calidad de
las máquinas, obtiene una muestra de la producción de 150 artículos para cada una de ellas y observa
el número de defectuosos. Los resultados se dan en la siguiente tabla:
M Á Q U I NA S
154
A B C D Total
Defectuosos 21 12 15 18 66
Buenos 129 138 135 132 534
Total 150 150 150 150 600
Solución
H 0 : p A p B pC p D ( La propo
proporción
rción de defectuoso s son las mismas en cada una de las máquinas)
H 1 : Al menos en una de las máquinas la propo
proporción
rción de defectuoso s no es la misma.
Nivel de sign
significan
ificancia 0.05
M A QU I N A S
CALIDAD A B C D Total
Defectuo
tuosos 21 16.5 12 16.5 15 16.5 18 16.5 66
Buenos 129 133.5 138 133.5 135 133.5 132 133.5 534
Total 150 150 150 150 600
Re gla de decisión : Re chazar H 0 si 2 Vt ( Valor hallado en la tabla 2 con 3 g ..l
en este caso Vt 7.815. Por lo tan to no rechazarem os H 0
Ejemplo 2.- Se sostiene que una droga determinada es efectiva para la curación del catarro común.
En un experimento con 164 personas con catarro, a la mitad de ellas se le suministró la droga y a la
otra mitad se le suministró píldoras azucaradas. Las reacciones de los pacientes aparecen anotadas en
la siguiente tabla:
REACCIONES
Nuulo Total
Mejorados Empeorados Efecto N
Droga 52 1100 20 82
Azúcar 44 12 26 82
Total 96 22 46 164
Solución
H 0 : La droga y las píldora
píldorass tienen igual efecto
H 1 : La droga y las píldor
píldoras
as no tienen igual efecto.
Nivel de significa
significanncia 0.05
REACCIONES
Mejorado Em
Empe
peor
orad
ados
os Ef
Efec
ecto
to Nu
Nulo
lo Total
s
Droga 52 48 10 11 20 23 82
155
Azúcar 44 48 12 11 26 23 82
Total 96 22 46 164
2 2 2
2
( 52 48 ) ( 10 11) .................... ................ ( 26 23 ) 1.631
48 11 23
Re gla de decisión : Re chazar H 0 si 2 Vt ( Valor hallado en la tabla 2 con 2 g ..l
en este caso Vt 5.991 Por lo tan to no rechazarem os H 0
Conclusión: Las drogas y las píldoras azucaradas producen reacciones similares.
EJERCICIOS PROPUESTOS
2.- Sobre una muestra de 500 niños de cierta escuela primaria se hizo un estudio acerca de su estado
de nutrición y el desempeño académico, obteniéndose los siguientes resultados:
Dese
De semp
mpeñ
eñoo A
Aca
cadé
démi
mico
co Esta
Estado
do de Nutri
utrici
ción
ón To
Tota
tall
Pobre Bueno
Malo 105 15 120
Satisfactorio 80 300 380
Total 185 315 500
3.- Se llevó a cabo una encuesta con respecto a la preferencia del consumidor para determinar si
existía alguna predilección entre las tres marcas competitivas (A, B y C) dependiendo de la región
geográfica en la que habita el consumidor. La información obtenida es la siguiente:
Región I Región IIII Región III Total
Marca A 40 52 25 117
Marca B 52 70 35 157
Marca C 68 78 60 206
Total 160 200 120 480 156
Con esta información ¿La preferencia por una determinada marca depende de la región geográfica?
Rpta. No
4.- Se tomó una muestra de 400, 500 y 400 compradores de las ciudades de Piura, Trujillo y
Chiclayo respectivamente con la finalidad de determinar si la proporción verdadera de compradores
que se inclinan por el producto A en lugar del B, es la misma en las tres ciudades. Use α = 0.05
5.- Se examinó una muestra de 2,000 registros médicos los cuales dieron los siguientes resultados:
Probar la hipótesis que las dos clasificaciones son independientes con α = 0.05
CAUSA EDAD
Enfermedad Meno40
s de 30 3028
- 50 Más52de 50
Otras 20 36 24
¿Está la edad relacionada con el ausentismo? Use α = 0.01
SEXO MODELO
I II III
Masculino 350 270 380
Femenino 340 400 260
Contrastar la hipótesis de que el sexo no tiene relación con la preferencia hacia un determinado
modelo para un α = 0.01
157
8.- Se desea determinar si existe algún tipo de relación entre la concentración de procaína usada en
operacion
oper aciones
es del molar mandi
mandibular
bular y el porc
porcentaje
entaje de caso
casoss satis
satisfactor
factorios
ios (efectivid
(efectividad
ad clínic
clínicaa de la
anestesia). Se tuvo la siguiente información:
Solu
Soluci
ción
ón ddee pr
proc
ocaí
aína
na Caso
Casoss sa
sati
tisf
sfac
acto
tori
rios
os Ca
Caso
soss no ssat
atis
isfa
fact
ctor
orio
ioss
1.0de
Más %1.0 % 07
63 18
12
Efec
Efecti
tivi
vida
dadd Re
Reme
medi
dios
os ppar
araa la aale
lerg
rgia
ia
R1 R2 R3
Sin alivio 10 20 15
Cierto 30 20 20
alivio 10 30 25
Alivio total
¿Puede inferir que los tres remedios para la alergia son igualmente efectivos?
10.- El ingeniero quiere saber si hay diferencias en la calidad de los productos procesados en los tres
turnos operativos de una fábrica. Para esto se tomó una muestra aleatoria de tamaño 100 de cada
turno del día anterior y las clasificó según el turno de su producción: mañana, tarde y noche; y según
su calidad: defectuoso o no defectuoso. Los resultados se dan en la siguiente tabla:
Pruebe al nivel de significación del 5% la hipótesis de la igualdad de las tres proporciones reales de
producción defectuosa.
defectuosa.