You are on page 1of 158

 

Estadística
General  

Área de Estadística
Lima – Perú
2021
 

GUÍA DE LABORATORIO DE ESTADÍSTICA GENERAL


Derechos Reservados 2021
 Área de Estadística
Estadística
Décima segunda Edición 2021
Diseño y Diagramación
Universidad Científica del Sur 
Panamericana Sur km 19 - LimaLima 42

Lima-Perú 610-6400

2
 

Dr. José Carlos Dextre Chacón


Presidente del Directorio
Dr. Manuel Efraín Rosemberg Barrón
Rector 
 
Dr. Luis Javier Cardó Soria
Gerente General
 
Mg. Lorenzo Wong Lam
Gerente de Educación
 
Dr. José Agustín Ortiz Elías

 Vicerector Académico
Joyce del Pino
Director Departamento Cursos Básicos
 
Mg. Sarita Bocanegra Gonzales
Coordinador del Área de Matemática, Física y Estadística
 
Mg. Sarita Bocanegra Gonzales
Responsable del Curso de Estadística General
 

3
 

CONTENIDO

UNIDAD 1
Capítulo 1: Conceptos 6

Capítulo 2: Presentación de datos 11

UNIDAD 2

Capítulo 3: Medidas de Tendencia Central 25

Capítulo 4: Medidas de Posición No Central 29

Capítulo 5: Medidas de Dispersión 37


 
Capítulo 6: Asimetría y Curtosis 45

UNIDAD 3

Capítulo 7: Cálculo de Probabilidades 50

Capítulo 8: Distribución Binomial 64

Capítulo 9: Distribución Poisson 68

Capítulo 10: Distr
istrib
ibuc
ució
iónn Norma
ormall 72
Capítulo 11: Distribución Muestral 83

UNIDAD 4

Capítulo 12: Intervalos de Confianza 89

Capítulo 13: Tamaño de la muestra. 96


Capítulo 14: Prueba de Hipótesis 101

Capítulo 15: Análisis de Varianza 122

Capítulo 16: Regresión y Correlación Lineal 131

4
 

Capítulo 17: Tablas de Contingencia y Pruebas Chi – Cuadrado 143

5
 

Elaboración propia

CONCEPTOS BÁSICOS. PRESENTACIÓN DE


DATOS.

6
 

CONCEPTOS ESTADÍSTICOS

Estadística. -
Es una ciencia que nos ofrece un conjunto de métodos y técnicas para: recolectar, clasificar,
 procesar, presentar, analizar e interpretar un conjunto de datos, con la finalidad de conocer el
 problema, obtener algunas conclusiones y finalmente tomar
tomar decisiones.
Es una herramienta fundamental para realizar investigación científica.

Estadística Descriptiva. -
Es un conjunto de métodos que nos permiten describir y resumir los datos observados mediante
gráficos o cuadros y realizando algunos cálculos de indicadores.

Estadística Inferencial. -
Es un conjunto de métodos que nos permiten hacer generalizaciones o inferencias acerca de una
 población a partir de lo observado
observado en una muestra.

Población. -
Es la totalidad de individuos o de elementos (empresas, personas, objetos etc.) que cumplen o
satisfacen la o las características en estudio.
Por el número de elementos que la componen la población se clasifica en finita e infinita. La
 población es finita
fi nita si tiene un número determinado de elementos en caso contrario es infinita. En la
 práctica una población finita con un gran número de elementos se considera como una población
infinita; por otro lado el tamaño de una población va a depender del objetivo trazado por el
investigador.

Muestra. -
Es
Está
tá co
cons
nstit
titui
uida
da po
porr un
unaa part
partee de los
los indiv
individu
iduos
os o elem
elemenento
toss que
que comp
compon
onen
en la pobl
poblac
ació
ión,
n,
seleccionada de acuerdo a cierta técnica con el fin de obtener información acerca de la población, de
la cual proviene. La muestra debe ser seleccionada de manera que sea representativa, es decir tenga
características similares a las de su población.

Parámetro.-
Es una medida descriptiva que resume una característica de la población, es decir constituye el valor 
real, verdadero; su cálculo implica utilizar toda la información contenida en la población; entre los
más conocidos tenemos:
La media poblacional ( μ )
La varianza poblacional ( σ 2 )
La proporción poblacional (    ) etc.

Estadístico.-
.- Es
 Es una medida que describe una característica de la muestra, se calcula a partir de los
datos observados en la muestra; es decir constituyen los estimadores de cada uno de sus respectivos
 parámetros; entre estos tenemos:
tenemos:
La media muestral (  X   )  
La varianza muestral ( S2 )
La proporción muestral (   p )  

Variable.-
.-   Es una característica definida en la población de acuerdo a cierto interés en una
investigación estadística, que puede tomar dos o más valores (cualidades o números). Puede ser una
característica medible
civil, calidad, color, (peso,
sexo etc). precio, ingresos,
Se representa contemperatura etc) o unaX,cualidad
las letras mayúsculas Y, Z. no medible (estado

7
 

CLASIFICACIÓN DE LAS VARIABLES

SEGÚN LA NATURALEZA DE LA VARIABLE

a) VARIABLES CUALITATIVAS O CATEGÓRICAS


Son aquellas cuyos valores expresan cualidades o atributos; estas a su vez pueden ser:

VARIABLES NOMINALES.- Son aquellas en donde no existe un orden preestablecido entre


las categorías de las variable. Ejemplos:

VARIABLE CATEGORIAS
Color Azul, rojo, blanco, verde, negro, amarillo etc.
Estado Civil Soltero, casado, conviviente, viudo, divorciado.
Distrito Lima, La Victoria, Breña, Miraflores, San Isidro, Lince etc
Género Masculino, femenino
Calidad Buena, mala.
Morosidad No Moroso, moroso
 Banco donde le depositan Interbank, Pichincha, Scotiabank
su sueldo:
VARIABLES ORDINAL
VARIABLES ORDINALES ES. - Son aquellas en donde existe un orden preestablecido entre las
categorías de la variable.

Ejemplos:

VARIABLE CATEGORÏAS
Gra
rado
do de In
Instru
strucc
cció
iónn Prim
imaaria,
ria, Secun
ecunddaria
aria,, Sup
Super
erio
ior 

Orden de Mérito Primero, Segundo, Tercero etc.
 Nivel Socioeconómico Bajo, Medio, Alto etc.

También podemos considerar como variables ordinales por ejemplo el grado de satisfacción de
un servicio
servicio 5(1= Muy
Satisfecho; = Mu
Muyy insat
insatisfec
isfecho;
satisfecho) oho; 2 = elInsat
también Insatisfec
isfecho;
grado deho; 3 = Ni etc.
depresión, sa
satisfec
tisfecho
ho ni insa
insatisfe
tisfecho;
cho; 4 =

 b) VARIABLES CUANTITATIVAS


Son aquellas que se obtienen como resultado de mediciones o conteos; estas a su vez se
clasifican en:

  VARIABLES DISCRETAS
Son aquellas cuyos valores resultan como consecuencia de conteos, y por lo tanto solo pueden
asumir valores enteros positivos, incluido el cero. Ejemplos
 Número de empresas, número de hospitales, número de trabajadores, número de comprobantes
de pago, número de máquinas, número de conservas etc.

VARIABLES CONTINUAS
8
 

Son aqu
aquell
ellas
as cuy
cuyos
os val
valore
oress se obt
obtien
ienen
en por med
mediciición,
ón, pue
pueden
den asu
asumir
mir valo
valores
res dec
decima
imales
les..
Ejemplos:
Los sueldos, el precio, la temperatura, el volumen, el tiempo, el peso, la estatura, la presión etc.

SEGÚN LA MEDICIÓN DE LA VARIABLE

a) ESCALA NOMINAL Se tiene una escala nominal si dos o más valores de una variable
sólo permiten percibir las diferencias o semejanzas de las unidades estadísticas que se midan Tales
valores son como etiquetas que identifican a las unidades estadísticas y las hacen iguales o diferentes
entre sí. Ejemplo: Color de ojos, género, Especialidad de los estudiantes.

 b) ESCALA ORDINAL Cuando los datos pueden acomodarse en algún orden, las diferencias entre
los datos carecen de significado: A es más alto que B, pero no se puede restar A menos B.
Ejemplo: Grado de Instrucción, grado de satisfacción de los clientes.

c) ESCALA DE INTERVALO La escala de intervalo es una escala para la cual el 0 no indica


ausencia de la propiedad que se estudia. Ejemplo: Temperatura.

d)  ESCALA DE RAZON Se parece al nivel intervalo con la diferencia que el cero implica ausencia
d)
de la propiedad que se estudia. Ejemplo: Peso, precio, Número de hijos

SEGÚN EL ROL QUE TIENEN EN LA INVESTIGACIÓN

a) VAR
VARIABL
IABLE
E DEPE
DEPENDIE
NDIENTE
NTE
La variable dependiente es aquella determinada por el investigador para estudiarla en función de
otras variables denominadas independientes. Generalmente se simboliza esta variable con la letra Y.

b) VAR
VARIABL
IABLE
E INDEPENDI
INDEPENDIENTE
ENTE

La variable independiente es aquella que es controlada en un experimento por el investigador.


Generalmente se simboliza esta variable con la letra X.
En la mayoría de los experimentos el investigador está interesado en determinar el efecto que tiene la
variable X, sobre la variable Y;Y; para esto el investigador controla los niveles dede la variable X y mide
el efecto sobre la otra variable.
 Ejemplo:
- La va varia
riació
ciónn en lo
loss pre
precio
cioss de un ddete
etermi
rminad
nadoo art
artícu
ículo,
lo, mo
motiva
tiva ccamb
ambios
ios eenn las ve
venta
ntas.
s. En es
este
te
ejemplo
Preciolas= variables
X son: Venta = Y

- El co
costo
sto de pproduc
roducción
ción de uunn ar
artículo
tículo,, det
determin
erminaa su precio de vventa.
enta. En es
este
te ca
caso
so las variab
variables
les
son:
Costo de producción = X Precio de venta = Y

Podemos notar que el rol que asuma una determinada variable como dependiente o independiente en
una investigación, va a depender con qué variable se le asocie.

E J ER CI C IO S P R OP U ES T OS

9
 

1. Determinar, en cada caso el tipo de variable, de acuerdo a su naturaleza:

a. Tiempo que demora un paciente para ser atendid atendidoo en un Centro


Centro Médico.
 b. Carreras que ququieren
ieren seguir las alu
alumnas
mnas y los alumnos
alumnos de un cecentro
ntro educativo al
terminar la Educación Secundaria
Secundaria..
c. Intención de voto
voto para las elec
elecciones
ciones presidenciales
presidenciales..
d. Horas que dedican a ver televisió
televisiónn los estudia
estudiantes
ntes de Primaria
Primaria en Arequipa.
Arequipa.
e. Número de aaparatos
paratos de radio que hay en los hogares de Ayacucho.
Ayacucho.
f. Grado de instrucción de los trabajadores de una Empresa.
g. Número de televisores
televisores LCD vendidos durante el mes ddee diciembre del año pasad pasado.
o.
h. Temperaturas registradas
registradas cada hhora
ora en un obs
observatorio.
ervatorio.
i. Número de pacientes aatendidos
tendidos por emergencia ddurante
urante el mes
mes pasado.
pasado.
 j. Tiempo utilizado en
en atender un clien
cliente
te en la ventan
ventanilla
illa de un banco.
banco.
k. Número ddee empleados
empleados que
que tiene una empresa
empresa m minera.
inera.
l. Número de clientes que llegan
llegan entra las 11 a.m. y las 1 p.m. a un banco lo local.
cal.
2. Clas
Clasif
ifica
icarr cada
cada una
una de las
las afir
afirma
maci
cion
ones
es sigu
siguien
iente
tess ya sea
sea como
como infe
infere
renc
ncia
iass o méto
método
doss
descriptivos.

a. El año pa
pasado
sado eenn la UCS
UCSUR
UR el pu
puntaje
ntaje ppromed
romedio
io del ex
examen
amen de aadmis
dmisión
ión fue 885.
5.
 b. El Dr. García, un ecólogo, informó que en cierto río del oriente peruano, la carne de los
 peces contienen un promedio de 300 unidades de mercur
mercurio.
io.
c. La comp
compañía
añía “R
“RM”
M” pre
predijo
dijo qu
quién
ién ser
sería
ía el gan
ganador
ador en uuna
na elec
elección
ción pr
preside
esidencial
ncial ddespué
espuéss de
conocer los resultados de las votaciones de 25 mesas de sufragio de las 2 800 mesas que
hubo en total.

3.  Analizar los siguientes casos que se le presentan y resolver:

a) La empresa IDEAL S.A. está realizando un estudio de mercado a


nivel del distrito de Trujillo. En especial está considerando las
familias residentes en las Urbanizaciones San Andrés, California y
la Merced. Su interés es saber cuánto gastan mensualmente en su
consumo mensual de leche de tarro color azul. Si Ud. fuera f uera el
encargado de realizar esta investigación identifique:
Unidad de estudio:
Variable de estudio: Tipo:
Población:
Muestra:
 b) El Gerente de Procter & Gamble quiere saber cuál es la marca de
detergente que más prefieren las amas de casa del distrito de Breña.
Para llevar a cabo esta investigación se selecciona una muestra de 608
amas de casa.
Unidad de estudio:
Variable de estudio: Tipo:
Población:
Muestra:

a. Indiquedeelservicio
4. Tiempo tipo de variable usando lade
de los empleados clasificación
una empresa.según su medición:
 b. Número de cheques
cheques girados por una empres
empresaa diariamente en un mes.

10
 

c. Número de acciones vendidas cada día en la Bolsa de Valores de Lima.


d. Lugar de nacimiento de las personas que viven en el distrito de Independencia.
e. Nivel de educación de los Limeños.
f. Temperatura y humedad diaria de los Olivos.

5. Cuatro estudiantes de la Universidad A gastan mensualmente s/ 500, s/ 410, s/ 418, s/ 404.


Cuatro estudiantes de la Universidad B gastan mensualmente s/ 410, s/ 395, s/ 380, s/ 387
Se llega a las siguientes conclusiones.
a. El gasto promedio mensual de los cuatro estudiantes de la universidad A es de s/ 433 mientras que
el gasto promedio de los cuatro estudiantes de la universidad B es de 393 soles.
 b. El gasto promedio mensual
mensual de todos los estud
estudiantes
iantes de la Universidad A es mayor que el de todos
los estudiantes de la Universidad B
c. La diferencia entre los dos promedios es de 40
d. Si se selecciona a otro estudiante de la universidad A, probablemente gaste más que el gasto
 promedio de los estudiantes
estudiantes de la Universidad B
¿Cuáles de las conclusiones provienen de la Estadística Descriptiva y cuáles de la Estadística
Inferencial?

6. Utilice los términos que aparecen en la siguiente tabla, para asociarlos a las definiciones que
aparecen a continuación:

Es una caracterísca defnida de la población que puede tomar


1 Muestra dierentes valores.

Variable cualitava
2 ordinal Es un subconjunto de la población.

Variable cuantava Medida descripva que resume inormación de una caracterísca de


3 connua la población.

Número de alumnos por sección matriculados en el curso de


4 Va
Variable metodología.

5 Pará
Paráme
metr
tro
o Gr
Grad
ado
o acad
académ
émic
ico
o de lo
loss doce
docent
ntes
es de la Fa
Facu
cult
ltad
ad de Cont
Contab
abil
ilid
idad
ad..

Estadísca Método que generaliza resultados para una población analizando una
6 Inerencial parte de ella.

Variable cuantava
7 discreta Valor que resulta de resumir los datos de una muestra.

8 Estadísco Tiempo empleado para ensamblar una computadora.

11
 

PRESENTACIÓN DE DATOS

En todo trabajo de investigación se requiere la recolección de datos para posteriormente realizar el


 procesamiento del mismo. Estos datos pueden haber sido recogidos de fuenfuentes
tes primarias o
secundarias.

Luego de la recolección de información se debe clasificar u organizar los datos para realizar el
análisis y la interpretación de los resultados. Para facilitar este procedimiento se deberá agrupar la
información en categorías o clases.
Una forma sencilla de agrupar los datos es construyendo tablas de distribución de frecuencias.

Presentación de tablas:
Todo gráfico debe presentar la siguiente
estructura:
1. Numeración
2. Título
3. Contenido
4. Fuente

Datos agrupados por frecuencias

Variable fi Fi hi Hi hi% Hi%

fi= frecuencia absoluta


Fi= frecuencia absoluta acumulada
hi= frecuencia relativa
Hi=
hi%=frecuencia
frecuenciarelativa
relativaacumulada
porcentual
Hi%= frecuencia relativa acumulada porcentual

Datos agrupados por clases o intervalos


Clases Xi f Fi hi Hi hi% Hi%

12
 

TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS PARA VARIABLES CUALITATIVAS

Ejemplo:
El restaurante “Don Tito” busca evaluar el grado de satisfacción de sus clientes: donde B es
Bueno, R es Regular, D es Deficiente. Se tienen los resultados en el siguiente cuadro:

R R R R B B D D B R R
R R R D D R R B R R D
R R R R R R R R D D B

Después del conteo de los datos por categorías tenemos:

Tabla Nº1: Nivel de satisfacción de los clientes


Bueno (B): 1 Regular (R): 15 Deficiente (D): 7

Satisfacción del Cliente fi hi hi%


Deficiente 7 0.304 30.4%
Regular 15 0.652 65.2%
Bueno 1 0.044 4.4%
Total 23 1.00 100%

Interpretación: De los 23 comensales encuestados del restaurante “Don Tito” más de la mitad
(65%) manifestaron estar regularmente satisfechos con los servicios y otro porcentaje menor (4% )
dijeron estar bien satisfechos.

13
 

TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS PARA VARIABLES


CUANTITATIVAS
a) Tab
abla
la de fre
frecu
cuen
enccia
iass par
paraa Dat
Datos
os No Ag
Agru
rup
pad
adoos.
s.--   Es apropiada para datos cuyos valores
distintos no son muy numerosos.

Ejemplo:

Los siguientes datos corresponden a las edades de 50 estudiantes:

20 22 21 19 18 18 20 22 20 19 20 19
23 19 18 20 21 22 19 20 18 23 20 21
19 22 23 20 21 19 22 18 19 20 21 24
21 20 21 20 24 23 20 21 19 20 22 21
21 22

a) Pres
Presentar
entar dicho
dichoss da
datos
tos en uuna
na ttabla
abla de fr
frecuen
ecuencias
cias
 b) Interpretar f1 , F4, h3
h3%
% y H2%

Solución:

En este casoo notamos que la variable edad, apenas está tomando solamente siete
este cas
valores distintos que van desde 18 hasta 24
Variable: Xi 
Frecuencias Absolutas: fi
Frecuencias Absolutas Acumuladas: Fi
Frecuencias Relativas: hi
Frecuencias Relativas Acumuladas:
Acumuladas: Hi

La siguiente tabla y el gráfico han sido obtenidos, usando el software MINITAB

Tabla Nº2: Distribución de los estudiantes según su edad


Edad fi Fi hi% Hi%

18 5 5 10.00 10.00
19 9 14 18.00 28.00
20 13 27 26.00 54.00
21 10 37 20.00 74.00
22 7 44 14.00 88.00
23 4 48 8.00 96.00
24 2 50 4.00 100.00
Total 50 100.00

Interpretación: Se observa que el 26% de los estudiantes tienen 20 años de edad mientras que solo
un 4% tienen 24 años. También podemos observar que el 54% de los estudiantes tiene una edad
máxima de 20 años.

14
 

f1=5
Interpretación: Hay 5 estudiantes de los 50 que tienen 18 años.

F4=37
Interpretación: Hay 37 estudiantes de los 50 que tienen como máximo 21 años.

h3%=26%
Interpretación: El 26% de los estudiantes tienen una edad de 20 años.

H2%=28%
Interpretación: El 28% de los estudiantes tienen como máximo 19 años

 b) Tabla de frecuencias para Datos Agrupados.-  Es apropiada cuando los valores distintos
que toma la variable es muy numeroso. Se siguen los siguientes pasos:
1) Calcu
Calcular
lar el rang
rangoo de la varia
variable:
ble: R = Valo
Valorr máximo – V Valor
alor mín
mínimo
imo
2) Elegir el número de intervalos de clases: K se sugiere entre 5 y 10 inclusive
3) Calcu
Calcular
lar la ampl
amplitud
itud de los iinterv
ntervalos
alos de cla
clases:
ses: C
C= R cuy
cuyoo ccoci
ocient
entee en lo po
posib
sible
le deb
deberá
erá ser exa
exacto
cto,, caso
caso con
contra
trario
rio deb
deberá
erá
K trab
trabaj
ajar
arse
se con
con los
los llam
llamad
ados
os “exc
“exces
esos
os””

Ejemplo 1:

Como control de la ética publicitaria, se requiere que el rendimiento en millas/galón, de gasolina esté
 basado en un buen número de pruebas efectuadas en diversas condiciones. Al tomar una muestra de
50 automóviles se registraron las siguientes observaciones en millas por galón

35.6 27.9 29.3 31.8 22.5 34.2 32.7 26.5 26.4 31.0 31.6 28.0 33.7
32.0 28.5 27.5 29.8 34.2 31.2 28.7 30.0 28.7 33.2 30.5 27.9 31.2
29.5 28.7 23.0 30.1 30.5 31.3 24.9 26.8 29.9 28.7 30.4 31.3 32.7
30.3 33.5 30.5 30.6 35.1 28.6 30.1 30.3 29.6 31.4 32.4

Presente los datos en una tabla de frecuencias

Solución:

Rango: R 

R = 35.6 – 22.5 = 13.1

K = 1 + 3.32 log 50 = 6.64 K = 6 ó 7 u 8

Si k = 6 C = 13.1 = 2.1833………… 
  2.2
  6

Exceso E = (6 x 2.2) – 13.1 = 13.2 – 13.1 = 0.1

Si k = 7 C = 13.1 = 1.8714………… 
  1.9
  7
Exceso E = (7 x 1.9) – 13.1 = 13.3 – 13.1 = 0.2

15
 

Si k = 8 C = 13.1 = 1.6375 
  1.7
  8

Exceso E = (8 x 1.7) – 13.1 = 13.6 – 13.1 = 0.5

Eligie
igienndo K=6 por tener el menor exceso

Las frecuencias han sido obtenidas según el Programa SPSS

Rendimiento Xi fi Fi hi Hi
(millas/galón)
22.5 - 24.7 23.6 2 2 0.04 0.04
24.7 - 26.9 25.8 4 6 0.08 0.12
26.9 - 29.1 28.0 10 16 0.20 0.32
29.1 - 31.3 30.2 20 36 0.40 0.72
31.3 - 33.5 32.4 9 45 0.18 0.90
33.5 - 35.7 34.6 5 50 0.10 1.00
T O T A L 50 1.00
 
Se observa que el 60% de los automó
automóviles
viles tienen un rendimiento entre aproximadamente 27 y 31.3
millas por galón de gasolina.

Ejemplo 2

Los siguientes son los puntajes logrados en un examen de cierta


ci erta asignatura por 50 estudiantes:

61 50 65 70 45 60 80 65 60 65 64 54 65
67 48 64 56 60 61 62 62 57 75 53 58 59
56 54 67 68 60 63 56 53 61 62 69 70 44
47 65 56 57 58 55 51 43 79 72 48

Presentar los datos en una tabla de frecuencias

Solución

R = 80 – 43 = 37

K = 1 + 3.32 log 50 = 6.64 


  7 K = 6 ó 7 u 8

Si k = 6 C = 37 = 6.1666………… 
  7
  6

Exceso E = (6 x 7) – 37 = 42 - 37 = 5

Si k = 7 C = 37 = 5.2857……….. 
  6
  7

16
 

Exceso E = (7 x 6) – 37 = 42 - 37 = 5

Si k = 8 C = 37 = 4.625 
  5
  8

Exceso E = (8 x 5) – 37 = 40 - 37 = 3

Eligie
igienndo K =8 por tener el menor exceso

Puntaje Xi fi Fi hi Hi
42 – 46 44 3 3 0.06 0.06
47 – 51 49 5 8 0.1 0.16
52 – 56 54 9 17 0.18 0.34
57 – 61 59 12 29 0.24 0.58
62 – 66 64 11 40 0.22 0.8
67 – 71 69 6 46 0.12 0.92
72 – 76 74 2 48 0.04 0.96
77 - 81 79 2 50 0.04 1

Total 50 1

Poco menos de la mitad de los estudiantes (46%) han obtenido entre 57 y 66 puntos.

TABLAS Y GRÁFICOS ESTADÍSTICOS DE DATOS PARA VARIABLES CUALITATIVAS


O CATEGÓRICAS

Ejemplo 1.- Se realizó un estudio para determinar la cantidad de personas que obtienen un empleo.
La siguiente tabla incluye datos de 400 sujetos seleccionados al azar:

Fuentes de empleo Nº de Porcentaje


sujetos

Anuncios clasificados 56 14
Empresas de búsqueda de ejecutivos 44 11
Contactos profesionales 280 70
Correo masivo 20 5
Total 400 100

17
 
 

Gráfico de Barras Simples ( EXCEL )

Gráfico de Sectores Circulares ( EXCEL )

Diagrama de Pareto ( MINITA


MINITAB
B)

Fuentes de Empleo
100 100

80 80
  e
   j   e
   j
  a   a
   t 60 60    t
  n   n
  e   e
  c   c
  r   r
  o 40 40   o
   P    P

20 20

0 0
Fuentes de Empleo

Ejemploo 2.- La siguiente información se refiere al número de estudiantes matriculados en tres


Ejempl
especialidades de Administración de Empresas, durante los años 2,000 y 2,005
Porcentaje 70 14 11 5
Porcentaje 70.0 14.0 11.0 5.0
% acumulado 70.0 84.0 95.0 100.0 18
 

Especialidad 2000 2005


Finanzas 160 250
Marketing 140 200
Contabilidad 100 150

Gráfico de Barras Dobles

19
 

EJERCICIOS PROPUESTOS

1.- Al contar el número de materias reprobadas por los alumnos de cierta Universidad, se han
obtenido los siguientes datos:

1, 1, 2, 3, 2, 6, 0, 0, 1, 0, 4, 5, 0, 0, 0, 3, 2, 1, 3, 1, 1, 1, 0, 1, 2, 0,
0, 5, 4, 2.
a) Construya una tabla de frecuencias.
 b) A partir de la tabla de frecuencia complete la siguiente tabla:

FRECUENCIAS VALOR INTERPRETACIÓN


f2
F3
h1%

2.- En un colegio “X” se piensa en la posibilidad de cambiar el timbre por unos acordes de música
rock. Se ha preguntado a 20 alumnos cual es su opinión acerca de estos acordes, según la escala: No
me gusta nada ( 1 ), Me
Me gusta poco ( 2 ), M
Mee es indiferente ( 3 ), Me
Me gusta bastante ( 4 )
Me gusta muchísimo ( 5 ). Estos han opinado de la siguiente manera (codificada):

 5, 4, 1, 2, 2, 4, 2, 5, 3 , 5, 3, 5, 1, 1, 3, 1, 2, 5, 3, 3

Construir la tabla de distribución de frecuencias adecuada para responder las siguientes preguntas:
a) ¿A qué porcentaje
porcentaje de alu
alumnos
mnos les gu
gusta
sta poco es
estos
tos acord
acordes?
es?
 b) ¿A cuántos alumnos les gusta bastante los acordes?
acordes?
c) ¿Cuál es la proporci
proporción
ón de alumno
alumnoss a los que les es indif
indiferente
erente lo
loss acorde
acordes?
s?
d) ¿Cuál es la proporción de alumnos a los que les gusta poco o no les gusta nada los acordes?
e) ¿Cuál es la proporción de alumnos a los que a lo más les gusta bastante los acordes?

3.- El gerente de una tienda comercial está interesado en el número de veces que 52 clientes han ido
a comprar en su almacén durante un período de dos semanas. Los datos que se registraron fueron:

5 3 3 1 4 4 5 6 4 2 6 6 1
1 14 1 2 4 4 5 6 3 5 3 6 8
410 87 96 25 192 511 73 612 44 57 614 51 16

a) Organice los datos en un cuadro de distribución de frecuencias


 b) Presente los datos en una gráfica apropiada.
c) A partir de la tabla de frecuencia complete la siguiente tabla:

FRECUENCIAS VALOR INTERPRETACIÓN


f2
F3
h1%

4.- Los siguientes datos proporcionan los ingresos anuales en miles de dólares de 50 personas:

7.9 10.3 45.7 9.5 43.0 56.0 38.0 6.7 48.0 30.5 25.0 40.0
30.0 25.5 50.0 17.1 25.5 43.5 31.6 59.0 41.5 13.5 12.0 9.2
42.0 41.9 35.0 11.7 55.3 27.0 58.4 57.0 29.6 38.5 26.0 16.5

20
 

18.0 24.9 20.0 28.0 28.5 36.4 39.5 5.0 9.0 5.0 6.9 7.0
12.0 8.3
a) Presentar dichos datos en una tabla de distribución de frecuencias, usando 6 intervalos de
clase.
b) Estime la proporción de ingresos que están entre 12,500 dólares y 52,500 dólares.
c) Estimar la proporción de ingresos que están debajo de 50,000 dólares.

5.- Los siguientes datos son calificaciones en la prueba de Miller de personalidad de 82 estudiantes.


22 22 20 27 30 23 29 21 26 31 21 23 25
29 18 22 31 30 28 16 28 33 25 23 31 23
18 24 26 25 17 22 25 28 19 24 20 23 26
21 31 25 24 33 29 20 27 21 25 28 24 23
25 30 27 23 26 22 24 17 33 26 24 19 18
33 25 28 31 29 27 28 24 26 24 22 26 24
18 21 29 22

a) Organice los datos en un cuadro de distribución de frecuencias


 b) Presente los datos
datos en una gráfica apropiada.
c) A partir de la tabla de frecuencia complete la siguiente tabla:

FRECUENCIAS VALOR INTERPRETACIÓN


f2

F3
h2%

6.- Cierto investigador especialista en salud pública afirma que el nivel de plomo en sangre en niños
en edad escolar de una cierta región, se ha incrementado. Para verificar este supuesto se toma una
muestra de 120 niños en edad escolar, obteniendo los siguientes resultados:

27.88 28.42 45.81 6.55 6.4 6.14 3.73 26.88 31.93 14.85 26.88 38.35
34.26 38.97 7.22 5.24 15.4 3.73 31.93 28.34 10.79 26.88 6.32 33.09
28.24 4.67 6.07 9.77 5.35 28.34 33.43 14.85 28.84 3.27 4.88 47
6.56 49.24 6.82 35.49 33.43 27.38 11.33 5.44 9.28 4.36 35.6 9.17
34.26 28.84 26.53 7.92 27.96 6.28 38.62 6.55 4.4 10.79 33.09 28.42
27.38 34.47 5.91 33.1 12.04 34.26 4.24 7.22 45.16 5.91 34.94 5.04
27.6 28.42 33.09 13.38 37.47 38.41 4.67 36.23 33.09 6.67 36.71 33.83
54..0648 3245..9281 64..5668 3365.56 98..1875 2259..1373 44..8828 2384..8246 3344..1939 64..2882 41.78.896 87..792
51.24 5.84 34.72 33.83 35.09 28.42 30.83 4.79 5.44 7.17 29.29 32.29

a) Construya una tabla de frecuencias


 b) Obtenga un histograma
histograma
c) A partir de la tabla de frecuencia complete la siguiente tabla:

FRECUENCIAS VALOR INTERPRETACIÓN


f2
F3
h3%

7.- En una compañ


compañía,
ía, el sueldo mínimo y máximo de 2200
00 empleados
es de $ 150 y $300 respectivamente. Tales sueldos se tabulan en una

21
 

distribución de frecuencias de 5 intervalos de igual amplitud. Si se sabe que 20 empleados ganan al


menos $150 pero menos de $180; 60 ganan menos de $210; 110 ganan menos de $240; 180 ganan
menos de $270 y el 10% restante de los empleados gana a los más $300, reconstruir la distribución.

8.- Los siguientes datos corresponde a una muestra de 20 clien tes del Banco de Crédito de la
ciudad de Chimbote según sus inversiones mensuales en dólares en el programa Credifondo:
5500 4000 3000 3100 2000 3600 1000 3900 2500 3500
6000 4500 4800 3300 3400 3700 1500 3800 2900 3600

La información fue obtenida mediante una encuesta realizada por la empresa Aries S.A. en enero de
2004. Se pide
a) Identificar la unidad de análisis y la variable de estudio.
 b) Construir una distribución de frecuencia. Utilice la regla de Sturges para determinar el número de
intervalos.
c)Interpretar f2, F2, h2%, H2%.
d)Determine qué porcentaje de clientes invierten mensualmente $4000 o más pero menos de $6000.
e) Determinar qué porcentaje de clientes invierten $3500 mensualmente.

9.- Una tienda comercial, ubicada en Lima Metropolitana, vende ropa de moda para damas y
caballeros además de una amplia
amplia gama de productos domést
domésticos.
icos. A continuación, se presentan llas
as
ventas
ven tas net
netas
as obs
información. observ
ervada
adass dur
durant
antee los año
añoss del 200
20022 al 200
2006.
6. Rep
Repres
resent
entee grá
gráfic
ficame
amente
nte dic
dicha
ha

Año Vent
Ventas
as neta
netass (mi
(millo
llones
nes de S/.)
2002 500.0
2003 519.2
2004 535.8
2005 560.9
2006 544.1
RESPUESTAS %
10.-  Se ha hecho una encuest
encuestaa para saber con qué regul
regularida
aridadd
se lee el periódico en Lima, y los resultados fueron estos: Todos los días 37.5
Una vez por semana 29
Una vez al mes 10.5
a) ¿Qu
¿Quéé tan
tanto
to por ccien
iento
to de pe
perso
rsonas
nas rresp
espond
ondier
ieron
on “n
“nunc
unca”?
a”? Alguna vez al año 12
 b) Si las personas que no contestaron fueron 6, ¿cuántas  Nunca
 No contesta 0.4
 personas fueron encuestadas?
encuestadas?
c) Las ppers
ersona
onass en
encue
cuesta
stadas
das,, ¿so
¿sonn mue
muestr
straa o pob
poblac
lación
ión??

11. La siguiente distribución muestra el peso en gramos. De 30 paquetes de un determinado


 producto.

Peso en gr. [10-15[ [15-20[ [20-25[ [25-30[ [30-35]


hi k/2 0.17 2k k 0.13

a) ¿Cuántos paquetes tienen pesos menos de 20 gramos?


 b) ¿Qué porcentaje de paquetes
paquetes pesan 25 gramo
gramoss o más?
c) ¿Cuántos paquetes pesan 15 gramos o más pero menos de 25 gramos?
d) ¿Cuántos paquetes pesan entre 15 gramos o más pero menos de 20 gramos?

22
 

12. Completar la siguiente tabla de frecuencias:

  LLII - LS fi Fi hi% Hi%


[ - 8.8[ 12.50%
[ - [ 5
[ - [ 25% 50%
[ - 12.4 [ 32
[ - [ 95.50%
[ - [
Total 40

13. Una empresa que se dedica a preparar dietas, proyecta lanzar al


lanzar el mercado una dieta rigurosa. Los empleados de una
compañía se representaron como voluntarios para dicha promoción.
Se realizó un muestreo con 80 empleados elegidos aleatoriamente.
Los resultados del chequeo de los pesos (en Kg), fueron los
siguientes:

80.6 65.8 49.6 79.1 84.4 66.2 79.3 59.4 72.9 73.6
53.2 60.2 91.2 74.8 78.6 81.4 58.6 68.2 67.4 55.6
7868..93 7974..46 6577..93 6837..73 4794..93 4763..42 6980..84 6776..33 7522..37 7751..87
75.6 41.8 73.6 71.4 83.2 67.4 99.3 62.3 89.2 86.8
65.2 62.1 44.8 82.9 81.7 70.4 74.6 76.9 85.7 40.9
54.2 75.3 50.1 61.1 42.3 68.6 56.2 70.8 47.3 66.9
80.2 60.2 71.6 77.1 94.9 61.4 82.1 78.3 51.2 79.3

Se pide:
a) Elaborar una distribución de frecuencias
 b) ¿Cuántos empleados tiene pesos entre 45 y 60 kg?
c) ¿Qué porcentaje de empleados tienen pesos mayores a 75 kg?
d)La empresa promotora obsequia uniformes de trabajo a los empleados voluntarios. Suponiendo que
los pesos de los empleados voluntarios es menor igual a 80 kg. ¿Cuántos uniformes deben ser
devueltos?

14. La fábrica de chocolates “Glamour S.A.” produce una gran gama de chocolates. Desea
determinar si realmente el tipo de choconut es el que presenta el mayor porcentaje de defectuosos
con la finalidad de capacitar al personal en la elaboración de este producto. Para ello el gerente de
control de calidad les pregunta a los
l os trabajadores su opinión acerca del tipo de chocolate que
 presenta el mayor número
número de defectuosos. En la siguiente
siguiente tabla se presentan las respuestas de los
trabajadores:

Tipo de chocolate Nº de trabajadores %


Choconut
De leche 16
De nueces 27.50%
De pasas 7
Total 80

a) Completar los datos que faltan en la tabla


 b) Indique e interprete el valor
valor f1

23
 

c) Indique e interprete el h2%

15. Los ingresos mensuales de una muestra de pequeños


comerciantes se tabularon en una distribución de frecuencias
simétrica de intervalos de igual amplitud resultando: IIngreso
ngreso
mínimo $125, marca de clase del cuarto intervalo =$300. Si el 8%
de los ingresos son menores que $165 y el 70% de los ingresos son
menores a $275, ¿qué porcentaje de ingresos son superiores a $285?
16. Los tiempos de vida útil (en días) de un tipo de batería, se tabulo
en una distribución de frecuencias de 5 intervalos de igual amplitud
con frecuencias relativas acumuladas: 0.10, 0.25, 0.55, 0.80, 1.00.
Determine la distribución de frecuencias absolutas si la tercera
frecuencia absoluta es 11, si la segunda marca de clase es 6, y si el
límite inferior del cuarto intervalo es 12.

 17. Un grupo de personas valora la gestión del departamento de servicio al cliente de un


supermercado catalogándolo como: Excelente (E), Bueno (B), Regular (R) o Malo (M). Los
resultados obtenidos son:

E B B R E M B E
B
M R
E R
R R
R M
B B
B B
E E
R  
R B B E R M E E
B E B B R M R E

a) Elabore una tabla de frecuencia que permita resumir los datos.


 b) ¿Qué porcentaje de personas
personas valoró la Ges
Gestión
tión del Departamento como Bu
Buena?
ena?
c) ¿Cuantas personas valoraron la gestión como Excelente o Buena?
d) Interprete f3 y h3%.

24
 

MEDIDAS DE TENDENCIA CENTRAL,


MEDIDAS DE POSICIÓN,
MEDIDAS DE DISPERSIÓN, ASIMETRÍA Y
CURTOSIS.

25
 

Medidas de Tendencia Central


Media Aritmética(  X  ): Es el promedio de los datos, y su objetivo principal es encontrar el valor que
debería estar al centro.
Datos No Agrupados: Se utiliza cuando hay datos sueltos y se halla la suma de dichos valores
dividida entre el número de datos, así como se expresa en la fórmula:
Media Aritmética: Datos no agrupados

   X  

   xi
 (Muestral)   µ
 xi
   (Poblacional)
n  N 
Datos Agrupados: Se utiliza cuando agrupamos datos en una tabla de frecuencias por intervalos o
sin intervalos, se halla multiplicando la marca de clase por la frecuencia absoluta de cada categoría
(cuando se encuentran en intervalos de clase) y sin intervalos se multiplica el valor de la variable por 
la frecuencia absoluta, después se debe sumar todos los resultados y dividirlos entre el número total
de datos, así como se expresa en lal a fórmula:

Media Aritmética: Datos Agrupados

   X  
 x  f    (Muestral)
  i i
  µ
 x   f     (Poblacional)
i i

n  N 

Ejemplo 1. Calcular la media aritmética de las notas obtenidas en un examen por una
muestra de 8 estudiantes.

12 15 10 13 10 11 16 09
8

12  15  ...............  09  x
i 1
i
96
 X       12
8 8 8

Interpretación: La nota promedio obtenida por los alumnos


al umnos en dicho examen ha sido igual a 12

Ejemplo 2. Calcular la media aritmética del número de artículos defectuosos observado en 200 lotes.

Artículos  Nº de lotes Total de producto


productoss
defectuosos defectuosos
 X i   f  i   f  i  X i
0 12 0
1 33 33
2 42 84
3 59 177
4 32 128
5 16 80
6 06 36
Total 200 538

26
 

  f   X 
  i 1
i i
 =
538
 2.69 artículos / lote
 X   200
n

El número promedio de artículos defectuosos es de 2.7 por lote.

Ejemplo 3. Hallar el peso promedio de 144 conservas de pescado “La Caserita”, cuyos pesos se
encuentran presentados en la siguiente tabla de frecuencias.

Peso (g
(gramos) xi  Nº de conservas
conservas ( f i ) Producto ( f ixi )
153 - 155 154 8 1232
155 – 157 156 17 2652
157 – 159 158 26 4108
159 – 161 160 40 6400
161 – 163 162 32 5184
163 – 165 164 16 2624
165 - 167 166 5 830
Total 144 23030

 X  
  f   x
i 1
i i


23030
160  gra
 gramo
moss aproximadamente
n 144

Mediana (Me): Es la medida de tendencia central, que supera a no más del 50% de los datos y es
superado por el otro 50% restante.

 Datos No Agrupados:
Primero ordenamos los datos de menor a mayor
Mediana: Datos no agrupados
Si el número de datos es impar: Si el número de datos es par:
La mediana es el valor central. La mediana es la semisuma de los dos valores
centrales.

Ejemplo 1 Se tienen los gastos mensuales en consumo de 7 familias (en soles):
470 600 500 580 450 600 650

Ordenando los datos tenemos:


450 470 500 580 600 600 650

Por lo tanto Me = 580 soles mensual

Interpretación: Esto significa que el 50% de estas familias tienen un gasto mensual máximo de 580
soles y el 50% restante tienen un gasto mensual superior a 580 soles.

Ejemplo 2. Si agregamos una familia más en el ejemplo anterior tenemos:


450 470 500 580 600 600 650 700
En este
este caso tenemos una M
Mee = (580 + 600)/2 = 590 ssoles
oles

Interpretación: El 50% de los gastos mensuales de estas familias son menores o iguales a 590 soles
y el otro 50% son mayores a 590 soles.

27
 

Datos agrupados por frecuencias: La mediana se halla aplicando el mismo procedimiento que para
datos no agrupados.

Ejemplo La siguiente información corresponde al precio de cierto artículo observado en 20 tiendas


comerciales

Precio (soles)     f  i  F i


11 4 4
12 6 10
13 5 15
14 3 18
15 2 20
Total 20

Por tratarse de un número par de datos, la mediana será el valor central; es decir el promedio de
12  13
 12.5
2

Interpretación:  El precio máximo de dicho artículo observado en el 50% de estas tiendas


comerciales
12.5 soles. ha sido de 12.5 soles y en el 50% restante de estas tiendas se observó un precio mayor a

Datos agrupados por intervalos. Se utiliza la siguiente fórmula:

n 
  2   F i 1 
 Me   Li  c  
   f  
i 
 
Ejemplo. La siguiente tabla nos muestra los sueldos en dólares de 68 trabajadores de una fábrica.
Calcular la mediana

Sueldo
ldos ( $ ) Nº de trabajadores Fi
500 – 700 13 13
700 – 1000 25 38
1000 – 1500 15 53
1500 – 2000 10 63
2000 - 3000 05 68
Total 68

Solución
Primeramente hallamos los Fi y como sabemos que n = 68 entonces se tiene que n/2 = 34; luego

28
 

   13 
 700  300  
34
 Me      952
  25  

Interpretación: El 50 % de los trabajadores tiene un sueldo menor de 952 dólares y el otro


50 % perciben un sueldo mayor que 952 dólares.

Moda (Mo): Es el valor más frecuente de la variable, el que se observa mayor número de veces.
Datos No Agrupados o agrupados por frecuencias: Se ubica el dato que más se repite.

Ejemplo 1 Hallar la moda de los siguientes datos:

10 12 09 13 11 14 12 15 eenn este caso la moda es 12

Ejemplo 2 Hallar la moda en la siguiente distribución

 Nº de  Nº de
hijos familias
0   80
1 120
2 210
3 380
1 180
5   60
6 ó más   40
Total 1070

La moda en este caso es 3; esto significa que estas familias tienen generalmente tres
hijos.

 Datos Agrupados con intervalos de clase: 


En cuadros con intervalos de clase, se localiza la clase modal buscando la frecuencia más alta y
después se aplica la siguiente formula:

Ejemplo La siguiente tabla nos muestra los sueldos en dólares de 68 trabajadores de una
fábrica. Calcular la mediana

Sueldo
Sueldoss ( $ ) Nº de trab
trabaj
ajad
ador
ores
es
500 – 700 13
700 – 1000 25
1000 – 1500 15
1500 – 2000 10

T2000
otal - 3000 6058

29
 

  12  
 Mo  
700     300  863 .6
 12  10 
Esto significa que el sueldo que comúnmente se ha registrado entre los trabajadores ha sido de 863.6
dólares.

Ejemplo. En una encuesta de consumidores de bebidas gaseosas se obtuvo los siguientes resultados:

Marcas de  Nº de
gaseosa consumidores
Coca Cola 140
Inca Kola 160
Pepsi Cola   90
Sprite 100
Total 490

En este caso la moda es Inca Kola, ya que es la bebida gaseosa que ha tenido mayor 
 preferencia entre los
los consumidores.
consumidores.

Ejercicios de Medidas de Tendencia Central


1.- Los salarios en una Empresa son en promedio S/ 380 semanales,
con posterioridad se incorpora a la Empresa un grupo de trabajadores
igual al 25 % de los que estaban anteriormente. El nuevo grupo
ingresa a la Empresa con un salario medio igual al 60 % de los
antiguos. Dos meses más tarde, la Empresa concede un aumento de
salarios de S/ 50. Hallar el salario promedio del total de trabajadores.
Solución:
n1 :  N º de trabajador es antiguos   x1 : Salario  prome
 promedio
dio de antiguos
0.25n1  n2 :  N º de trabajador es nuevos   x 2 : Salario  prome  promedio
dio de los nuevos
 X  p  Salario  prome
 promedio
dio de todos los trabajador es

Sabemos que  x1  380  x 2  0.6(380)  228

n1 (380)  0.25 n1 (228)


 X  p   349.6  349.6  50  399.6
1.25n1

2.- En una Compañía que maneja cuatro productos; los márgenes de utilidad y las totales de ventas
observados durante el año pasado aparecen en la siguiente tabla.

Producto Margen de utilidad Venta total


A 4.2 % $ 30,000
B 5.5 % $ 20,000
C 7.4 % $ 5,000
  D 10
10.1
.1 % $ 3,
3,00
0000

Calcule el margen de utilidad promedio.

30
30

Solución:
Considerando que las ventas totales no son las mismas para cada producto, utilizaremos un promedio
 ponderado

0.042 (30,000)  0.055 ( 20,000)  ...................................  0.101 (3,000)


 X  p   0.052
30,000  20,000  ........................  3,000

Por lo que el margen de utilidad promedio será del 5.23 %

3.- Una fábrica tiene 3 máquinas. La máquina B produce la mitad de


lo que produce la máquina A y la producción de la máquina C es
inferior en un 20 % de lo que produce la máquina B. Los costos de
 producción por unidad son: 3, 4 y 5 soles para las
las máquinas A, B y C
respectivamente. Se desea ganar el 20 % por unidad. Calcule el
 precio medio de venta.

Solución:

Máquinas
A Costo por
S/. 3unidad Cantidad producida
2x Precio de3.6
venta
B 4 x 4.8
C 5 0.8x 6.0

3.6 ( 2 x )  4.8  x  6 (0.8 x)


 P V      4.42  soles
2 x   x  0.8 x

4.- El ingreso per cápita mensual de un país es $315. El sector 


 público que constituye un 55% de la población percibe 18% del
ingreso total. Calcule el ingreso medio por habitante del sector 
 público y no público.
Solución: Consideremos:

 Ingreso
 Ingreso  per
 percápi
cápita
ta :  X  p  n1  x1  n2  x2  $315   Ingr
 Ingreso
eso total   315 n
n

Sector   Púb
 Público : n1  0.55 n
lico  Sector  no  Púb
 Público : n2  0.45 n
lico

 x
 x1 
n1
1
  x 1  n1 x1  Ingreso total  del  Sector   Público    x1  0.18 (315 n)  56.7 n

luego  x1 
 x 1

56.7n
 103.09 dólares ( Ingreso  promedio del  Sector   Público )
n1 0.55n

 Ahora hallaremos el  ingreso  prom


 promedio
edio del  Sector  no  Púb
 Público
lico

315  n1  x1  n2  x2  56.7 n  0.45 n ( x 2 )  315  56.7  0.45 x 2   x2  574 dólares
n n
31

5.- Un grupo de 200 estudiantes, cuya estatura media es de 60.96


 pulgadas se divide en dos grupos, uno con estatura media de 63.4
 pulgadas y otro con una estatura de 57.3 pulgadas. ¿Cuántos
estudiantes hay en cada grupo?

Solución: Sea n1 = Nº de hombres y n2 = Nº de mujeres


Sabemos que n1  n2  200  n1  200  n2
además  X  p  60.96  X 1  63.4  X 2  57.3
( 200  n2 ) 63.4  57.3 n2
luego 60.96   n2  80 n1  120
200

6.- Una estación de servicio automotriz gasta $500 en la compra de latas de aceite que cuestan $10 llaa
docena; $500 en latas que cuestan $12.5 la docena; otros $500 en latas que cuestan $20 la docena y
$500 en otras que cuestan $25 la docena.
Determinar el costo promedio por docena de las latas de aceite.

Solución:

Hallaremos el costo promedio por docena

Monto Costo por docena Docenas compradas


500 10 50
500 12.5 40
500 20 25
500 25 20
  Total = 2000 135

2000 dólares
 X      14.8 dólares / docena
135 docenas

Medidas de Posición No Central


32

Este tipo de medidas llamadas a veces Medidas de Posición No Central, simplemente dividen a todo
un conjunto de datos en partes iguales.
Los Cuantiles más comunes son los: Cuartiles, Deciles, y Percentiles.

El Cuartil es el número que divide al conjunto de datos en 4 partes iguales, y se representa con la
letra Q. Entonces en un conjunto de datos existen tres cuartiles: Q1, Q2, y Q3, los que dividirán en
cuatro partes iguales a toda la muestra de datos.

La forma más sencilla de trabajar con cuartiles implica ordenar todos los datos (de menor a mayor),
y enseguida proceder a determinar:

 Primer cuartil (Q1) que viene a ser el valor máximo del 25% inferior.

Segundo cuartil (Q2) que viene a ser el valor máximo del 50% de los datos previamente ordenados
de menor a mayor y es equivalente a la mediana

Tercer cuartil (Q3) que corresponde al valor máximo del 75% de los datos o también el valor mínimo
del 25% superior.

Cálculo de cuartiles para datos no agrupados


Cálculo del cuartil 1: Q1

Se ordenan los datos en forma ascendente


(n   1)
Se localiza el punto de posición del valor correspondiente a la   observación ordenada,
4
luego:
 
(n   1)
Si   es un enter
enteroo, entonces
entonces Q1 es igual a la observa
observación
ción corr
correspon
espondient
dientee al punto de
4
 posición.
 
Ejemplo. Sean los datos:

12, 4, 18, 11, 7, 10, 21, 7, 5, 33, 9

Ordenando: 4 5 7   7 9 10 11 12 18 21 33

Como n = 11 entonces (n + 1)/4 = (11 + 1)/4 = 3 entonces Q1  = 7

(n   1)
Si   no es un ent
entero
ero entonces hacemos una interpolación lineal entre los dos valores
4
correspondiente a las dos observaciones entre las cuales se encuentra la fracción.

Ejemplo:

2210, 2255, 2350, 2380, 2380, 2390, 2420, 2440, 2450, 2550, 2630 2825

( n   1)    1)
(12
Como n = 12 entonces =  = 3.25
4 4
 

Entonces Q1  = 2350 + 0.25(2380 – 2350) = 2357.5


33

En general para un número de “n” observaciones en el que los datos no están presentados en clases,
una vez ordenados los datos, la posición de los cuartiles se pueden localizar de la siguiente forma.

k ( n   1)
  k = 1,2,3
4

Cálculo de cuartiles para datos agrupados por frecuencias

El procedimiento a seguir es el mismo que se aplicó para datos no agrupados.

Ejemplo: En la siguiente tabla hallar la mediana.

N° de hijos fi Fi
0 5 5
1 8 13
2 11 24
3 9 33
4 5 38
5 2 40
Total 40

Me = 2

Cálculo de cuartiles para datos agrupados por clases

Los cuartiles se calculan utilizando la siguiente fórmula:

 k  n   F  
  4 i 1 
Qk    Li  C     f     k = 1, 2, 3
 i 
 

Ejemplo Hallar el cuartil 1(sueldos en dólares de 68 trabajadores de una fábrica)

Sueldo
ldos ( $ ) Nº de trabajadores Fi
500 – 700 13 13
700 – 1000 25 38
1000 – 1500 15 53
1500 – 2000 10 63
2000 - 3000 05 68
Total 68

 
En este caso n/4 = 68/4 = 17 luego:

 68  13 
 
Q1  700  300   4   748
74 8
 25 
 

Esto
de losnos indica queganan
trabajadores el 25 % dede
más los748
trabajadores
dólares. ganan menos de 748 dólares y que el 75 % restante
34

El Decil es el número que divide al conjunto de datos en 10 partes iguales, y se representa con la
letra D. Entonces en un conjunto de datos existen nueve deciles: D1, D2,……,D9, los que dividirán
en diez partes iguales a toda la muestra de datos.

El Percentil es el número que divide al conjunto de datos en 100 partes iguales, y se representa con
la letra P. Entonces en un conjunto de datos existen noventa y nueve percentiles: P1, P2, P3,
….,P99 los que dividirán
dividirán en cien partes iguales a toda la mues
muestra
tra de datos.

La forma más sencilla de trabajar con cuartiles implica ordenar todos los datos (de menor a mayor),
y enseguida proceder a determinar:

Primer percentil (P1) que corresponde al primer 1% del total de datos

Segundo percentil (P2) que corresponde al 2% del total de datos.

Percentil 50 (P50) que corresponde al 50% del total de datos y es equivalente a la mediana, cuartil 2
y decil 5.

Percentil 99 (P99) que corresponde al 99% del total de datos

NOTA.- A través del cálculo de los percentiles podemos hallar también deciles y cuartiles.

Cálculo de percentiles para datos no agrupados

Para un número de “n” observaciones en el que los datos no son presentados en clases, una vez
ordenados los datos, la posición de los percentiles se pueden localizar de la siguiente forma.

k ( n   1)
  k = 1,2,3,….,99
100

Ejemplo. Los siguientes datos son los gastos realizados por la compra de medicamentos observado
en una muestra de 16 pacientes atendidos en una farmacia:

30 70 25 90 14 25 62 35 40 28 50 24
41 25 80 60

a) Cal
Calcul
culee e int
interp
erpret
retee el Per
Percen
centil
til 70 o D7
Primeramente ordenamos los datos de menor a mayor 
14 24 25 25 25 28 30 35 40 41 50 60 62
1 2 3 4 5 6 7 8 9 10 11 12 13

70 80 90
14 15 16

Luego hallamos el 0.7(n+1) = 0.7(16+1) = 11.9

Entonces P70 = 50 + 0.9(60 – 50) = 59

Interpretación: El 70% de los pacientes gastaron a lo


l o mucho 59 soles en la compra de medicamentos.

b) Cal
Calcul
culee e int
interp
erpret
retee el cua
cuarti
rtill 3 o P75
Hallamos el 0.75(17) = 12.75
35

Luego Q3 = P75 = 60 + 0.75(62 – 60) = 61.5

El 75% de los gastos en la


l a compra de medicamentos fueron menores a 61.5 soles.

c) Calcule el gasto mínimo del 20% de los mayores gastos.

El gasto mínimo del 20% superior de los gastos, estará dado por el percentil 80 o decil 8
Hallamos el 0.8(17) = 13.6

Luego D8 = P80 = 62 + 0.6(70 – 62) = 66.8

Cálculo de percentiles para datos agrupados por frecuencias

El procedimiento a seguir es el mismo que se aplicó para datos no agrupados.

Ejemplo: En la siguien
siguiente
te tabla hallar el percentil 50 y 90

N° de hijos fi Fi
0 5 5
1 8 13
2 11 24
3 9 33
4 5 38
5 2 40
Total 40

Percentil 50 = Mediana = D5
Hallamos el 0.5(41) = 20.5

Luego P50 = 2 + 0.5(2 – 2) = 2

Percentil 90 = D9

Hallamos el 09(41) = 36.9

Luego P90 = 4 + 0.9(4 – 4) = 4

Cálculo de percentiles para datos agrupados por clases


36

  k = 1,2,3,…99

Ejemplo.- Un laboratorio de análisis clínico proporciona la siguiente información sobre la


distribución de los contenidos de colesterol en la sangre de 80 personas adultas.

Colesterol Nº personas Fi
(mg/100mL)
45 – 90 04 4
90 – 135 06 10
135 – 180 11 21
180 – 225 16 37
225 – 270 21 58
270 – 315 10 68
315 – 360 08 76
360 - 405 04 80
  To
Total 80

a) ¿Cuál es la ccantida
antidadd mínim
mínimaa de coles
colesterol
terol de
dell 25% de las pperson
ersonas
as de más al
alto
to dosa
dosaje?
je?

Primeramente hallamos el 0.75(80) = 60

   58 
 60
 P 75  270  45     279
 10 

 b) Calcule el el percentil 90 = D9

Hallaremos 0.9(80) = 72

 P 90  315  45   72


   68   337.5
 8 

EJERCICIOS PROPUESTOS

1. Suponga que Juan obtiene 86 en la calificación de un examen de inglés. Si esta puntuación


corresponde al percentil 90, entonces 90% de los estudiantes obtuvieron una puntuación menor que
la de Juan y 10% de los estudiantes obtuvieron una puntuación mayor.
37

2. Sobre las equivalencias que se presentan a continuación, indique cuales son VERDADERA
VERDADERAS
Sy
cuáles son FALSAS. Marque con un aspa la opción correcta.  
AFIRMACIONES V F
Q1=P25
El segundo cuartil es la mediana
El noveno decil es igual al percentil 9
D7 = P70
tercer cuartil
El segundo equivale
cuartil al percentil
es menor 75
que el percentil 48
El séptimo decil es menor que el tercer cuartil
El 80% central de los datos se encuentra comprendido entre el decil 2 y el
decil 6
El 90% central de los datos se encuentra comprendido entre el percentil 5 y
el percentil 95
Q3 = P3

3.Determine e interprete el percentil 65  en los sueldos mensuales de la tabla siguiente:


Egresado 1 2 3 4 5 6 7 8 9 10 11 12
Sueldo
Mensual 3450 3550 3650 3480 3355 3310 3490 3730 3540 3925 3520 3480
inicial

A partir de los datos encuentre los valores de los siguientes cuantiles:

CUANTIL VALOR INTERPRETACIÓN


P65
P50
D3

4. Los datos de la tabla muestran información sobre la variable X que representa el número de años
de consumo de estupefacientes en una muestra de pacientes del Hospital Nacional del Centro.
Completar los datos que faltan en la siguiente tabla estadística:

Xi fi hi Fi
1 4 0.08
2 4
3 0.16 16
4 7 0.14
5 5 28
6 38
7 7 45
8
Total
A partir de los datos encuentre los valores de los siguientes cuantiles:

CUANTIL VALOR INTERPRETACIÓN


D9
P20
Q3
38

5.Se realiza una estadística en la Institución Educativa “Fé y Alegría”, referente a la nota global de
cada uno de los estudiantes que van a acudir a los exámenes de selectividad. Las distribuciones de
frecuencias son las siguientes:

 Nota global de cada


Frecuencias
alumno
5.5 10

67..55 1250
8.5 30

a) Calcule la nota máxima del 30% de los alumnos menos aplicados


 b) Calcule la nota mínima global
global del 10% de los alumnos má
máss aplicados.
c) Calcule la nota máxima global del 20% de los alumnos menos aplicados

6. En la tabla siguiente se muestra la distancia recorrida por 65 automóviles en un día. Calcular el


cuartil 1, el decil 6 de los datos agrupados

Distancia recorrida Frecuencia Frecuencia


Acumulada
50-60 8 8
60-70 10 18
70-80 16 34
80-90 14 48
90-100 10 58
100-110 5 63
110-120 2 65

7. Millones de estadounidenses trabajan para sus empresas desde sus hogares. A continuación, se
 presenta una muestra de datos que dan las edades de estas personas que
que trabajan desde sus
hogares.

18 54 20 46 25 48 53 27 26 37
40 36 42 25 27 33 28 40 45 25

¿Calcule la edad máxima del 30% de las personas más jóvenes que trabajan desde sus hogares?
8.Se analizan los salarios en una de las
l as áreas de una compañía y se obtiene información de 7 salarios
en nuevos soles: 850.000, 740.000, 1350.000, 5565.000, 750.000, 650,000, 680.000.
Calcular el salario mínimo del 30% de los salarios más altos.

9. En el Curso de estadística de un centro de formación bancaria se obtuvieron las notas de 14


estudiantes, las que se detallan a continuación: 12, 14, 15, 13, 16, 17, 19, 11, 13, 15, 16, 18, 13, 17
 a) Calcule la nota mínima del 25% de las notas más altas en el curso de estadística.
 b) Calcule la nota máxima del 25%
25% de las notas más bajas
bajas en el curso de estadística.

10.Se analizó el impuesto que se aplica, en divers


diversos
os países de Asia, a la compra de instru
instrumentos
mentos
músicales. Los resultados obtenidos fueron los siguientes:

Impuesto Frecuenci Frecuencia


(dólares) a Países Acumulada
(f) (Fi)
39

50-54 7 7
54-58 10 17
58-62 16 33
22-66 20 53
66-70 18 71
70-74 11 82

74-78 8 90
Total 90

Calcule el percentil 30, el cuartil 2 e interprete.

11.La siguiente tabla, incompleta, muestra la distribución de los años de servicios del
 personal de una
una empresa. La tabla tiene interva
intervalos
los de igual amplitud
amplitud..
Intervalos Punto medio fi Fi
3 8
20
50
90
24 - 110
120
Total 120
a) Complete
Complete la tabl
tablaa de distr
distribució
ibuciónn de frecu
frecuencias
encias..
 b) Calcule el promedio y la mediana, ¿estaría usted en condiciones de afirmar que la distribución
de la variable es asimétrica positiva? Presente sus resultados.
c) Se ha dec
decidi
idido
do invita
invitarr al 30% de traba
trabajad
jadore
oress (los
(los más antig
antiguos
uos)) al retiro volu
volunta
ntario
rio con
incentivos. ¿Cuántos años de servicio como mínimo debe tener un trabajador para estar 
comprendido en este grupo?

12. La siguiente distribución muestra las edades de los trabajadores de una empresa.

Edad N° de
trabajadores
18 – 23 8
23 – 28 15
28 – 33 20
33 – 38 25
38 – 43 18
43 – 48 8
48 - 53 6
Por política de la empresa, la gerencia decide despedir al 20% de trabajadores más jóvenes y el
30% de los trabajadores de mayor edad; después de esta reducción.
a) Encuentre
Encuentre loloss límite
límitess para sser
er desp
despedido
edido..
 b) ¿Cuál es la edad mediana de los trabajadores de la empresa?

13. La distribución de las puntuaciones en una escala de hostilidad, de 160 sujetos de una muestra,
ha sido la siguiente:
Puntuación fi
0 - 10 10
10 – 20 22
20 – 30 32
30 – 40 44 40
40 – 50 28
50 – 60 20
60 – 70 4
 

a) ¿Entre que valores se encuentra el 50% central de los individuos?


 b) Calcule
c) ¿A partireldepercentil 27.
qué puntuación se encuentra el 12% de los sujetos más hostiles?
d) Si descontamos el 25% de los individuos menos hostiles y el 15% de los más hostiles ¿En qué
intervalo de puntuación se encuentran los restantes?

14. A continuación
continuación se presenta la distribución de 200 empresas cajamarquinas de acuerdo a su
ganancia neta en miles de dólares durante el primer trimestre del año 2011. Esta información ha
originado el siguiente cuadro de distribución de frecuencias:

Ganancia fi Hi
%
0-4 20
4-8 50
8 - 12 80
1126 -- 1260 3155
Total

Calcular:
a)¿Cuánto ganan como máximo el 15 % de las empresas con menores ganancias?
 b)¿Cuánto ganan como mínimo
mínimo el 20 % de las empres
empresas
as con mayores ganan
ganancias?
cias?

15. A continuación, se muestra las calificaciones de 120 estudiantes en un examen de Ingles del
BRITANICO.
Calificación N° de
estudiantes

4300 –- 4500 33
50 – 60 10
60 – 70 22
70 – 80 43
80 – 90 32
90 – 100 7
Determinar:
c) La calificación
calificación más bbaja
aja logra
lograda
da por el 25% sup
superior
erior de la clas
clase.
e.
d) La calificación
calificación más aalta
lta lograd
logradaa por el 10% infer
inferior
ior de la clase
clase..
41

Medidas de Dispersión

Una medida de variabilidad es un número que nos indica el grado de dispersión en un conjunto de
datos. Si el valor es pequeño (respecto a un valor central) entonces hay una gran uniformidad entre
los datos (homogénea).
Por el contrario, un gran valor nos indica poca uniformidad (heterogénea). Cuando es cero quiere
decir que todos los datos son iguales.

Varianza: La varianza mide la mayor o menor representatividad de la media aritmética.


  2

Muestral ( S    ) Poblacional (


2
       
)
DATOS NO AGRUPADOS


2
( x   i    x)2


n 1 2 (  x     )
i
2
   
 N 
DATOS AGRUPADOS
 

S 2   ( x  i    x) 2 .  f  i



n 1 2
 ( x i     )2.  f  i
   
 N 

Desviación estándar o típica:

Para eliminar el problema de la elevación al cuadrado de los datos en la varianza, se realiza una
transformación que consiste en calcular la raíz cuadrada de la varianza con lo que obtendríamos la
desviación estándar o típica.

DATOS NO AGRUPADOS

S 2   S 

   2    

DATOS AGRUPADOS
 
S    2
 S 
   2    

Con lo que la desviación estándar o típica vendrá dada en las mismas unidades que los valores de la
variable.
La
La desviación
desviación estándar
estándar oo típica
típica siempre es positiva
es la medida porque óptima,
de dispersión la varianza
mástambién lo es.estable y más
exacta, más
utilizada, sirviendo de base para las medidas de asimetría y correlación.
42

Ejemplo 1. Los siguientes datos son los pesos en onzas obtenidos a partir de una muestra de 7
frascos:
4 2 5 4 5 2 6 onzas

Calcule la desviación estándar muestral

Solución

Aplicamos la fórmula:
2
  n  
n n
  X i 
  X    X   X i   i1  
2
  2
i n
i 1 i 1
S  
2

n 1 n 1

En donde  X2 = 42  + 22  + 52 + ………… ... .+62  = 126

 X = 4 + 2 + 5 + ……………….+ 6 = 28
2

126  ( 28)
S  
2 7  2.33
7 1

Dado que las unidades obtenidas están elevadas al cuadrado, es necesario expresarlo en sus
unidades respectivas, por lo que sacaremos su raíz cuadrada.

En consecuencia S = 1.53 onz aproximadamente.

Interpretación. Los pesos en la muestra se dispersan en promedio aproximadamente en 1,53


onz alrededor de la media ; es decir, el peso promedio de los frascos es de  4 onzas con una
desviación media de 2.3 onzas.

Ejemplo 2. Se tiene la siguiente información:

Edad:Xi fi fiXi fiXi2


18 3 54   972
19 5 95 1805
20 9 180 3600
21 6 126 2646
22 4 88 1936
23 1 23   529
Total 28 566 11488

Calcule la varianza muestral: S 2


43

  = 1.73

Por lo tanto la desviación estándar muestral (S) será:

S= = 1.3153 años

Lo cual significa que la edad promedio de estas personas es de 20.2 años con una desviación media
de 1.3 años.

Ejemplo 3. Un laboratorio de análisis clínico proporciona la siguiente información sobre la


distribución de los contenidos de colesterol en la sangre de 80 personas adultas.

Colesterol Nº personas Xi fiXi fiXi2


(mg/100mL)
45 – 90 04 67.5 270 18225
90 – 135 06 112.5 675 75937.5
135 – 180 11 157.5 1732.5 272868.75
180 – 225 16 202.5 3240 656100
225 – 270 21 247.5 5197.5 1286381.25
270 – 315 10 292.5 2925 855562.5
315 – 360 08 337.5 2700 911250
360 - 405 04 382.5 1530 585225
  To
Total 80 18270 4661550

Calcule la desviación estándar muestral

4661550  4172411.25
S2 =  6191.63
79

S = 78.7 mg/100mL

Propiedades de la Varianza:

1. La varianza será ssiempre


iempre un valor positivo o cero.
  Var() = 0
2. si x=constante . La varianza de una constante es cero (todos los datos son
son iguales)
44

3. Var() = a 2 Var() Si se tiene la varianza de un co conjunto


njunto de datos y a cada observación
observación se
multiplica por una constante, entonces la nueva varianza de los datos se obtiene multiplicando a la
varianza de los datos por a 2 .
 
4. Var ( + ) = Var(). Si a todos los valores
val ores de la variable se les suma un mismo número, la
varianza no varía.
5. ( + ) = a 2 ()
Si todos los valores de la variable se multiplican por un mismo número y luego se le suma otro
número, la varianza queda multiplicada por el cuadrado de la constante a..

6. Las unidades de medida de la varianza son las unidades de los datos al cuadrado.

Rango o amplitud: Es la medida de variabilidad más sencilla entre todas las mencionadas.
El rango de un conjunto de datos es la diferencia entre dato mayor
m ayor y el dato menor:

 R   X   max   X min


Donde:
Xmax: Valor máximo observado de la variable.
Xmín: Valor mínimo obs
observado
ervado de la vvariable.
ariable.

Coeficiente
variación en de Variación
diferentes : Es unademedida
conjuntos de dispersión
datos que no vienen relativa
dadas enque
lassemismas
usa para comparar
unidades la las
o que
medias no son iguales, el cual mide la magnitud de la desviación estándar en relación a la media
aritmética, expresada como porcentaje:

CV=
 x

Ejemplo 1. Supongamos que un grupo de niños de 7 años tenga una talla media de 45 pulgadas con
σ = 2.5 y un peso medio de 50 libras con σ = 6 libras. ¿En cuál de las dos características es más
variable este grupo?

Característica Promedio Desv. estándar C.V ( %)


Talla 45 pulgadas 2.5 5.6
Peso 50 libras 6 12

Este grupo de niños es más variable en el peso.


Podemos concluir que los niños son aproximadamente dos veces más variable (12/5.6 = 2.1) en el
 peso, que en la talla

Otros ejemplos:
1.- El coeficiente de variación de los ingresos mensuales de 100
empleados de una compañía es 0.6. Después de un aumento general
de S/.
S/. 90 memens
nsua
uale
less para
para cada
cada uno
uno de los
los trab
trabaj
ajad
ador
ores
es de la
compañía, el coeficiente de variación es ahora de 0.55. Determinar la
cantidad de dinero que necesitará mensualmente la compañía para
 pagar los sueldos después loss aumentos. 
después de hacer efectivos lo

Solución: Sea X: Sueldos antes del aumento


45

 Antes  Después
 Después

S  S 
C .V    0.6   C .V    0.55
 X   X   90

luego S    0.6   X    

 Igualand
ando
o las desviaciones estándar 

0.6   X      0.55 (   X      90)


0.6   X      0.55   X      49.5  0.05  X     

entonces   X      90  1080 ( Sueldo    p


 Luego
 Luego :  Dinero
ero total     para
   para    pagar  los
los

2.- Una muestra de 70 datos da una media de 120 y una desviación


estándar de 6; otra muestra de 30 datos da una estándar de 5. Se
reúnen las dos muestras formando una sola muestra de 100 datos.
Calcule el coeficiente de variación de esta muestra de 100 datos.
Solución: Se tiene que:

n1  70 n2  30
 X   120  X   125
1 2
S 1  6 S 2  5

 Hallaremos : C .V . 
 X 

70 ( 120 )  30 ( 125 )
n1  X 1  n2  X 2 =    121.5
en este caso  X   70  30
n1  n2


  X  2

Sabemos que : S  
2  X  2
n
n 1

 X    
  X   
2 2     X    X  
1 2
2

en este caso  por  tratarse de dos  grupos : S 2 


1 2
n
n 1
46

    X   2

  8400
2
  X 1
2
 1
n1  X  2
70
 X 
1
S 12   36   2
 1010484
n1  1
1
69

 X     
  X   2

3750  2


2 2
2 n2  X 22 
2 30 2
S  
2
n 2  25  
2
 469475
29
 X 

1479959  12150
 2

 Luego S 2  100  37.72  S   6.14


99

6.14
 Por  lo tan to C .V    x 100%  5.05%
121.5
47

EJERCICIOS PROPUESTOS

1.La cadena de gimnasios Millenium Fit Spa ha evaluado el pago por concepto de membresía (en
dólares), de sus clientes de tres tipos: Estándar, Ejecutiva y Premium, encontrando la siguiente
información para una muestra de 200 clientes de cada tipo de membresía

Dato Membresía
Estándar  Membresía
Ejecutiva Membresía
Premiun
Valor promedio (dólares) 130 240 350
Valor mínimo 80 180 280
Valor máximo 280 300 400
Q1 150 210 320
10% de los clientes pagan un valor
100 195 300
de membresía menor o igual a
75% de los clientes tienen valor de
250 260 360
membresía menor o igual a
Varianza (dólares2) 1024 256 40000
El 90% de los clientes pagan un
265 290 385
valor de membresía menor o igual a

Señale la valides de las siguientes afirmaciones:

 Nro AFIRMAC
AFIRMACION ION VóF SUSTENTO
1 Los clientes del tipo de
membresía estándar muestran
una dispersión relativa alta.

2 El 50
50% cceentral ddee lo
los cl
clientes
con
membresía
menos ejecutiva son
dispersos que el 50% central
de los
clientes con membresía
Premium

3 Los clientes de la membresía


Premium son los más
dispersos de
todo el grupo

4 El rango intercuartílico
ico de los
clientes de membresía
ejecutiva es 30
48

 Nro AFIRMAC
AFIRMACION
ION VóF SUSTENTO

5 La desviación están
tándar de los
clientes con membresía
Premium es de 20

7 El 25% de las membresías


más caras de los clientes
estándar es más disperso que
el 25% de las membresías más
caras de los clientes
ejecutivos.

2.Recientemente, el Ministro de Trabajo y Promoción del Empleo ha publicado información acerca


de los salarios que perciben los controladores de tráfico aéreo en el Perú. (salarios anuales en miles
de dólares) Los datos obtenidos de una muestra de 300 controladores a nivel nacional se muestran a
continuación:

a) Defin
Definaa la vvariab
ariable
le en estud
estudio,
io, ti
tipo
po y escal
escalaa de m
medici
edición.
ón.

 b) Calcule e interprete: rango, desv


desviación
iación estándar y coeficiente de variación
variación
49

Medida Resultado Interpretación


Rango

Varianza

Desviación
Estándar 

Coeficiente de
Variación

c) El Mini
Ministr
stroo ha señ
señala
alado
do que dado qu
quee el gob
gobier
ierno
no plan
plantea
tea el incr
increme
emento
nto del sal
salari
arioo de los
controladores aéreos en 4000 dólares al año, esto permitirá que los salarios sean más
homogéneos. Señale como afectaría este incremento a las medidas de dispersión (tanto
absolutas como relativas) de la variable en estudio.

3. De las mediciones biométricas efectuadas con cierto número de estudiantes se han extraído los
siguientes datos:
Los varones de 17 años tienen un peso medio de 60.8 kg. con una desviación estándar de 6.69 kg.
Los varones de 10 años tienen un peso medio de 30.5 kg y una desviación estándar de 5.37 kg
A partir de los datos anteriores se puede afirmar que el peso es más variable a los 10 años que a los
17 años. Rpta. Efectivamente el peso es más variable a los 10 años.
4. Se tiene la siguiente información sobre una distribución de frecuencias de los pesos en kg de 50
elementos de un determinado material. La amplitud de los intervalos de clase es igual a 20:

[Li-1 - Li> xi f i Fi xif i


850
1710
27 2730
9
- 260 1500
50
Complete la tabla y calcule la varianza de los pesos.

5.Cierta fábrica tiene un departamento de producción y otro de ventas. Las tablas que se muestran a
continuación muestran los salarios percibidos hasta fines de mayo de este año (expresado en miles de
soles):
50

Dpto. producción Dpto. ventas


 Nº  Nº
Intervalos Intervalos
trabajadores trabajadores
1 – 1.5 12 6-8 4
1.5 – 2 28 8 – 10 6
2 – 2.5 32 10 – 12 12
23.5– –3.35 2142 1124 –– 1146 135

a. Halla
Hallarr la
la ddesvia
esviación
ción típica corre
correspon
spondiente
diente a ca
cada
da ddeparta
epartamento
mento..

 b. Determinar cuál de los departamentos presenta mayor dispersión relativa.

6. Dos países son igual de ricos, porque tienen la misma renta per cápita (o renta media), de 8.000
dólares al año. Pero en el país A la desviación típica es de 1.000 dólares y en el país B es de 4.000
dólares. ¿Qué podemos decir sobre la distribución de la riqueza de ambos países gracias a este dato?

7. Determinar la varianza del conjunto de observaciones x 1, x2, x3, x4, x5, a los cuales se les ha restado
4, obteniéndose el siguiente conjunto: 3, 0, 2, 4, 1.

8.La empresa Atención SAC, se preocupa por brindar un servicio adecuado a sus clientes y brinda
especial interés a los reclamos que presentan sus clientes, así como el tiempo que les toma atender 
dichos reclamos. El servicio de atención a los clientes se brinda en dos turnos, mañana y tarde, por 
dos grupos distintos de analistas. El jefe de calidad ha considerado importante analizar los resultados
de la atención en cada uno de estos turnos, a fin de determinar si existe variación, por lo que obtuvo
información del tiempo que demoró la atención a los clientes:

Turno Mañana
12 12 13 13 14 14 14 14 14 15
15 16 16 16 18 18 18 19 19 19
20 20 20 20 20 21 22 22 22 23
23 23 24 24 24 24 24 24 24 24

Turno Tarde
8 8 9 9 10 10 10 10 10 12
12 13 13 13 15 15 15 16 16 16
17 17 17 17 17 18 19 19 19 20
20 20 21 21 21 24 24 25 26 26

a) ¿En qué rango se encuentra el tiempo de atención a los clientes en cada turno?
 b) Calcule la varianza en los turnos mañana y tarde.

 
51

ASIMETRÍA Y CURTOSIS

ASIMETRÍA

Índice de Asimetría de Pearson

Si:

As < 0 Distribución Asimetría negativa


  As = 0 Distribución Simétrica
  As > 0 Distribución Asimetría positiva

b) Medida de Yule Bowley o Medida Cuarlica

La medida de Bowley varía entre -1 y 1

Si:
As < 0 Distribución Asimetría negava
As = 0 Distribución Simétrica
As > 0 Distribución Asimetría posiva

c) Medida de Fisher
Datos sin agrupar:
52

Cálculo en el SPSS:

CURTOSIS
 
K<0 Platicurtica
  K = 0 Mesocurtica
  K>0 Leptocurtica

Cálculo en SPSS

EJERCICIOS PROPUESTOS

2.La Di
Dire
recc
cció
iónn Ge
Gene
nera
rall de ES
ESSA
SALU
LUD
D es
está
tá inte
intere
resa
sada
da en
estudiar los casos de varicela en los niños. Para ello selecciona
una muestra aleatoria de niños que acaban de salir del proceso
de la enfermedad (grupo I) del distrito de Miraflores y otro
grupo de niños (grupo II) del distrito de Breña. Se registró la
edad en que se presentó la mencionada enfermedad en ambos
grupos de niños. Los datos se muestran a continuación:

Grupo I 1 2 4 1 1=2 = 1.5


Grupo II 2 7 7 8 = 5.5
2=6
53

Calcule los índices de asimetría y curtosis para cada grupo de niños.

2.Los siguientes datos corresponden a la cantidad de goles


realizados por el Club Alianza Lima en el último torneo de fútbol

2 5 3 4 1 2 0 3 4 2
Determine el coeficiente de asimetría y curtosis. Realice la gráfica
respectiva.

3.Se evalúo a una sección de estudiantes que llevaron el curso de Estadística en el Ciclo Verano de
una universidad peruana. Determine la asimetría y curtosis que presentan los siguientes datos.
Notas fi
0–5 3
5 – 10 5
10 – 15 12
15 – 20 10
Total

4.Los siguientes
trabajadoras datosfemenino
del sexo corresponden al número
del Centro de hijos
de Salud “El de las
Olivar”
Número de
Número de hijos
trabajadoras
0 13
1 20
2 25
3 20
4 11

Analiza la forma de la distribución calculando los coeficientes adecuados.

5. Se evaluó a un grupo de estudiantes de la carrera de


Estomatología para establecer la cantidad de piezas dentales que
extraen por día.

2 1 3 3 4 5 7 2
Determine el tipo de distribución que presentan los datos.

6.Un grupo de jóvenes de la Facultad de Ingeniería han sido encuestados en relación a su estatura.
Los datos se han procesado mediante el IBM SPSS. Los resultados se muestran en la tabla adjunta.
Calcule los coeficientes de asimetría de Pearson e indique si la distribució n de estaturas es
simétrica o asimétrica.
ESTATURA DEL ENCUESTADO

Nº Validos 50
Perdidos 0
Media 1.633
54

Mediana 1.64
Moda 1.64
Desv. Tip. 0.627
Varianza 0.004

7.Una muestra de digitadoras de textos reveló que su rapidez media


de tecleo es de 87 palabras por minuto, con una mediana de 73
 palabras. La desviación estándar
estándar es de 16,9 palab
palabras
ras por minuto.
¿Cuál es el coeficiente de asimetría? Interprete la respuesta, luego
conteste: ¿La mayoría de las secretarias son rápidas tecleando o son
lentas?

8. Dadas las siguientes mediciones de la emisión diaria (en toneladas) de óxido de azufre en una
 planta industrial: Construya
Construya una distribución de frecuencias
frecuencias y luego calcule los coeficientes de
asimetría y curtosis:

8.3 15.8 16.2 18.5 22.7 23


11 13.4 17.3 19.1 22.7 23.9
11.2 15.1 17.9 19.6 22.3 24.6
12.2 15.8 18 20.1 21.9 26.4
12.3 13.4 18.4 20.5 21.3 26.8
55

PROBABILIDADES
DISTRIBUCIONES:
BINOMIAL, POISSON,
NORMAL, MUESTRAL.
56

PROBABILIDADES
Conceptos básicos:

Probabilidad: Es la medida numérica de la posibilidad de que un evento pueda ocurrir.


Su valor está entre 0 y 1.

Experimento aleatorio: Es un proceso cuyo resultado no puede ser predicho de anterioridad con
seguridad.
Ejemplo:
a) lanzamiento de una moneda
 b) lanzamiento de un dado

Evento o suceso: Es cualquier subconjunto de un espacio muestral.

Ejemplo:
a) A = {obtener un número impar al lanzar un dado}
A = {1, 3, 5}

Espacio muestral: Es el conjunto de todos los posibles resultados asociados a un experimento. Su


símbolo es Ω.
Ejemplo:
a) Experimento: lanzamiento de un dado
Ω = {1, 2, 3, 4, 5, 6}

Notación de probabilidades:
P: denota una probabilidad.
A, B, y C. denotan eventos específicos.
P(A): denota la probabilidad de que ocurra el evento A.

Probabilidad de un evento
La probabilidad del evento A es el cociente entre el número de resultados favorable a la ocurrencia
del evento A y el número de resultados posibles.

Características
Sea un espacio muestral y sean A y B dos eventos cualesquiera de este:
 P(Ω) = 1 P(Փ ) = 0
 0 ≤ P(A) ≤ 1
 Si A y B son eveneventos
tos no disjuntos de Ω, se cumple que: P(A ∪ B) = P(A) + P(B) -
P(A∩B)
 Si A y B son eveneventos
tos disjuntos de Ω, se cumple que: P(A ∪ B) = P(A) + P(B)
57

Ejercicios de probabilidades
1.- En una compañía hay 6 varones y 4 damas que aspiran a ser 
miembros de un comité. Si se debe escoger dos al azar. ¿Cuál es la
 probabilidad de que:
a) Los dos sean hombres
 b) Sean un hombre y una mujer o dos mujere
mujeres.
s.
Solución:
a) Sea el ev
event
entoo A = {{Los
Los dos sean
sean ho
hombr
mbres}
es}
  6  

 

 P (  A)   
  2  
1
 10  3

 

  2  

 b) Sean los eventos:

B = {Sean un hombre y una mujer} C = {Sean dos mujeres} luego hallaremos:

 6   4    4 


 
      
1 1    2  24  6
 C  )        
2
 P (  B  C  )   P (  B )   P (
  C  )   P (   B  

 
 10  

 45 3
  2  

2.- Un lote contiene 100 artículos de los cuales 20 son defectuosos.


Se inspecciona del siguiente modo. Se sacan 5 artículos del lote: si
los 5 son buenos se acepta el lote; en otro caso se rechaza. ¿Cuál es
la probabilidad de rechazar el lote?

Solución: Sea X: Nº de artículos defectuosos en la muestra de tamaño 5

P(Rechazar el lote) = P ( X = 1 ) + P ( X = 2 ) + P ( X = 3 ) + P ( X = 4 ) + P ( X = 5 )

  = 1 – P ( X = 0 ) = 1 – P ( Aceptar el lote )
 80 
5
en donde  P ( Aceptar )       0.32       P ( Re chazar )  1  0.32  0.68
 100 
 
 5  

3.- Un recién grad


graduado
uado solic
solicita
ita empleo en la compañía A y en la B.
Se estima que la probabilidad de ser contratado por A es 0.7 y de ser 
contratado por B es 0.5. En tanto que la probabilidad de que se
rechace por lo menos una de sus solicitudes es de 0.6. ¿Cuál es la
 probabilidad de ser contratado
contratado al menos por una ddee las compañías?
Solución Sean los eventos:
 A  { El  recien  grad uad o  sea contratado  por  la compañía  A}   P ( A )  0.7
 B  { El  recien  grad uad o  sea contratado  po r  la comañía  B }   P ( B )  0.5
 por 
 A'   B '  {Sea rechazado en al  menos una de las compañías}   P ( A'   B ' )  0.6
laremos  P ( A   B )   P ( Sea contratado en al  menos una de las compañias)
 Hallaremos
 Hal

 P ( A   B )   P ( A )   P ( B )   P ( A   B )


 Por  otro lado  P ( A' B ' )   P ( A   B )'
 1   P ( A   B )  0.6   P ( A   B )  0.4
 Lue go  P ( A   B )  0.7  0.5  0.4  0.8
 Luego
58

4.- Suponga que en un sorteo la probabilidad de ganar el primer 


 premio es 2/5 y la de ganar el segundo premio es 3/8. Si la
 probabilidad de ganar al menos uno de los dos premios es 3/4.
Calcular la probabilidad de ganar:
a) Sólo uno de los dos premios

 b) Ninguno de los dos


dos premios
Solución Sean los eventos:
2
 A   Ganar  el   primer   premio    P ( A ) 
5
3
 B   Ganar  el   segundo  premio    P ( B ) 
8
 A   B   Ganar  al  menos uno de los dos  premio    P ( A   B )  3 / 4
 P ( A   B )   P ( A )   P ( B )   P ( A   B )
3/ 4  2 / 5  3 / 8   P ( A   B )   P ( A   B )  1 / 40

15  1 14
40 40 40

15  14 29
 Luego
 Lu ego  P ( A  B '   B  A' )      0.72
7255
40 40

1.  P (  A'   B' )   P ( A   B  )'  1   P (   A  B )  1  3 / 4  1 / 4  0.25

5.- Un banco de sangre dispone de 10 unidades de sangre tipo A.


De ell
ellas
as cua
cuatro
tro están
están con
contam
tamina
inadas
das con sue
suero
ro de hep
hepatit
atitis.
is. Se
selecciona
selec cionann aleato
aleatoriame
riamente
nte 3 de estas unidade
unidadess para utilizarla
utilizarlass con
tres pacientes diferentes.
a) ¿Cuál es la probabilidad de que los tres pacientes estén expuestos
a contraer hepatitis por esta razón?
 b) ¿Qué al menos dos de ellos no estén expuestos a contraer 
hepatitis?
Solución:
a) P ( X = 3 ) en donde X: Nº de pacien
pacientes
tes expue
expuestos
stos a contr
contraer
aer hepat
hepatitis
itis
59

 4 
 
 

   P (  X    3 ) 
 3
   
 10 

 


4
120
 0.033

 3  

b)  P  (  X     2 )   P    X     2 )    P  (   X     3 )   X    :  N  º de   pacientes no exp uestos a contraer 

  6     4   6 

  
  
 
 

  2   1   60  3   20
 P  (   X     2 )    P  (   X     3 )  
 10  120  10  120

 
 
 

 3    3  

60  20
 Luego  P  (   X     2 )   0.667
120

PROBABILIDAD CONDICIONAL
Se trata de dos eventos A y B definidos en un mismo espacio muestral, en donde uno de ellos
(evento B) ya ocurrió, es decir se conoce su resultado.

 P( A  B )
 P( A / B ) 
 P( B )

Ejemplo 1.- Un Unaa cier


cierta
ta comp
compañ
añía
ía comp
compra
ra insu
insumo
moss de tr
tres
es
 proveedores A, B y C.
Proveedor A abastece con 40% de los insumos, de los cuales el 8%
son defectuosos.
Pro
rovvee
eeddor B abas
abaste
tece
ce con
con el 35%
35% de los
los cual
cuales
es el 9% son
defectuosos.
Prov
Provee
eedo
dorr C abas
abaste
tece
ce con
con el 25
25%
% de los
los cual
cuales
es el 10
10%
% so
sonn
defectuosos.
Si se elige un insumo al azar:
a)¿Cuál es la probabilidad de que este sea defectuoso?
 b) Si el insumo salió defectuoso.
defectuoso. ¿Cuál es la prob
probabilidad
abilidad de que haya sido adquirido
adquirido del proveedor
A?
Solución: Proveedor Calidad Total
Defectuoso No D
Deefectuoso
A 0.032 0.368 0.40
B 0.0315 0.3185 0.35
C 0.025 0.225 0.25
Total 0 .0 8 8 5 0.9115 1 .0 0

a) Según la tabla: P (Defec


(Defectuoso)
tuoso) = 00.0885
.0885
 P ( A   D ) 0.032
b)  P ( A /  D )       0.36
 P ( D ) 0.0885

OTRO MÉTODO: DIAGRAMA DEL ÁRBOL


60

D
  P(D/A) = 00.08
.08

A P(D’/A) = 0.92
  P(A) = 0.40

  D’
P(B)=0.35 P(D/B) = 0.09
B D
P(D’/B) = 0.91
P(C) = 0.25
D’
C P(D/C) = 0.10
D
  P(D’/C) = 0.9
 

D’

a) Ahora hallar
hallaremos
emos llaa proba
probabilid
bilidad
ad de ob
obtener
tener uunn artíc
artículo
ulo de
defectuo
fectuoso
so

 P ( D )   P ( A )  P ( D /  A )   P ( B )  P ( D /  B )   P (C  )  P ( D / C  )


 P ( D )  (0.40  x 0.08 )  ( 0.35  x 0.09 )  (0.25  x 0.10 )  0.0885

 b) Ahora hallaremos la probabilidad que un artículo sea proveniente del proveedor A, sabiendo
que el artículo seleccionado salió defectuoso.

 P ( A /  D )   P ( A   D )   P ( A )   P ( D /  A )  0.40 x 0.08  0.36


 P ( D )  P ( D ) 0.0885

Ejemplo 2.- Una cierta prueba médica tiene una efectividad de 99%
 para descubrir la presencia o no de una enfermedad (resultado
 positivo cuando realmente lo tiene o negativo cuando realmente no
lo tiene). Se aplica masivamente la prueba a una población en la cual
hay 1% de individuos con la enfermedad; se desea saber qué
 porcentaje de los individuos con resultados positivos tendrán
efectivamente la enfermedad.
Solución: Sean los eventos
61

 P   { Re  sulta
 sultado
do  sea  posiivo }

 E   { Person
 Personaa tenga la enfermedad }   P ( E )  0.01

Se  pide hallar   P 


  E  

  P  

Se sabe que :  P  


  P    0.99   P   E    P   
   P   E    P    0.99  x 0.01  0.0099

  E    P   E  

  P '   P  E  '   P '


 P    0.99  
   P  E  '   P '  0.99  x  0.99  0.9801
  E '   P  E  ' 

Tien
Tienee la
la eenf
nfer
erme
meda
dad:
d: E No tien
tienee la
la eenf
nfer
erme
meda
dad:
d: E’ Total
Resultado Positivo: P 0.0099 0.0099 0.0198
Resultado Negativo: P’ 0.0001 0.9801 0.9802
Total 0.01 0.99 1.000

 P 
  E     P  E    P    0.0099  0.5
 Luego   
  P    P  P   0.0198

MÉTODO DEL DIAGRAMA DEL ÁRBOL:

P
 P ( P/E ) = 0.99

  E P ( P’/E ) = 0.01
  P ( E ) = 0.01
  P’

  P
  P ( E’) = 0.99 P ( P/E’ ) = 0.01

  E’
P ( P’/E’) = 0.99
 
62

  P’

Ahora hallaremos la probabilidad que un resultado sea positivo, sabiendo que realmente tiene la
enfermedad.

 P ( E  /  P )   P  P 


( E (  P 
  P 
) )   P ( E 
   P 
)  P ( P 
( P ) /  E  )  0.01 x 0.99  0.50
0.0198

EVENTOS INDEPENDIENTES

Dos eventos A y B son independientes si la ocurrencia de uno no afecta la ocurrencia del otro

   P ( A   B )    P 
  ( A)   P ( B )

Ejempl
Ejemploo 1.- La proporción general de artículos defectuosos en un
 proceso continuo es 0.10. Cuál es la probabilidad de que elegidos
dos al azar:
a) Ninguno sea defectuoso
 b) Cuando menos uno
uno no tenga defectos

Solución Sean los eventos:


 A   El  artículo  A tenga defectos    P ( A )  0.10
 B   El  artículo  B tenga defectos    P ( B )  0.10
 A'   El  artículo  A no tenga defectos    P ( A' )  0.90
 B '   El  artículo  B no tenga   defectos    P ( B' )  0.90

a) Hallar
Hallaremos
emos la pr probab
obabilidad
ilidad que ningu
ninguno
no ssea
ea ddefectu
efectuoso
oso
 P ( A'   B ' )   P (  A' )  x  P ( B ' )  Por   ser  eventos independientes
 0.90  x 0.90  0.81
 b) Ahora hallaremos la probabilidad
probabilidad de que cuando menos
menos uno no tenga defec
defectos
tos
 P ( A'   B ' )   P ( A   B )'  1   P ( A   B )
 1  ( 0.10 )  x ( 0.10 )  1  0.01  0.99
OtroMétodo :
 Esto implica que  por  lo menos uno de los dos artículos no tenga defectos
  P ( A'   B )   P ( A   B ' )   P ( A'   B ' )
 ( 0.09 ) ( 0.10 )  ( 0.10  x 0.90 )  ( 0.90 ) ( 0.90 )  0.99
63

Ejemploo 2.- La probabilidad de que se alivie un resfriado con el


Ejempl
antibiótico A es de 0.7 y con el antibiótico B es de 0.8. Se tienen dos
 pacientes resfriados, uno toma el antibiótico A y el otro el B. ¿Cuál
es la probabilidad de que:
a) Ambos se curen
 b) Uno se cure y el otro no se cure
Solución Sean los eventos:
 A   El   paciente  A  se cure con el  antibiótico  A    P ( A )  0.70
 B   El   paciente  B  se cure con el  antibiótico  B    P ( B )  0.80
 A '   El   paciente  A no  se cure con el  antibiótico  A    P ( A' )  0.30
 B '   El   paciente  B no  se cure con el 
  antibiótico  B    P ( B ' )  0.20
a) Hallaremos la probabilidad de que ambos pacientes se curen
 P ( A   B )   P ( A )  x   P 
  ( B )  0.7 x 0.8  0.56
 b) Ahora hallaremos la probab
probabilidad
ilidad de que uno se cure y el otro
otro no se cure
 P ( A   B ' )   P ( A'   B )   P ( A )  x  P ( B' )   P ( A' )  x  P ( B )
    
( 0.7 x 0.2 ) ( 0.3  x 0.8 ) 0.14 0.24 0.38

EJERCICIOS PROPUESTOS

1.- En un grupo de alumnos de la especialidad de contabilidad se ha


determinado de que el 40 % tienen dificultades en el curso de
análisis matemático (M), 20% tienen dificultades en el curso de
estadística aplicada (E) y el 5% tienen dificultades en ambos cursos
(M
unoyalE).
azarDeseeste
pidegrupo de alumnos
contestar de contabilidad seleccionamos
las preguntas.
a)  Calcular la probabilidad de que tenga dificultad en el curso de
análisis matemático o estadística aplicada.
 b) Calcular la probabilidad de que el alumno tenga dificultad en el curso de estadística; dado que
tiene dificultad en el curso de análisis matemático.
c) Calcular la probabilidad de que el alumno de contabilidad no tenga dificultad en el curso de
análisis matemático ni en el curso de estadística aplicada.

2.- A conti
continuaci
nuación,
ón, se pres
presenta
enta una tabla en el cual se
Hábito de Rendimiento en
han clasificado a 100 alumnos según hábito de fumar y fumar  matemáticas Total
rendimiento en el curso de matemática:
Malo Bueno
De este grupo seleccionamos un estudiante al azar, se
 pide contestar las preguntas:
preguntas:
Si 25 5 30
arendimiento
) Calcular malo
la en
promatemáticas;
babilida
idad dedado
quede ten
tengafuma
que un
cigarrillos.  No 15 55 70
Total 40 60 100
64

 b) Calcular la probabilidad de que no fume cigarrillos si se sabe que tiene un buen rendimiento en
matemáticas.

3.- La UCSUR recientemente lanzó una campaña publicitaria para el


examen de admisión 2012, instalando cuatro anuncios panorámicos
en el panamericano norte. Se sabe por experiencia que la
 probabilidad de que el primer
primer anuncio sea visto por un
un conductor es
de 0.75. La probabilidad
 probabilidad de que
para el tercero es deel0.87
segundo seacuarto
y la del visto esesde
de0.82,
0.90.la
Suponiendo que el evento de que un conductor vea uno cualquiera
de los anuncios publicitarios es independiente de si ha visto o no los
demás. ¿Cuál es la probabilidad de que:
a) Los cuatro anuncios sean vistos por un conductor?
 b) El primero y el cuarto sean
sean vistos, sin que el segundo
segundo y el tercero sean no
notados?
tados?
c) Exactamente uno de los anuncios sea visto?
d) Ninguno de los anuncios sea visto?
e) El tercero y cuarto anuncios no sean vistos?

4.- Se estima que el 30% de los habitantes de EEUU son obesos y que el 3% sufre de diabetes.
El 2% son obesos y sufren de diabetes. Calcular la probabilidad de que una persona elegida al azar.
a) Sea obesa o sufra de diabetes? Rpta. 0.31
 b) Sea obesa pero no sufra de diabetes? Rpta 0.28

5.- De todos los pacientes con cáncer, el 52% son mujeres. El 40% de todos los pacientes sobrevive
al menos 5 años desde el momento del diagnóstico. No obstante, esta tasa de sobrevivencia es válida
solamente para el 35% de las mujeres. ¿Cuál es la probabilidad de que un paciente con cáncer 
seleccionado aleatoriamente sea mujer y sobreviva al menos 5 años? Rpta. 0.182

6.-  Un
Unaa em
empr
pres
esaa cons
constru
truct
ctor
oraa del
del prprog
ogra
rama
ma MI VI VIVI
VIEN
ENDADA
descubrió que sólo el 20% de todos los trabajos se terminaban a
tiempo
tiempo;; mie
mientr
ntras
as que el 30% suf sufrían
rían sob
sobrec
recost
ostos.
os. Ad
Ademá
emás,
s, los
sobrecostos se presentaban el 75% de las veces en las que se
terminaban el trabajo a tiempo. El propietario de la empresa desea
conocer la probabilidad de que un trabajo:
a) Tenga sobrecostos y se termine a tiempo Rpta. 0.15
 b) Tenga sobrecostos o se termine a tiempo. Rpta. 0.35
c) Se termine a tiempo, dado que no tiene sobrecostos. Rpta. 0.0714
7.- La distribución de los tipos de sangre en EEUU entre los individuos de raza blanca es
ap
apro
roxi
xima
mada
damen
mente
te la sigu
siguie
ient
nte:
e: A: 40
40%
% B = 11%
11% AB = 4% O = 45%
45%
Tras un accidente automovilístico, un individuo de raza blanca es conducido a una clínica de
emergencia. Se le hace un análisis de sangre para establecer el grupo al que pertenece. ¿Cuál es la
 probabilidad de que sea del tipo A o del B? Rpta. 0.51

8.- En un estudio sobre alcohólicos se informa que el 40% de los


mismos tiene padre alcohólico y que el 6% tiene madre alcohólica.
El 42% tiene al menos uno de los padres alcohólicos. ¿Cuál es la
 probabilidad de que elegido uno al azar:
a) Tenga ambos padres alcohólicos. Rpta. 0.04 
 b) Tenga un padre alcohólico,
alcohólico, pero no una madre alcohólica.

  Rpta.
c) Tenga 0.36
una madre alcohólica; si se sabe que el padre no lo es.
Rpta. 0.033
65

9.- De 1000 jóvenes de 18 años, 600 tienen empleo y 800 son bachilleres. De los 800 bachilleres,
500 tienen trabajo. ¿Cuál es la probabilidad de que un joven de 18 años tomado aleatoriamente sea:
a) Un bachiller empleado
 b) Empleado pero no bachiller
bachiller
c) Desempleado o un bachiller 
d) Desempleado o no bachiller 

10.-  El Sr. Conti,


 presentación. propietario
Observa de un
que el 25% restaurante,
de todos ha que
los autos mejorado la infraestructura
pasan por allí, se detienenpara
parauna buena
consumir 
algún alimento.
a) ¿Cuál es la probabilidad de que los próximos cuatro carros se detengan?
 b) ¿Cuál es la probabilidad de que el primer auto pare, que el segundo y tercero no lo hagan y el
cuarto pare?

11.- LLusol compra tres acciones diferentes. La probabilidad de que


la primera aumente su valor es 1/3, la probabilidad de que la
segunda aumente es de 3/4 y la probabilidad de que la tercera
aumente su valor es de 1/10. Determine la probabilidad de que:
a) Todas aumenten de valor
 b) Una aumente su valor
valor

12.-  Con base en su experiencia un médico ha recabado la siguiente información, relativa a


las enfermedades de sus pacientes: 5 % creen tener cáncer y lo tienen; 45 % creen tener 
cáncer y no lo tienen; 10 % no creen tener pero sí lo tienen; y finalmente 40 % creen no
tenerlo, lo cual es cierto. De entre los pacientes del doctor se seleccionó uno al azar 
a) Cuál es la probabilidad que el paciente tenga cáncer? Rpta. 0.15
 b) Cuál es la probabilidad
probabilidad de que el paciente tetenga cree no tenerlo? Rpta. 0.2
nga cáncer, si cree
13.- Se estima que el 15 % de la población adulta padece de
hipertensión, además se sabe que el 75% de todos los adultos creen
no tener este problema. Se estima también que el 6 % de la
 población tiene hipertensión, pero no es consciente de padecer dicha
enfermedad.
a) Si un paciente adulto cree que no tener hipertensión. ¿Cuál es la
enfermedad, de hecho exista? Rpta. 0.08
 probabilidad de que la enfermedad,
 b) Si la enfermedad existe. ¿Cuál es la probabilidad de que el
 paciente lo sospeche? Rpta. 0.60

14.- Sólo el 60% de los estudiantes de la clase de matemática del Profesor X pasaron la primera
 prueba. De quienes pasaron el 80% estudiaron
estudiaron,, el 20% de quienes no pasaron si estudiaron.
a) ¿Cuál es la probabilidad de que un estudiante pase o estudie?
 b) ¿Cuál es la probabilidad
probabilidad de que un estudiante pase
pase,, pero no estudie?

15.- El 5% de las unidades producidas en una fábrica se encuentran defectuosas cuando el proceso de
fabricación se encuentra bajo control. Si el proceso se encuentra fuera de control, se produce un 30%
de unidades defectuosas. La probabilidad marginal de que el proceso se encuentre bajo control es de
0.92. Si se escoge aleatoriamente una unidad y se encuentra que es defectuosa, ¿Cuál es la
 probabilidad de que el proceso
proceso se encuentre bajo con
control?
trol?

16.- Una planta armadora recibe microcircuitos provenientes de tres


distintos fabricantes B1, B2 y B3. El 50% del total se compra a B1,
mientras que a B2 y B3 se les compra un 25% a cada uno.
El porcentaje
porcentaje de circui
circuitos
tos defectu
defectuosos
osos para B1, B2 y B3 es 5, 10 y
12% respectivamente. Si un circuito está defectuoso, ¿cuál es la
 probabilidad de que haya sido vendido por el proveedor
proveedor B2?
66

17.- Se estima que la probabilidad de que una Cía. B tenga éxito al comercializar un producto es de
0.95 si su competidora la compañía A no interviene en el mercado; y es de 0.15 si la compañía A
interviene en el mercado. Si se estima que A intervendría en el mercado con probabilidad de 0.7
a) ¿Cuál es la probabilidad de que la compañía B tenga éxito? Rpta. 0.39
 b) Si la Cía. B no tuviera éxito ¿En cuánto se estima la probabilidad de que A intervenga en el
mercado? Rpta. 0.975 

18.- Contratistas S.A. está negociando dos contratos. La Gerencia piensa que la probabilidad de
ganar el primer contrato es de 60% y que el ganador tendrá ventaja definitiva en la negociación del
segundo contrato. La Gerencia cree que si Contratistas S.A gana el primer contrato va a tener un
70% de probabilidad de ganar el segundo contrato, en caso contrario disminuirá a 0.10.
a) ¿Cuál es la probabilidad de que Contratistas S.A. pierda ambos contratos? Rpta. 0.36
 b) ¿Cuál es la probabilidad
probabilidad que gane el segundo con trato? Rpta. 0.46
contrato?

19.-
19.- Una Compañía tiene 1000 repuestos para cierto ensamblado.
El 20% de las partes son defectuosas; además el 40% se compraron a
 proveedores de fuera y el resto
resto fue fabricado por la misma compañía.
compañía.
De los comprados fuera de la compañía el 80% son buenos. Si se
elig
eligee un re
repu
pues
esto
to al azar
azar entr
entree es
esta
ta exis
existe
tenc
ncia
ia.. ¿Cuá
¿Cuáll es la
 probabilidad de que:
a) Sea fabricado por la Compañía y esté buena. Rpta. 0.48
 b) Seasea
c) No defectuosa
fabricadao por
comprada
comprada . Rpta.ni0.52
la Compañía sea  buena. Rpta. 0.08
d) Sea comprada, siendo defectuosa. Rpta. 0.4

20.- En un cajón hay 80 artículos buenos y 20 malos; en un segundo


cajón el 30% son malos y en un tercer cajón el 25% son malos. Se
sabe que el número de artículos del tercer cajón es el triple de los que
hay en el segundo y que en total hay 260 artículos. Se mezclan los
artículos de las cajas.
a) Si se extrae al azar un artículo. Calcule la probabilidad de que sea
malo si se sabe que pertenece al 2ª cajón. Rpta. 0.3
 b) Si se extraen al azar dos artículos. Calcule la probabilidad de que
el primero y el segundo sean malos. Rpta. 0.056

21.- Se ha determinado que el porcentaje de televidentes que ven los programas A, B y C son
respectivamente 0.4. 0.5 y 0.3. Cada televidente ve los programas independientemente uno del otro.
Si se elige al azar a uno de tales televidentes. ¿Qué probabilidad hay de que vea:
a) Dos de los tres programas. Rpta. 0.29
 b) Al menos uno de los tres programas. Rpta. 0.79

22.- En cierta región la probabilidad de que llueva en cualquier día del año es 0.1. Suponiendo la
independencia de un día con otro. ¿Cuál es la probabilidad de que la primera lluvia ocurra después
de 14 días sin lluvia? Rpta. 0.023

23.-El
.-El gere
gerennte de INGINGENIER IEROS ME METATAC C S.A.C
.A.C., ., es una
una
orga
organi
niza
zaci
ción
ón orie
orient
ntad
adaa a sumisumini
nist
stra
rarr prod
producucto
tos,
s, serv
servici
icios
os y
desarrollo de soluciones de ingeniería aplicada, considera que la
 probabilidad de que los accidentes en Transmisiones & Ejes hayan
sido ocasionados por las conexiones eléctricas es 0,24, por falla
mecánica es 0,18 y por conexiones eléctricas o falla mecánica es
0,39
,39. Si se selecelecci
cion
onaa al azaazar un acciacciddente
ente pr prooduc
ducido
ido en
Transmisiones & Ejes y definiendo los eventos de interés:
E = {Acci
{Acciden
dentes
tes ppor
or co
conex
nexion
iones
es eléct
eléctric
ricas}
as},, M = {A {Acci
cciden
dentes
tes ppor
or ffall
allaa mec
mecáni
ánica}
ca}
67

P ( E ) = 0,
0,24
24 y P ( M ) = 0, 0,18
18    P ( E  M ) = 0,39
a) Determine la probabilidad que se haya producido por ambos tipos de falla.
 b) ¿Cuál es la probabilidad
probabilidad de que el accidente se haya producido
producido por solo un tipo de falla?
24.-Después de una política de mejora de la calidad de la producción de Chemi-latex, tanto en el
área de llenado como el de sellado, los trabajadores fueron sensibilizados para realizar sus labores de
 producción de la mejor manera y así disminuir los productos defectuosos en la producción. Para
corroborar
corroborarlo
lo se toma una muest
muestra
ra de 80 produ
productos,
ctos, encontr
encontrándo
ándose
se que 25 presentan defec
defectos
tos en el
llenado, 32 presentan defectos en el sellado y 30 no presentaban defectos. Si se selecciona un
 producto al azar.
a) Determine la probabilidad de que se hayan producido ambos tipos de defectos.
 b) ¿Cuál es la probabilidad
probabilidad de que se haya produ
producido
cido solo uno de los tipos de defectos?
c) ¿Los eventos defecto en el sellado y defecto en llenado son mutuamente excluyentes? Explique.
25.-Una caja contiene 24 resistencias con etiqueta negra y 24 con
etiqueta roja; de los de etiqueta negra cinco son de 5 ohmios y el
resto de 8 ohmios; mientras que los de etiqueta roja doce son de 5
ohmios y el resto de 8 ohmios:
a)Si se selecciona una resistencia al azar de la caja, ¿cuál es la
 probabilidad que la resistencia
resistencia sea de 8 ohmios?
 b) Si se seleccionan al azar dos resistencias de la caja, ¿cuál es la probabilidad que las dos sean de
igual color.
c)Si se seleccionan al azar tres resistencias de la caja, ¿cuál es la probabilidad que dos sean de 5
ohmios y una de 8 ohmios?
26. En un estudio de 420 000 usuarios de teléfono celular de
Movistar, se encontró que 135 desarrollaron cáncer cerebral o del
sistema nervioso. Estime la probabilidad de que un usuario de
teléfono celular que se seleccionó al azar desarrolle un cáncer de
este tipo. ¿Qué sugiere el resultado acerca de los teléfonos celulares
como causantes de cáncer de este tipo?
27. En la fabricación de un cierto
ciert o tipo de clavos, aparecen un cierto nº de ellos defectuosos. Se han
estudiado 200 lotes de 500 clavos cada uno obteniendo: 

Clavos deectuosos   1 2 3 4 5 6 7 8

Nº de lotes   5 15 38 42
42 49 32 17 2

Se selecciona al azar un lote, determine las siguientes probabilidades:


a) ¿Cuál es la probabilidad de se encuentre 7 clavos defectuosos?
 b) ¿Cuál es la probabilidad
probabilidad de encontrar al menos 3 clavos
clavos defectuosos?
c) ¿Cuál es la probabilidad de encontrar a lo más 5 clavos defectuosos?
d) ¿Cuál es la probabilidad de encontrar menos de tres clavos y más de 7 clavos defectuosos?

28.-Un profesor de Estadística sabe que el 80% de sus estudiantes


terminan los problemas asignados como tarea.
t area. Determinó, además,
que de los estudiantes que cumplen con la tarea, el 90% aprobará el
curso. De aquellos estudiantes que no terminan su tarea, el 60%
aprobará. Si un alumno recibió una calificación aprobatoria, ¿Cuál
es la probabilidad de que sí haya hecho sus tareas?
68

29.-Suponga que la empresa TEC adquiere sus productos de tres proveedores: A, B y C. El


 proveedor A suministra
suministra el 60% de sus pproductos,
roductos, el proveedor B elel 30% y el proveedor C eell 10%. La
calidad de sus productos varía entre los proveedores, siendo las tasas defectuosas del proveedor A
0,25%, del proveedor B 1% y del proveedor C 2%. Se selecciona un producto al azar:
a) ¿Cuál es la probabilidad de que el producto sea defectuoso?
 b) Cuando se encuentre
encuentre un producto defectuoso
defectuoso.. ¿Cuál será el proveedor más
más probable?

30.- Los registros de los delitos en la Comisaría de Cusco muestran


que el 10% de ellos son violentos y el 90% son no violentos. Se
señala también que son denunciados, el 90% de los delitos violentos
y solo el 70% de los delitos no violentos.
a) ¿Cuál es la proporción global de delitos que se denuncian?
 b) Si no se denuncia
denuncia un delito ante la policía, ¿Cuál es la
 probabilidad de que el delito
delito sea no violento?

31.-La empresa “Sazón Romelia” distribuye sus productos a cuatro


mayoristas. El porcentaje de producción total que se obtiene en cada
mayorista es del 20%, 50%, 10% y 20% respectivamente, y además
el porcentaje de envasado incorrecto en cada mayorista es del 2%,
1%, 7% yprincipal.
almacén 4%. Tomamos un producto de la empresa al azar en
a) ¿Cuál es la probabilidad de que se encuentre defectuosamente envasado?
 b) ¿Cuál es la probabilidad
probabilidad de que se encuentre buen
bueno?
o?

32. -En un laboratorio hay tres jaulas. En la jaula I hay 4 conejos negros y 2 blancos, la jaula II tiene
4 conejos negros y 4 blancos y la jaula III contiene 5 conejos negros y 6 blancos. Se selecciona al
azar una de las jaulas y se saca un conejo al azar de esa jaula. ¿Cuál es la probabilidad que el conejo
escogido sea blanco?

33.-El 70% del ganado es inyectado con una vacuna para combatir 
una enfermedad grave. La probabilidad de recuperarse de la
enfermedad es 1 en 20 si no ha habido tratamiento y de 1 en 5 si
hubo tratamiento.
 probabilidad Si haya
de que un animal infectado
recibido se recupera,
la vacuna ¿Cuál es la
preventiva?

34.-Una unidad de producción de enlatados de atún marca “Campomar” produce 9000 envases
diarios. La máquina A produce 3000 de estos envases, de los cuales 2% son defectuosos y la
maquina B produce el resto, se sabe que de la maquina B, el 4% son defectuosos. Calcular:
a) La probabilidad de que un envase elegido al azar este defectuoso.
 b) La probabilidad de que
que proceda de la maquina B, ssii el envase tiene defectos.
c) La probabilidad de que proceda de la maquina A, si el envase tiene defectos.

35.- De 400 estudiantes de Ciencias de la Empresa, 100 cursan


Finanzas y 80 cursan Economía. Estas cifras incluyen 30 estudiantes
que cursan ambas materias.
a) ¿Cuál es la probabilidad de que un estudiante elegido
aleatoriamente curse Finanzas
Finanzas o Economía? b) ¿Qué probab
probabilidad
ilidad
hay de que al elegir un estudiante al azar curse Economía, dado que
cursa Finanzas?
69

DISTRIBUCIÓN DISCRETA

DISTRIBUCIÓN BINOMIAL
Una distribución de probabilidad binomial resulta de un procedimiento que cumple con todos los
siguientes requisitos:
1. El procedimiento tiene un número fijo de ensayos.
2. Los ensayos deben ser independientes. (El resultado de cualquier ensayo individual no afecta las
 probabilidades de los demás
demás ensayos).
3. Todos los resultados de cada ensayo deben estar clasificados en dos categorías (generalmente
llamadas éxito y fracaso).
4. La probabilidad de un éxito permanece igual en todos los ensayos.
   n    x n  x
 P ( X  x)     p q    x  0,1, 2, 3,................., , n
  x 

 n  n!
Donde :   
  x   x !(n  x)!

n: es el número de veces que se repite el experimento o el tamaño de muestra


x: es
 p: es el
la número de éxitos
probabilidad éxque
ito se desea obtener en n
de éxito
q: es la probabilidad de fracaso.
70

Ejemplo 1.- Un fabricante envía sus productos en lotes de 20


unidades a sus clientes. El fabricante sabe que la probabilidad de que
cualquier artículo esté defectuoso es de 0.05.
Calcular la probabilidad de que determinado lote:
a) No contenga artículos defectuosos
 b) ¿Cuál es el número de artículos defectuosos qque
ue se espera
encontrar en un lote?
Solución:
a) Hallaremos P (X = 0) en donde X: Nº de artículos defectuosos en un lote

 20  
 P ( X   0)    (0.05) 0 (0.95) 20  0.36
 0  

La probabilidad que no contenga artículos defectuosos es 36%

 b) Ahora hallaremos el el Nº promedio de artículos defectuosos por lote


 E ( X  )  n  p
 E ( X  )  20 ( 0 .05 )  1
El número de artículos defectuosos por lote es 1.

Ejemplo 2.- El 20% de todas las mujeres que reciben a un vendedor 


de aspiradoras en sus hogares terminan por comprar una. ¿Cuál es la
 probabilidad de que entre 6 mujeres que
que admiten la demostración del
vendedor en sus casas:
a) Exactamente dos compren una aspiradora
b) Al menos una acabe por comprar la aspiradora
c) A lo más una no compre una aspiradora

Solución:
a) Exactamente dos compren una aspiradora
luego hallaremos
hallaremos P(X
P(X=2)
=2) en donde X: NúNúmero
mero de mujeres que compran aspiradoras.  
aspiradoras.
 6   2 4
 P ( X   2 )   2  (0.2) (0.8)  0.24576
   

Interpretación: Aproximadamente el 25% de las veces que 6 mujeres admitan al vendedor hacer 


demostraciones en sus casas; 2 de ellas terminarán comprando una aspiradora.

 b) Al menos una acabe


acabe por comprar la aspiradora
 P ( X   1 )   P ( X   1 )   P ( X   2 )   P ( X   3 )   P ( X   4 )   P ( X   5 )   P ( X   6 )
luego  P ( X   1 )  1   P ( X   0 ) en donde  X  :  N º de mujeres qu e compran
 6 
 P ( X   0 )  
 0  ( 0.2) ( 0.8)  0.26214
0 6

   
 Po r  lo tan to  P ( X   1 )  1  0.26214  0 .73 8

Interpretación: El 74 % de las veces que 6 mujeres admitan al vendedor hacer demostraciones en


sus casas; al menos una de ellas acabará comprando una aspiradora.
c) Ahora hallaremos la probabilidad que a lo más una no compre
71

 P ( X    1 )   P ( X    0 )   P (  X    1 )  X   :  N  º de amas de casa que no compran la aspiradora
 6 
 0
 P ( X    0 )   0
 ( 0.8 ) ( 0.2 )
6
 0.000064
   
 6 
 
 P ( X    1 )    ( 0.8 ) 1 ( 0.2 ) 5  0.001536
 1  
 Luego  P  (  X    1 )  0.0016

Ej
Ejem
emplploo y3.-
hombres - Enmujeres;
3.20% unaa em
un emprpres
esaa aptos
están dond
do ndepara
e los
losjubilarse
em
empl
plea
eado
dos
el s10%
so
sonnde80
80%
%
las
mujeres y el 15% de los hombres. De 5 solicitudes para jubilarse
¿Cuál es la probabilidad de que al menos dos estén aptos para
 jubilarse?
Solución:
Sea X : N º de e
Sea emp
mple
lead
ados
os apto
aptoss pa
para
ra ju
jubi
bila
lars
rse
e

 P( X  2 )  1   P( X  0)  P( X   1)
5
 P( X  0)    ( p) (q) en donde p : probabilid
probabilidad
ad que una pers
persona
ona esté apto para jubila
jubilarse
rse
0 5

 0
luego p  0.15 (0.
(0.8)  0.1(0.2)  0.14
1(0.2)
5
 En con sec uenc
uencia
ia (0.86)  0.4704
P( X   0 )      ( 0.14 ) (0.
0 5

 0
 5
 P( X   1)    ( 0.14 ) ( 0.86 )  0.3829
1 4

1 
 Por lo tan to P( X   2 )  1  0.8533  0.1467

Interpretación: El 14.67% de las veces que 5 personas presentan sus solicitudes para jubilarse; por 
lo menos dos de ellas estarán aptos para jubilarse.

Ejemplo 4.- El jefe de la sección de recaudación de cierto municipio


observa que, de todas las multas de aparcamiento que se ponen, se
 pagan el 78%. La multa es de $2. En llaa semana mas reciente, se han
 puesto 620 multas.
a) Halle la media y la desviación estándar del número de multas que
se pagan.
 b) Halle la cantidad de dinero que se obtiene por el pago de estas
multas; así como también su desviación estándar.
Solución:

a) Sea X: Nº de multa
multass impue
impuestas
stas

E ( X ) = n p = 620 ( 0.78) = 483.6

La media es aproximadamente 484 multas las cuales serán pagadas


 
V ( X ) = n p q = 620 x 0.78 x 0.22 = 106.392 luego σ = 10.315 mul
multas
tas

 b) Recaudación por el pago de multas = 483.6 x 2 = 967.2 dólares

La desviación estándar
estándar será: 10.315 (2) = 20.63

Ej
Ejem
empl
ploo 5.
5.--  La pr
prob
obab
abil
ilid
idad
ad de cura
cura de un unaa enfe
enferm
rmed
edad
ad
normalmente mortal con cierto medicamente, se estima en 0.30. Si
72

cinco enfermos se tratan con este medicamento. ¿Cuál es la probabilidad de que al menos cuatro se
curen?

Solución:

a) Hallaremos P ( X ≥ 4 )
 n     x n x
en donde X: Nº de pacientes que se curan
 P   X    x     
   p q  x  0 , 1, 2, 3,.................................n
  x 

 P ( X   4 )   P ( X   4 )   P (  X   5 )

 5 
 P ( X   4 )  
  ( 0 .3 ) ( 0. 7 )  0. 02835
4 1

 4 

 5 
 P ( X   5 )  
 5  ( 0. 3 ) ( 0 .7 )  0. 00243
5 0

 

 Luego  0.02835   P ( X   4 )


 0.00243  0.03078
Interpret
Inte ación:: Aproximadamente el 3.1% de las   veces que cinco pacientes se traten con este
rpretación
medicamento, al menos cuatro se curarán

Ejemplo 6.-  Se somete a un estudiante a un examen del tipo


Ejemplo
verdadero – falso que contiene 10 preguntas; para que apruebe debe
responder correctamente a 8 preguntas o más. Si el estudiante está
adivinando. ¿Cuál es la probabilidad de que apruebe el examen?

Solución: Sea X: Nº de preguntas contestadas correctamente


 P (   X      8)   P (   X      8)   P (   X      9)   P (  X      10 )

 10 
 P (   X      8)  
8 
 (0.5)
8
( 0.5) 2  0.043945
   

 10 
 P (   X      9)  
 
 (0.5)
9
(0.5)1  0.009765
  9  

 10 
 P (   X      10)  
  (0.5)10 (0.5) 0
  0.000976
 10 

Por lo tanto P (X ≥ 8) = 0.0547

Interpretación: Si se le planteara 10 preguntas del tipo verdadero-falso y esto se repitiera varias


veces; en el 5.5% de estas veces el responderá al menos ocho preguntas correctamente.

DISTRIBUCIÓN DE POISSON

Una distribución de probabilidad Poisson resulta de un procedimiento que cumple con todos
t odos los
siguientes requisitos:

1. El experimento consiste en contar el número “x” de veces que ocurre un evento en particular
durante una unidad de tiempo dada, o en un área o volumen dado.

2. La probabilidad de que un evento ocurra en una unidad dada de tiempo, área o volumen es la
misma para todas las unidades.

3. El número de eventos que ocurren en una unidad de tiempo, área o volumen es independiente del
número de los que ocurren en otras unidades.
4. El número medio (o esperado) de eventos en cada unidad se denota por la letra griega µ (“mu” )
73

Estudia a los eventos independientes que suceden con muy poca frecuencia y que ocurren en un
determinado espacio, volumen o tiempo.

X= 0, 1, 2, 3.4 ……………….
Ejemplo 1.- El promedio de llamadas telefónicas en una hora es de
3. ¿Cuál es la probabilidad de recibir:
a) Exactamente 2 llamadas en una hora
 b) Dos o más llamadas
llamadas en 90 minutos
Solución:

a) Hallaremos P (X = 2)
X: Nº de llamadas en una hora µ=3

Según la distribución de Poisson

e 3 3 2
 Luego  P ( X   2 )   0.224
2!

Respuesta: La probabilidad de recibir exactamente 2 llamadas en una hora es 22.4%.

b) Enseguida hallaremos la probabilidad de que ocurran dos o más llamadas en 90 minutos

 X: Nº de llamadas en 90 minutos. µ = 4.5


  P ( X   2 )  1  { P ( X   0 )   P ( X   1 )}
e  4.5 ( 4.5 ) 0
 P ( X   0)   e  4.5
0!
e  4.5 ( 4.5 )1
 P ( X   1)   4.5e  4.5
1!
 Luego
 Lu ego  P ( X   2 )  1  5.5e  4.5  1  0.0611  0.9389

Respuesta: La probabilidad de recibir dos o más llamadas


l lamadas en 90 minutos es 93.89%.

Ejemplo 2.- Un Unaa fábr


fábric
icaa enví
envíaa al depó
depósi
sito
to 50
5000 arartí
tícu
culo
los.
s.
La probabilidad de deterioro de un artículo en el camino es de
0.002. Hallar la probabilidad de que en el camino se deterioren:
a) Menos de tres artículos.
 b) Por lo menos un artículo.

Solución:
74

a) Este es un p
proble
roblema
ma de tipo bbinom
inomial
ial pero da
dado
do que np ≤ 1 pu
puede
ede ser res
resuelto
uelto ttamb
ambién
ién
a través de Poisson; con el cual hallaremos un resultado bastante aproximado

En este caso µ = np = 500(0.002) = 1


 P ( X   3 )   P ( X   0 )   P ( X   1 )   P ( X   2 )

 0 )  e  1  e 1
1 0
 P ( X 
0!
e 111
 P ( X   1)   e 1
1!
1
e 112 e
 P ( X   2)  
2! 2
 Luego
 Lue go  P ( X   3 )  2.5 e 1  0.92

Respuesta: La probabilidad de que en el camino se deterioren menos de tres artículos es 92%.

b)  P ( X   1 )  1   P (  X    0 )   1  e 1  1  0.36788  0.63212

Respuesta: La probabilidad de que en el camino se deterioren por lo menos un artículo es 63.21%.


Ejemplo 3.- Un líquido contiene cierta bacteria con un promedio de
3 bacterias por centímetro cúbico. Calcular la probabilidad de que:
a) No contenga bacteria alguna una muestra de 1/3 de cc.
 b) Contenga por lo menos
menos una bacteria una mues
muestra
tra de 2 cc.

Solución:

a) Hallaremos P ( X = 0 ) X: Nº de bacterias en 1/3 de cc.

Según la Distribución de Poisson

Donde:
µ= Promedio
Promedio de bacterias en 1/3 de cc = 1

e   1 10
 Luego  P ( X   0)   
 e 1  0.368
0!
Respuesta: La probabilidad de que no contenga bacteria alguna una muestra de 1/3 de cc es 36.8%.
b )  P  (  X   1 )  1   P  (  X   0 )
 X  :  N º de bacterias en una muestra de 2 cc
µ = Promedio de bacte
 bacterias
rias en 2 de cc   = 6 
e  6 60
 P ( X   0)   e 6
0!

luego 1  e6  0.9975


75

Respuesta:: La probabilidad de que contenga por lo menos una bacteria una muestra de 2 cc es
Respuesta
99.75%.

Ejemplo 4.- Una vacuna produce inmunidad contra la polio en un


99.99%. Suponiendo que la vacuna ha sido administrada a 10,000
niños.
a) ¿C
¿Cuáuáll es el núm
úmer
eroo esp
esperad
eradoo de niños
iños que no han
han sididoo
inmunizados?
 b) ¿Cuál es la probabilidad
probabilidad que menos de 2 niños nnoo sean inmunes?
Solución:

a) Dado que np ≤ 1 usaremos la ap


aproximación
roximación de llaa Bino
Binomial
mial a la de P
Poisson
oisson en donde
µ = np

  En este caso µ = np = 10,000 (0.0001) = 1 niño

Interpretación: El  número promedio de niños que no queden inmunizados contra la polio en un
grupo de 10,
10, 000 niños vacunados es 1.
b )  P ( X   2 )   P ( X   0 )   P ( X   1 )

e 1 10
 P ( X   0)   e 1
0!
e 111
 P ( X   1)   e 1
1!
 Lue go  P ( X   2)  2 e 1  0 .7358

Interpretación: Si se  aplicara esta vacuna a 10,000 niños varias veces, en el 73.58% de estas veces
menos de dos niños no quedarán inmunizados.
76

DISTRIBUCIÓN CONTINUA
DISTRIBUCIÓN NORMAL
Es una distribución de probabilidad que se diferencia de las anteriores por ser de variable aleatoria
continua. Es una de las más importantes
i mportantes ya que la mayoría de los
l os trabajos de investigación están
 basados en muestras aleatorias provenientes de po
poblaciones
blaciones que se distribuyen
distribuyen normalmente.

Características de la Distribución Normal

•Tiene forma de campana y posee una sola cima en el centro de la distribución. La media aritmética,
la mediana y la moda son iguales, y se localizan en el centro de la distribución.

•El área total bajo la curva es de 1.00. La mitad del


área bajo la curva normal se localiza a la derecha
de este punto central, y la otra mitad, a la izquierda.

•Es simétrica respecto de la media. Si hace un corte


vertical, por el valor central, a la curva normal,
las dos mitades son imágenes similares.

•Desciende suavemente en ambas direcciones del


valor central.
La curva Es decir,más
se aproxima la distribución
y más al ejeesX,asintótica.
sin
tocarlo. En otras palabras, las colas de la curva se
extienden indefinidamente en ambas direcciones.

•La localización de una distribución normal se determina a través de la media. La dispersión o


 propagación de la distribución
distribución se determina por medio de la desviación estándar

Esperanza y Varianza de una Distribución Normal

Esperanza de una Distribución Normal E(x) = µ

Varianza de una Distribución Normal Var(x) =    2

Para calcular probabilidades asociadas a partir de


la función de densidad se requiere de
matemáticas avanzadas; por lo que el cálculo de
estas, se hará en base a una tabla conocida como
Tabla de la Distribución Normal Estándar.

Estandarización
Si la variable aleatoria X tiene una distribución X∼ N(µ, ) , entonces la variable aleator
aleatoria
ia
  x   
 z  
 
Tiene distribución normal estándar.

Distribución
sus parámetrosNormal 0 y  2 : 1Una
son µ =Estándar . variable aleatoria X tiene una distribución normal estándar, si
77

Ejemplo1.-  Una máquina expendedora de refrescos se regula de


manera que descargue un promedio de 196 gr. por vaso. La cantidad
descargada tiene aproximadamente distribución normal con una
desviación estándar de 14 gramos.
a)¿Cuál es la probabilidad de obtener un vaso con más de 218.4
gramos?

Solución:
Consideremos a X: Cantidad descargada por la máquina vendedora de refrescos, la cual se distribuye
normalmente con µ = 196 gr y σ = 14 gr.
Hallaremos:
   218.4 )
 P ( X 

Estandarizando
Estandarizando la variable continua
 X     218.4  196
 Z     Z    1.6
  14

 P ( Z   1.6 )  0.0548

Interpretación: El 5.48% de los vasos tendrán una cantidad mayor de 218.4 gramos.
b) Si los vasos pueden contener solo 224 gramos sin que haya derrame. ¿En cuántos vasos de 200
vendidos es probable que el líquido se derrame?

Solución:
224  196
 P ( X   224 )   Z   2 luego  P ( Z   2)  0.0228
14
 E ( x)  np  200 ( 0.0228 )  4.56

Por lo tanto, el número de vasos que se derramarán aproximadamente será 5.

Ej
Ejem
empl
ploo 2.-
2.- La puntuación media en un examen final de una
asignatura fue de 72 y la varianza 81. El 10% superior de los
alumnos reciben
un estudiante debecalificación A. ¿Cuál
tener para recibir unaescalificación
la ficación
cali puntuación
A? mínima que

Solución:

 X      X   72
 Z    1.28      X   83.5
  9
Respuesta: La puntuación mínima que un estudiante debe tener para recibir una calificación A es
83.5.
Ejemplo 3.- Una variable aleatoria tiene una distribuc
distribución
ión normal con σ = 21.5. HHallar
allar su media si la
 probabilidad de que la variable
variable aleatoria tome un valor menor que
que 120.5 es de 0.8849
78

Solución:
Se  sabe que  P ( X   120
  .5)  0.8849

 X     120.5   
 Z    1.2         94.7
  21.5

Respuesta: La media tendrá que ser 94.7 para que la varia


variable
ble aleatori
aleatoriaa tome un valor menor que
120.5 con una probabilidad de 0.8849.

Ejemplo 4.- Suponga que las puntuaciones obtenidas en un examen


de un curso tienen distribución normal con µ = 80. Si el 95% de los
examinados obtienen puntajes entre 60.4 y 99.6

a) Calcule el valor de la desviación estándar 

 X     99.6  80
 Z    1.96         10
   

Respuesta: El valor de la desviación estándar será 10


b) ¿Qué porcentaje de los examinados
examinados obtuvieron entre 55 y 98 puntos

55  80 98  80
 Z 1    2. 5     Z 2   1.8
10 10
 P (2.5   Z   1.8 )  0.4938   0.4641  0.9579  95.79 %

Respuesta: El porcentaje de alumnos examinados que obtuvieron un puntaje entre 55 y 98 es 95.8%.

Ejemplo 5.- Los puntajes del coeficiente de inteligencia tomados a


un grup
grupoo de pers
person
onas
as adul
adultas
tas,, en un proc
proces
esoo de sesele
lecc
cció
iónn de
 personal están distribuidos normalmente con una media de 105 y
una desviación estándar de 12.
a) Si el puntaje mínimo para aprobar es 90. ¿Cuál es el porcentaje de
no aprobados?
79

 b) Si han aprobado el 80% de las personas


personas.. ¿Cuál es el puntaje mínimo aprobatorio?
aprobatorio?

Solución:
a) Consideremos a X: Puntaje del coeficiente ddee inteligencia, la cual se distribuye nor
normalmente
malmente
con µ = 105 y σ = 12

Hallaremos
 P ( X   90 ) es tan darizando el  valor  de  X  mediante la   fórmu la :

 X     90  1 05
 Z     Z     1.25
  12

 P ( Z   1.25 )  0.1056 o  sea 10.56%

Respuesta: El porcentaje de no aprobados es 10.56%.


 b) Ahora hallaremos el
el puntaje mínimo aprobatorio

80%

 X   105
 0.84      X   94.92 o  sea aproximadamente 95  punt
 puntos
os
12

Respuesta: El puntaje mínimo aprobatorio es aproximadamente 95 puntos.

Ejemplo
inferiores6.-
a 47Eny una
28%distribución
superiores anormal
70. hay 47 % de valores
Calcular la proporción de valores entre 57 y 86.

Solución
80

47    70   
 0.08  0.58 
   

   0.08    47    0.58    70

 Luego    0.08    47 (1)


  0.58   70 (2)
 
Re solviendo ecuaciones ( 1 )  y (2) obtenemos    49.79    34.85

57  49.79 86  49.79
 Ahora  Z 1   0.21    Z 2   1.04
34.85 34.85

 P ( 0 .21   Z   1.04 )   P  ( 0   Z 


   1 .04 )   P ( 0  Z   0.21 )
 0 .3508  0.0832  0.2676  26 .76 %

Respuesta:  La proporción de valores entre 57 y 86 es 26.76%.

EJERCICIOS PROPUESTOS

1.- Para estudiar la regulación hormonal de una línea metabólica se


inyectan ratas albinas con un fármaco que inhibe la síntesis de
 proteínas del organismo. En general 4 de cada 20 ratas mueren a
causa del fármaco antes de que el experimento haya concluido. Si se
trata a 10 animales con el fármaco. ¿Cuál es la probabilidad:
a) Que exactamente 3 no lleguen vivas al final del experimento.
Rpta. 0.2013
 b)Que al menos 8 lleguen
lleguen vivas al final del experimen
experimento.
to.
Rpta. 0.6778

2.- Se determina que un 25% de los niños expuestos a un determinado agente infeccioso contraerán
la enfermedad producida por dicho agente. Entre un grupo de 4 niños igualmente
i gualmente expuestos al agente
infeccioso. ¿Cuál es la probabilidad de que:
a) Exactamente 2 niños se enfermen. Rpta. 0.211
 b) Por lo menos un niño se enferme. Rpta. 0.684
3.- En cierto país en desarrollo el 30% de los niños están desnutridos; en una muestra aleatoria de 25
niños de esa área. ¿Cuál es la probabilidad de que el número de niños desnutridos sea:
81

a) Menos de cinco. Rpta.  0.0905


pero más de 4? Rpta. 0.2502
 b) Menos de 7 pero

4.- La probabilidad de que un paciente se recupere de una rara enfermedad sanguínea es 0.8. Si se
sabe que 15 personas contraen esta enfermedad. ¿Cuál es la probabilidad:
a) Que sobrevivan de 4 a 7.
 b) No sobrevivan exactamente 5.

5.-Se tiene información que en la comisaria de Chorrillos, el 25% de los detenidos se encuentran allí
 por delitos menores. Se selecciona una muestra aleatoria de 24. ¿Cuál es la probabilidad de que el
número de detenidos por delitos menores en esa muestra sea 10?

6.- Se sabe que en el comercial HND el 70% de los


establecimie
establecimientos
ntos comerciale
comercialess pequeños
pequeños no entreg
entregaban
aban bolet
boletaa al
momento de efectuar una transacción económica.
a) ¿Cuál es la probabilidad de que en una muestra de 16 negocios, a
lo más la mitad entregue boleta?
 b) ¿Cuál es la probabilidad
probabilidad de que en una muestra de 15 negocios,
la quinta parte no entregue boleta?

7.- La probabilidad de que una persona se muera por consumir 


 bebidas alcohólicas es 0.4. Después de un estudio realizado en la
zona de Bayovar se conoce que a la semana 30 personas consumen
 bebidas alcohólicas, cual es la probabilidad que:
a) Sobrevivan al menos 14 personas
 b) Sobrevivan exactamente
exactamente 5
c) Cuantos, en promedio, sobrevivirán
d) ¿Cuál es la varianza de la variable aleatoria en cuestión?

8.- La encargada de los préstamos del banco “INTERBANK” estima, con base en sus años de
experiencia, que la probabilidad de que un solicitante no sea capaz de pagar su préstamo es 0.035. El
mes pasado realizó 45 préstamos. ¿Cuál es la probabilidad de que 3 préstamos no sean pagados
oportunamente?

9.- En “MoneyGram” se evalúa el número de envíos de dinero al


extranjero que se realizó en un mes determinado. Suponga que 55%
de todas sus transacciones fueron envíos de dinero al extranjero y
considere una muestra de 10 transacciones. ¿Cuál es la probabilidad
de que:
a) Cuando mucho 8 de las transacciones sean envíos de dinero al
extranjero?
 b) Por lo menos 6 de las transacciones sean envíos de dinero al
extranjero?
c) Más de 6 de las transacciones sean envíos de dinero al extranjero?

10.- “CAJA RURAL APU” informó que el 30% de los préstamos garantizados con joyería
vencieron. Si se toma una muestra aleatoria de 10 préstamos
a)¿Cuál es la probabilidad de que ninguno esté vencido?
 b)¿Cuál es la probabilidad de que 2 estén vencidos?

11.-
11.- El 28%
28% de loslos torn
tornil
illo
loss de la úl
últi
tima
ma pr
prod
oduc
ucci
ción
ón para
para la em
empr
pres
esaa “M
“MAE
AEST
STRO
RO”” es
está
tánn
defectuosos. Determinar la probabilidad de que de 8 tornillos seleccionados aleatoriamente por lo
menos 3 estén defectuosos.
82

12.- Un prominente médico afirma que 70% de las personas con cáncer de pulmón son fumadores
empedernidos. Si su afirmación es correcta:
Encuentre la probabilidad que de 10 de tales pacientes admitidos recientemente en un hospital,
menos de 3 sean fumadores empedernidos.

13.-  Si la probabilidad de que un individuo sufra una reacción desfavorable por una inyección de
cierto suero es de 0.001. Determinar la probabilidad de que de 200 personas:
a) Exactamente
 b) su3fran
sufran
Dos o más sufran la reacción.
la reacción. Rpta.Rpta. 0.0011
0.0175

14.- El número promedio de Buses que llegan cada día al Terminal


Terrestre de Atocongo es 16. Las facilidades que tiene el Terminal
ha
hace
ce que
que pued
puedan
an lleg
llegar
ar hast
hastaa 22 buse
busess por
por día.
día. ¿Cuá
¿Cuáll es la
 probabilidad de que en un
un día dado, se tenga que rrechazar
echazar el ingreso
de buses al Terminal Terrestre de Atocongo?
Rpta. 0.05824

15.- En Caja Sullana se analiza la cantidad de clientes que se atiende en las ventanillas, se obtuvo
que la cantidad de clientes promedio que se atiende en esta institución financiera en un lapso de 50
minutos es de 20 clientes.
a) ¿Cuál es la probabilidad de que se atiendan a 10 clientes en 25 minutos?
 b) ¿Cuál es la probabilidad
probabilidad de que se atiendan a 7 clientes en 10 minutos?

16.- En una investigación realizada en la calle Miramar, se ha determinado que el número de muertes
debido a accidentes de tránsito ha sido en promedio 10 en dos meses. Suponiendo que el número de
muertes sigue una distribución de Poisson.
a) Hallar la probabilidad de que en un determinado mes mueran 3 personas.
 b) Hallar la probabilidad de
de que en un determinado mes nono mueran 4 personas
personas..

17. En la oficina de ventas de “PARALELO” se analiza el número


de ventas al día, se tiene la información que tiene un promedio de
9,5 ventas al día. Suponiendo que los pedidos siguen una
distribución de Poisson.
a) ¿Cuál es la probabilidad de que se realicen menos de 5 ventas en
un día determinado?
 b) ¿Cuál es la probabilidad
probabilidad de que se realicen al menos 3 ventas en
un día determinado?
c) ¿Cuál es la probabilidad de que se realicen al menos 12 ventas en
4 días?

18.-  De la población de valores de Z seleccionamos uno al azar, se


 pide:
I. Determinar las probabilidades siguientes:
a) P ( Z > 1.37 )
b) P ( Z < - 0.84 )
c) P ( Z ≥ - 2.05 )
d) P ( 1.64 < Z < 1.96 )
e) P ( - 0.84 < Z < 0.84 )
f) P ( -1.24 < Z < 1.63 )
g) P ( - 1 < Z < 2)

II. Calcular
a) P ( Zel> valor
zo ) =de0.025
Zo en las siguientes expresiones:
b) P ( Z < zo ) = 0.15
c) P ( Z ≥ zzoo ) = 0.85

83

d) P ( Z < zo ) = 0.10
e) P ( - zo < Z < zo ) = 0.8
f) P ( - zo < Z < zo ) = 0.98

19.-Una población normal tiene una media de 20 y una desviación estándar de 4


a) Calcule el valor de z asociado con 25
 b) ¿Qué proporción de la población se encuentra eentre
ntre 20 y 25?
c) ¿Qué proporción de la población es menor que 18?

20.-Una población normal tiene una media de 12.2 y una desviación estándar de 2.5.
a) Calcule el valor de z asociado con 14.3.
 b) ¿Qué proporción de la población se encuentra eentre
ntre 12.2 y 14.3?
c) ¿Qué proporción de la población es menor que 10?

21- Supóngase que se sabe que los pesos de 300 individu


individuos
os están distribu
distribuidos
idos en forma normal con
media de 68 Kg y una desviación estándar de 11.5 Kg.
a) Cuál es la probabilidad de qu
quee una persona seleccionad
seleccionadaa al azar pese 70 Kg o mmenos?
enos?
 b) Cuántas personas se es
espera
pera encontrar que pes
pesen
en 70 Kg o menos?
22.-En la empresa DURACELL, hicieron un análisis del tiempo de
duración de las pilas que desean vender. Una pila elegida al hacer 
dura en promedio
Asumiendo que la2.9
vidaaños, con
de las unaDURACELL
pilas desviación estándar de 0.5 años.
está normalmente
distribuida, encuentre la probabilidad de que una pila dada dure
menos de 2.3 años. 

23.-El precio medio de las acciones de las empresas que forman el


M&H es $30, y la desviación estándar es $8.20. Suponga que los precios de las acciones se
distribuyen normalmente.
a) ¿Cuál es la probabilidad de que las acciones de una empresa tengan un precio mínimo de $40?
 b) ¿Cuál es la probabilidad
probabilidad de que el precio de las acciones no supere $20?
c) ¿Qué tan alto debe ser el precio de las acciones de una firma para situarla en el 10% de las
 principales empresas?

24.-
24.-Un
Un es
estu
tudi
dioo reci
recien
ente
te con
con resp
respec
ecto
to a sala
salario
rioss por
por hora
hora de
integrantes
importantes de equiposquedeelmantenimiento
demostró de hora
salario medio por las aerolíneas más
era de $20.50,
con una desviación estándar de $3.50. Suponga que la distribución
de los salarios por hora es una distribución de probabilidad normal.
Si elige un integrante de un equipo al azar, ¿cuál es la probabilidad
de que gane:
a) Entre $20.50 y $24.00 la hora?
 b) Más de $24.00 la hora?
c)Menos de $19.00 la hora?

25.-Entre las ciudades de Estados Unidos con una población de más de 250 000 habitantes, la media
del tiempo de viaje de ida al trabajo es de 24.3 minutos. El tiempo de viaje más largo pertenece a la
ciudad de Nueva York, donde el tiempo medio es de 38.3 minutos. Suponga que la distribución de
los tiempos de viaje en la ciudad de Nueva York tiene una distribución de probabilidad normal y la
desviación estándar es de 7.5 minutos.
a) ¿Qué porcentaje de viajes en la ciudad de Nueva York consumen menos de 30 minutos?
 b) ¿Qué porcentaje de viajes
viajes consumen entre 30 y 3355 minutos?
c) ¿Qué porcentaje de viajes consumen entre 30 y 40 minutos?

84

26.- Las precipitaciones anuales en una región alcanzan, de media,


los
los 15
1500
00 mm
mm,, con
con una
una desv
desvia
iació
ciónn típ
típic
icaa de 200m
200mm.
m. Ca
Calc
lcul
ule,
e,
suponiendo que siguen una distribución normal, la probabilidad de
que en un año determinado la lluvia:
a. No supere los 1200 mm
 b. Supere los 1500 mm.
c. Esté entre 1700 y 2300 mm.
m m.
d.
de Deseamos seleccionar
qué cantidad de aguaelhemos
25% de
delos años más lluviosos,
escogerlos? ¿a partir 
¿Y si deseáramos
seleccionar los menos lluviosos?

27.- Supóngase que se sabe que los niveles de glucosa en sangre extraída a 150 niños en ayunas están
distribuidos normalmente con una media de 66 y una varianza de 42.
a) Cuál es la probabilidad de un niño seleccionado al azar presente un nivel de glucosa en sangre
mayor o igual a 71?
 b) Cuántos niños presen
presentan
tan un nivel de glucosa en ssangre
angre menor o igual a 61?
c) Determinar la median
medianaa y la moda de la distribución.

28.- Supóngase que la estancia promedio de internación en un


hospital es de 5.5 días, con una desviación estándar de 1.8 días. Si
se supo
supone
ne ququee la du dura
raci
ción
ón de la inteintern
rnac
ació
iónn se dist
distri
ribu
buye
ye
norm
normalalme
ment
nte,
e, encu
encuen entre
tre la pr
prob
obab
abili
ilida
dadd de que
que un paci
pacienente
te
sele
selecc
ccio
iona
nado
do al azar
azar de dich
dichoo gr
grup
upoo teng
tengaa una
una dura
duraci
ción
ón de
internación:
a) De más de 6 días.
dí as.
 b) Entre 4 y 7 días.
c) De menos de 3 días.

29.- El nivel de colesterol en los trabajadores administrativos tiene distribución normal. Por otro lado
se sabe que el 5% superior de los trabajadores su colesterol está por encima de 280 y que el 10%
inferior de los trabajadores su colesterol está por debajo de 170. Se pide determinar los valores de la
media y varianza de la distribución normal. Si de esta población seleccionamos un trabajador al azar,
cuál es la probabilidad de que su colesterol sea mayor a 250.

30.- Calcular k ssii P (X ≤ k ) = 0.6141 y X sigue una N


N(15,4).
(15,4).

31.- De una variable normal N(µ; σ) se sabe que P (X ≤ 7 ) = 0.9772 y P (X ≤ 6.5) = 0.8413.
Calcular:
a) µ y σ.
 b) P (5.65 ≤ X ≤ 6.25)
c) El número k tal que P (X > k) = 0.3

32.- La presión arterial sistólica de los cobayos tiene distribución


normal con una media de 95 y una desviación estándar de 9. Si de
es
esta
ta pobla
poblaci
ción
ón selec
selecci
cion
onam
amos
os un coba
cobayo
yo al azar
azar,, ¿cuá
¿cuáll es la
 probabilidad de que:
a) Su presión arterial sistólica sea menor a 75?
 b) Su presión arterial
arterial sistólica esté comprendida entre 75 y 120.
c) Si el número de cobayos es de 1000, ¿Cuántos cobayos se espera
que su presión arterial sistólica sea mayor a 120?
d) A qué valor de presión arterial sistólica se localiza el 25% inferior de la población de cobayos?

33.- Las calificaciones de una prueba final de una cierta signatura tienen distribución normal con
media de 12. Si el 95.44% de los examinados obtuvieron calificaciones entre 8 y 16.
a) Calcule la desviación estándar. Rpta. 2

85

 b) Si la nota aprobatoria


aprobatoria es 11. ¿Qué porcentaje de alumnos aprobaron el curso? Rpta. 69.15% 
curso?
c) ¿Qué nota mínima deberá tener un alumno para estar ubicado en el quinto superior? Rpta. 13.7

34.-. El número promedio de personas que comen en un restaurante es aproximadamente normal, con
una media de 250 y una desviación estándar de 20 por día.
a) Si el consumo promedio por cliente es de $4 ¿Cuál es el consumo diario esperado? Rpta. $1000
 b) ¿Cuál es la probabilidad exceda a $1,100? Rpta. 0.1056 
probabilidad de que el consumo exceda

35.- Suponga que la demanda mensual de un bien de consumo se distribuye normalmente con una
media de 650 kg y una desviación estándar de 100 kg.
a) ¿Qué probabilidad hay de que la demanda no supere los 500 kg? Rpta. 0.0668
 b) ¿Qué cantidad del bien debe
debe haber mensualmente a fin de
de satisfacer la demanda máxima en un
89.8 %? Rpta. 777 Kg

36.- Trescientas estudiantes tienen talla media de 65 pulgadas y


de
desv
svia
iaci
ción
ón es
está
tánd
ndar
ar de 2 pulg
pulgad
adas
as.. Las
Las 300
300 talla
tallass pr
pres
esen
entan
tan
distribución normal y se miden a la pulgada más cercana.
a) ¿Cuántas estudiantes tienen talla de 64 pulgadas o menos?
 b) ¿Debajo de qué talla están
están el 30% de las estudiantes
estudiantes??
c) ¿Cuántas de las estudiantes tienen talla que difiere de la media por 
más de una desviación estándar?

37.- En base a pruebas y la experiencia, un fabricante de lavadoras mecánicas modelo 101XE, decide
que la vida media con uso familiar normal es de 5.8 años, con desviación
desviación estándar de 2 años. Si la
vida de este modelo presenta distribución normal:
a) ¿Qué garantía debe ofrecer si está dispuesto a reparar únicamente al 1% de las lavadoras
vendidas?
 b) Si da una garantía de dos años ¿Qué porcentaje de llas
as máquinas necesitarán reparación antes que
expire el período de garantía?

38.- Una máquina automática que expende café llena los vasos con 6 onzas de café, con desviación
estándar de 0.40 onzas. Si se usan vasos de 7 onzas ¿Qué porcentaje de ellas se derramarán?

39.- Suponga que el ingreso familiar mensual en una comunidad tiene distribución normal con media
de $400 y desviación estándar $50.
a) Si el 10% de las familias debe pagar un impuesto. ¿A partir de qué ingreso familiar se debe pagar 
el impuesto? Rpta. $464
 b) Si el ahorro familiar está
está dado por la relación Y = X - 50
  4
¿Cuál es la probabilidad de que el ahorro sea superior a $75? Rpta. 0.0228

DISTRIBUCIONES MUESTRALES

Se denomina distribución muestral de una estadística a su distribución de probabilidad.


Por ejemplo, a la distribución de probabilidad de la estadística media  x , se le denomina
distribución muestral de la media.

86

Para determinar la distribución muestral de un estadístico es necesario conocer:


a) La población y el parámetro.
 b) Todas las muestras
muestras posibles y todos los valores posibles.

DISTRIBUCIÓN DE LA MEDIA MUESTRAL

La distribución
(media de la
muestral), media que
valores muestral es la distribución
se obtienen a partir dedetodas
todoslaslosposibles
valores que toma el
muestras deestadístico
tamaño n
tomadas de la población.
A continuación, se presentan dos resultados importantes:
• Si la variable aleatoria X sigue una distribución Normal, la distribución de la variable aleatoria  x
es Normal, es decir:
2
   
• Si X ~  N (    ,   2 )   entonces  X  ~  N (  , ) Si la variable aleatoria X no sigue una distribución
n
 Normal, entonces por el teorema del límite central, para n suficientemente grande (n > 30), la
distribución de la variable aleatoria  x  es aproximadamente Normal, es decir:
   2
 X    N (  , )
n
La media de la med
media
ia mue
muestr
stral
al y la var
varian
ianza
za de la med
media
ia mue
muestr
stral
al se repre
represen
senta
ta como   X    y
respectivamente, además:

  X     
   2
    
2
 X 
n
TEOREMA: Si la variable aleatoria X sigue una distribución N(μ,     2 ), la variable aleatoria:

 x   
 z  
 
n

sigue una distribución Normal Estándar,


Estándar, es decir: Z ~ N(0,1).

Donde:
 x : media muestral
  : media poblaciona
poblacionall
  : desviación estándar poblacional
poblacional
n: tamaño de la muestra.

Ejemplo 1.- La distribución de la cantidad de cereal que una máquina vierte en cajas de tamaño
económico, tiene un peso X que se distribuye normalmente con media 0.999 kg y desviación
estándar 0.05 kg. Si se eligen 4 cajas al azar. ¿Cuál es la probabilidad de que el promedio de los
 pesos netos de las 4 cajas esté entre 0.999 y 1.049
1.049 kg?

Solución
 x   
 z  
Sabemos que  
n
87

   
 0.999  0.999 1.049  0.999 
Hallaremos  P   ( 0.999   X   1.049)   P    Z   
0.05 4 0.05
 
  4  

 P   ( 0   Z   2 )  0.4772

Ejemplo 2. Si la distribución del peso de los caballeros que viajan por avión entre dos ciudades tiene
una media de 163 libras y una desviación estándar de 18 libras. ¿Cuál es la probabilidad de que el
 peso total combinado de 36 de esos pasajeros sea mayor de 6,000 libras?

  36  
Solución:  Hallaremos  P    X i  6000 
  i 1  
n

 X   n 
i 1
i
6,000  36 ( 163 )
 Z     1.22
2 2
n  36 (18 )

Luego P ( Z > 1.22 ) = 0.1112


n

 X   n 
i 1
i
 X     6000
Otro método:  Z      en donde  X    166.67
n 
2   36
n

Luego hallaremos  P    X   166.67 

 x   
 z  
Enseguida aplicamos la fórmula  
n

166.67  163
 Z    1.22
18
36

Ejemplo 3.  La calif


califica
icació
ciónn en una pru
prueba
eba de aptit
aptitud
ud es una var
variab
iable
le aleato
aleatoria
ria X que tien
tienee
distribución normal con media igual a 100.
Si se supo
supone
ne qu
quee la desv
desviac
iació
iónn está
estánd
ndar
ar de toda
todass las cali
califi
fica
cacioness es     = 15
cione 15,, ¿cuá
¿cuánt
ntas
as
calificaciones se deben escoger para que la media muestral esté en el intervalo de 90.2 a 109.8 con
 probabilidad 0.95?.
Solución

Se sabe que µ = 100 σ = 15 Hallaremos:


88

 P (90.2    X   109.8)  0.95

   
 
90.2  100 109
109.8  100
 P     Z     0.95
 15 15 
 
  n n  
Lo cual significa que  P(-1.96 ≤ Z ≤ 1.96 ) = 0.95

109.8  100   15  
1.96       1.96    9.8
Por lo tanto 15   n  
n

29.4
 9.8   n 3 n9
n

Ejemplo 4. Los tiempos de espera para los clientes que pasan por una caja registradora a la salida
de una tienda de menudeo son variables aleatorias independientes con una media de 1.5 minutos y
una varianza de 1. Estime la probabilidad de que se pueda atender a 100 clientes en menos de 2
horas.

Solución

Sea la var iable X : Tiempode espera


 100 
Calcularemos P 

 X   120 
i 1
i

 Z 
 X i  n    12

0  100
120 100 (1.5
1.5)
 3  P( Z   3)  0, 00135
2
n   100 (1
(1))

120
Otro método: Se sabe que  X     1, 2
100
  .2  1.5
1
allaremos P( X  1.2)  Z
   3
1
100

DISTRIBUCIÓN DE LA PROPORCIÓN MUESTRAL

Sea  X 
  1  ,  X 2 ,   n   una muestra aleatoria de tamaño n
 X 3  ,….,  X  n,, con distribución Bernoulli con
con
 parámetro π, donde: π : Proporción de éxitos en la población

Si la proporción de éxitos en la muestra (p), sigue una distribución Binomial. Entonces, la media y la
varianza de p se obtienen de la siguiente manera:
 
89

  p 
  
     (1   )
 2 p 
n

OBSERVACIÓN  

Si n es suficientemente grande (np o nq ≥ 5), entonces la variable aleatoria

 p   
 z  
 (1    )
n

sigue una distribución Normal Estándar, es decir: Z~N(0,1).

Donde:
 p: proporción muestral
muestral
  : proporción poblaciona
poblacionall
n: tamaño de la muestra.

Ejemplo 1. La persona encargada de recibir los pedidos de cierto artículo tiene la siguiente política:
selecciona una muestra de 400 artículos; si 3 % ó más de los artículos son defectuosos rechaza el
 pedido, en caso contrario, lo acepta. Hallar la probabilidad de rechazar un pedido si en toda la
 población el 2 % de artículos
artículos son defectuosos.

Solución

Hallaremos  P   p  3 % 

 p    0.03  0.02 0.01


 Z      1.43
 ( 1   ) 0.02  x 0.98 0.007
n 400

Luego P ( Z  1.4
 1.433 ) = 0.0764

Es decir se espera que el 7.64 % de las remesas sean rechazadas.


Ejemplo 2.  El gerente de ventas de “TV cable” estima en 20% las conexiones domiciliarias
clande
clandesti
stinas
nas.. ¿Cu
¿Cuál
ál es la pro
probab
babilid
ilidad
ad de que una mue
muestr
straa de 100 con
conexio
exiones
nes dom
domici
icilia
liaria
riass
seleccionada de una población de 1000 domicilios que tienen “TV cable” más del 30% resulten
clandestinas.
Solución: Hallaremos la probabilidad

ˆ   0.30 
 P  p

ˆ
 p  p
 Z  
 pq  N n
n 
 N   1 

90

30  0.20
0.3
0.
 Z    2.63
0.8  10 00  1 00 
0 .2 x 0.8
1 00 
 
9 99 

 P ( Z    2, 6
63
3)  0.00427
EJERCICIOS PROPUESTOS

1. Un estudio reciente de un organismo de vigilancia ambiental


determinó que la cantidad de contaminantes en el río Rímac (en
 partes por millón) tiene una distribución normal con media de 64
 ppm y desviación estándar de 17.6. Suponga que se toman 35
mues
mu estr
tras
as al azar
azar del
del río.
río. En
Encu
cuen
entr
tree la prob
probab
abil
ilid
idad
ad de que
que el
 promedio muestral de la cantidad
cantidad de contaminantes sea:
a) Mayor que 72 ppm.
 b) Entre 64 y 72 ppm.
ppm.
c) Exactamente 64 ppm.
d) Mayor que 94 ppm.

2. La distribución de los ingresos anuales de todos los administrativos de una determinada institución
educativa y con cinco años de experiencia sigue una distribución normal con una media de $19,000 y
una desviación estándar de $2,000. Si extraemos una muestra aleatoria de 30 administrativos ¿cuál es
la probabilidad de que sus ingresos promedios sean más de $19,750 anualmente?

3. En una muestra de 25 observaciones a partir de una distribución normal con media 98.6 y
desviación estándar 17.2,
a) ¿Cuánto vale P(92 <  x < 102)?
 b) Encuentre la probabilidad
probabilidad correspondiente dada una
una muestra de 36.

3. Dionis
Dionisio
io Rom
Romero
ero P
Paol
aolett
ettii dueño de una gran compañía de tarjetas

de crédito
$112 sabe que elestándar
y la desviación saldo promedio
es $56. mensual de un
Si Dionisio cliente
audita 50 dado es
cuentas
seleccionadas al azar, encuentre la probabilidad de que el saldo
 promedio mensual de la muestra
muestra sea:
a) Menor que $100.
 b) Entre $100 y $130.
$130.

4. Para una muestra


muestra de 19 observac
observaciones
iones de una distr
distribució
ibuciónn normal con media 18 y desviaci
desviación
ón
estándar 4.8, calcule
a) P(16 <  x  < 20).
 b) P ( > 21)
c) Suponga un tamaño de muestra de 40. ¿Cuál es la nueva probabilidad en el inciso a)?

5. A partir
partir de una pobla
població
ciónn de 125 artíc
artículo
uloss con med
media
ia de 105 y des
desvia
viació
ciónn están
estándar
dar de 17, se
eligieron 64 artículos.
a) ¿Cuál es el error estándar de la muestra?
 b) ¿Cuál es la P(107.5
P(107.5 <  x  < 109)?
91

6. Luisa Aliaga Ricaldi, investigadora de la Colombian Cofee Corporation, está interesada en


determinar la tasa de uso de café por hogar en Estados Unidos. Ella
cree que el consumo anual por hogar tiene distribución normal con
 
media   desconocida y desviación estándar cercana a 1.25 libras.
Si Luisa toma una muestra de 36 hogares y registra su consumo de
café durante un año, ¿cuál es la probabilidad de que la media de la

muestra se aleje de la media de la población no más de media


libra?

7. De una población de 75 elementos con media de 364 y varianza


de 18, se seleccionaron 32 elementos al azar sin reemplazo.
a) ¿Cuál es el error estándar de la media?
 b) ¿Cuál es la P(363 <  x  < 366)?

8. Supo
Supong
ngaa que
que la pr
prop
opor
orción    de padr
ción padres
es as
asis
iste
tent
ntes
es a las
las
reuniones del colegio “ABC” en la población es en realidad igual a
0.55. En una muestra de 45 padres de familias ¿cuál es la
 probabilidad que la proporción muestral de padres asistentes a las
reuniones del colegio “ABC” sea mayor al 60%?

9. Reportajes en periódicos nos dicen que el estadounidense tiene sobrepeso. Muchos de nosotros
hemos tratado de bajar de peso cuando terminamos la preparatoria o la universidad. Y en efecto, sólo
19% de adultos dicen que no sufren de problemas de pérdida de peso. Suponga que la cifra de 19%
es correcta y que se selecciona una muestra aleatoria de n= 100 adultos.
a. La distribución de p, es decir, la proporción muestral de adultos que no sufren de excesos de peso,
tiene una distribución normal aproximada ¿cuál es su media y desviación estándar?
 b. ¿Cuál es la probabilidad de que la proporción muestral p exceda a 0.25?

10. Una máquina empaqueta un determinado producto, en paquetes


cuyo peso, en gramos, se distribuye normalmente con una desviación
estándar de 20 gramos, y con una media que debe ser bien regulada.
a) La media µ está bien regulada si sólo el 1% de los pesos de todos
los paquetes que produce la máquina tienen pesos mayores a 546.6
gramos, ¿calcule el valor de µ?
 b) Con la media bien regulada, se programa el siguiente control del
 peso del producto: Cada hora se escogen al azar 4 paquetes, si el
 promedio de los pesos no está entre 480 y 520 gramos, se para la
máquina para mantenimiento. En caso contrario se continua con el proceso. ¿Cuál es la probabilidad
de parar la máquina cuando realmente está bien regulada?
c) Si la máquina está bien regulada, ¿con qué tamaño de muestra se consigue que la media muestral
sea a lo más 490.2 gramos con probabilidad igual a 0.025?

11. La utilidad (en miles dc soles) por la venta de cierto artículo, es


una variable aleatoria con distribución normal. Se estima que en el
5% de las ventas las utilidades serían menos de 6.71, mientras que
el 1% de las ventas serían mayores que 14.66. Si se realizan 16
operaciones de ventas, ¿cuál es la probabilidad de que el promedio
de la utilidad por cada operación esté entre 10 y 11 miles de soles?

12.Se estima que el 60% de los


l os votos de los electores de la ciudad favorecen al candidato Sr. Tasilla
Ramírez. Si se selecciona una mues
muestra
tra aleatoria de 600 electores de la ciudad, ¿qué probabilidad hay
de que la proporción muestral de votos a favor del Sr. Tasilla Ramírez esté entre 47% y 55%?
92

13. De 3000 empleados de una empresa se escoge una muestra


aleatoria de 300 empleados para una encuesta sobre condiciones
laborales. ¿Cuál es la probabilidad de que la proporción muestral a
favor de las condiciones laborales esté comprendido en el
intervalo 0.76 y 0.84, si se estima en 84% del total de empleados
el porcentaje a favor de las condiciones laborales?

14. Por datos


encuentran enobtenidos conlaanterioridad,
las horas de t arde del díase
tarde sabe queSe
domingo. el toma
70% una
de las familias
muestra que tienen
aleatoria tteléfono
de 36 eléfono
familiasnodel
se
directorio telefónico y se les llama. ¿Cuál es la probabilidad de que el 50% o más estén ausentes?

15. Se toma una muestra aleatoria de 200 unidades producidas en una hora por una máquina. Se sabe
que el 10% de las unidades producidas son defectuosas. ¿Cuál es la probabilidad de que en la
muestra tomada, 16 o más artículos resulten defectuosos?

16. En cierto proceso de producción se utiliza el siguiente sistema


de control de calidad: se elige una muestra de 26 unidades, si el
 porcentaje de unidades dede la muestra no excede el valor de
de p, se
continua el proceso. Si se sabe que el proceso ocasiona un 10% de
unidades defectuosas, en promedio, determine el valor de p, para
que exista un 62% de probabilidad de continuar el proceso, cuando
la proporción de piezas defectuosas es inferior a p.

17. Se tiene establecido que las facturas de los clientes tienen una desviación estándar de S/. 45. Si se
toma una muestra de 225 facturas. ¿Cuál es la probprobabilid
abilidad
ad de que el valor medio de la muestra se
desvíe de la media de todas las 2,000 facturas por S/: 7.5 soles o más? Rpta. 0.008
18. Una investigadora de una empresa cafetalera sabe que el consumo mensual de café por casa está
normalmente distribuida, con una media desconocida y una desviación estándar de 0.3 kg.
Si se toma una muestra aleatoria de 36 casas y se registra su consumo de café durante un mes. ¿Cuál
es la probabilidad de que la media de la muestra difiera de la verdadera media en menos de 100
gramos? Rpta. 0.9544
93

INTERVALOS DE CONFIANZA
TAMAÑO DE LA MUESTRA Y
MUESTREO.PRUEBA
MUESTREO.PRUE BA DE HIPÓTESIS.
ANÁLISI DE VARIANZA.
REGRESIÓN Y CORRELACIÓN
LINEAL. CHI CUADRADO
94

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL

de una población normal con σ2 


CASO: Cuando la muestra proviene de
conocida
2
Sea X1, X2, …………..Xn  una muestra aleatoria
aleatoria extraída de una población
población normal donde
es conocida, entonces el intervalo de confianza para la media poblacional está dado por:

     
 X    Z        X    Z  
2 n 2 n

El nivel de confianza (1- α)  es la probabilidad de que la estimación efectuada se ajuste a la realidad;
es decir, que caiga dentro de un intervalo determinado basado en el estimador y que capte el valor
verdadero del parámetro a medir.

El nivel de significancia (α) es la probabilidad de que el intervalo de confianza hallado no contenga


al verdadero valor del parámetro.
 z     es llamado coeficiente de confiabilidad cuyo valor se encuentra en la tabla de la distribución
2
normal estándar y va depender del nivel de confianza.
  σ es la desviación estándar poblacional.

Nota
- Cuando la población es finita de tamaño N y el tamaño de la muestra es mayor del 5 % con
respecto a N, se debe usar el factor de corrección para población finita.

- Para muestras pequeñas seleccionadas de poblaciones no normales, no se puede esperar 


que el grado de confianza sea exacto. Sin embargo, para muestras de tamaño grande n  30,
independientemente de la forma de la distribución de la población, se puede hallar un
intervalo de confianza para  considerando la distribución muestral de  X  . De acuerdo al
Teorema de Límite Central,  X   tiene distribución aproximadamente normal con media   y
varianza 2/n

Ejemplo 1.- Un director de producción sabe que la cantidad de impurezas contenida en los envases
de cierta sustancia química sigue una distribución normal con una desviación estándar de 3.8 gr. Se
extrae una muestra aleatoria de 9 envases cuyos contenidos de impurezas son los siguientes:
18.2 16.6 13.7 12.3 15.9 18 17.4 16.2 y 21.8
Determinar un intervalo de confianza del 95% para a media
Solución: Dado que σ es conocida utilizaremos la variable Z para dicha estimación

     
 X    Z        X    Z   
2 n 2 n
95

luego los límites de confianza estarán dados  por   X    Z   / 2    x
 3.8 
16.67  1.96    16.67  2.48  14.2     19.2
   
9

Con un 95% de confiabilidad


confiabilidad pode
podemos
mos afirma
afirmarr que la canti
cantidad
dad prome
promedio
dio de impurez
impurezas
as en los
envases está entre 14.2 y 19.2
También podemos afirmar con un 95% de confiabilidad de que la cantidad media de impurezas
contenida en los envases es de 16.7 con un margen de error de 2.48

Ejemplo 2.- Supongamos que un investigador está interesado en estimar el nivel medio de alguna
enzima en cierta población, toma una muestra de 10 individuos, determina el nivel de la enzima de
cada uno y obtiene una media igual a 22. Suponga además que la variable de interés está distribuida
normalmente con varianza de 45. Encuentre un intervalo de confianza del 98% para la media
 poblacional.

Solución: Dado que σ es conocida utilizaremos la variable Z para dicha estimación


     
 X    Z   2 n 
 
  X    Z 
 
2 n

luego los lí
lím
mites de con
confi
fia
anza estarán dados por X  Z     /2  x

 6.7082 
22  2.33    22  4.94  17.06     26.94
 10 

 La cantidad
cantidad promedio
promedio de dicha
dicha enzima estaría entre 17 y 27 aproxim
enzima estaría aproximada
adame
mente
nte

de una población normal con σ2 


CASO: Cuando la muestra proviene de
desconocida
Dado que no se conoce 2  ésta deberá serser estimada por la vvarianza
arianza muestral y la variable
estadística a usarse será la T de Student:

 X     
T   cuya distribuci ón es t  de Student  con n 1  grados de libertad 

n

Luego el intervalo de confianza está dado por:

 X   t   S          X   t   S 


2 n 2 n
96

Ejemplo 1.- En el departamento de personal de una compañía grande se requiere estimar los gastos
familiares
familiares en odontolog
odontologíaía de sus empleados para determ
determinar
inar la factib
factibilidad
ilidad de proporcio
proporcionarles
narles un
 plan de seguro dental. Una muestra aleatoria de 10 empleados reveló los siguientes gastos (en
dólares) durante el año anterior:
110 362 246 85 510 208 173 425 316 179
Establezca un intervalo de confianza del 90% para el gasto promedio familiar en odontología

Solución: En este caso como la varianza σ2 es desconocida utilizaremos la variable T de Student:
 s  s
 X   t            X   t  
2 n 2 n

Cálculos
 Para n  10  se tiene que      X   261.4 S   138 .8

luego los límites de confianza estarán dados  por   X   t   / 2   S x
 138.8 
261.4  1.8331    261.4  80.46  180.9     341.9
  10  
Podemos concluir con un 90% de confiabilidad que el gasto promedio familiar en odontología en
dicha empresa es de 261.4 dólares con un margen
m argen de error de 80.46 dólares.
También podemos concluir con un 90% de confiabilidad de que el gasto promedio familiar en
odontología en dicha empresa estaría entre 181 y342 dólares.

Ejemplo 2.- Una compañía emplea 200 agentes de ventas; en una muestra aleatoria de 25 los
auditores encontraron un gasto promedio de $220 con una desviación estándar de $20 en sus cuentas
de gasto de representación en una semana. Establezca un intervalo de confianza del 98% para el
gasto promedio semanal.
n
Solución: En este caso dado que N es conocido y  5%  usaremos el factor de corrección para
 N 
 poblaciones finitas; por lo tanto:
 Los límites de confianza estarán dados  por   X   t   / 2   S x
  20   200  25
220  2.4922    220  9.3  210.7     229.3
  25  200

Ejemplo 3.- Se desea determinar el peso total de una partida de 10,000 naranjas. Como solo se tiene
una balanza pequeña y además no se dispone de tiempo; se selecciona una muestra aleatoria de 16
naranjas, la cual da una media de 175 gramos y una desviación estándar de 25 gr. Determinar un
intervalo de confianza del 98% para el peso total de la partida de naranjas.
Solución:
El peso total estimado estará dado por:
 N   X   10,000
  ( 175 )  1750000
   gr  o  sea 1,750 kg .  
Ahora estimaremos un intervalo de confianza para el peso total de las naranjas; para lo cual
 primeramente estimaremos un intervalo de confianza para el peso
peso promedio por naranja.

97

 
 Loss límites de confianza
 Lo estarán dados  por   X   t   / 2 S  x

  25   10,000  16
175  2.6025    175  16 .2526  158 .7474     191 .2526
  16   10,000

 Luego
 Lu ego 10,000 ( 158 .7474 )   N    10 ,000 ( 191 .2526 )
1587474   N     1912526 o  sea 1587.5   N     1912.5

 Es decir  el   peso total  de las naranjas estaría entre 1,587 .5  y 1,912 .5 kg 

Ejemplo 4.- Un sondeo efectuado en 400 familias de cierta clase social de una ciudad encontró un
gasto mensual promedio de S/74 en productos de tocador con desviación estándar de S/ 40.
¿Con qué nivel de confianza se puede afirmar que el gasto promedio mensual en artículos de tocador 
está entre 71 y 77?

Solución: En este caso utilizaremos la variable Z por ser una muestra muy grande

Sabemos que el  m arg en de error  : e está dado  por   Z   / 2   x


 En este caso ˆ  x
 Z   / 2    e   Z   / 2  e
n

40
 Z   / 2  3   Z   / 2 ( 2 )   3   Z   / 2   1.5
400

 Luego el  nivel  de confianza estará dado  por  :  P (  1.5     Z   1.5 )  0.8664

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN


POBLACIONAL

98

Sea X1, X2, X3,………………………,Xn una muestra aleatoria de tamaño n escogida de una
 población de Bernoulli B(1,p) cuy
cuyoo parámetro p es la proporción de ééxitos
xitos en la población.
población.
El estimador puntual de p es:

 X 
n
i
  i 1  X   N º de éxitos en la muestra
ˆ 
 p  
n n n

Dondee  X i   toma el valor 1 si presenta la característica estudiada y el valor 0 si no lo


Dond
 presenta.

Sabemos que:

 E    p
ˆ   p

 p q  p (1   p )
V    p
ˆ  n  n

En consecuencia, la variable aleatoria

ˆ   p
 p
 Z   tiene distribución aproximadamente  N (0,1)
 p (1   p)  
n

Por consiguiente, el intervalo de confianza del ( 1 – α )100% para el parámetro p es:

ˆ qˆ
 p   ˆ qˆ
 p
ˆ   Z   / 2
 p n    p
 
  pˆ   Z   / 2 n

n
 Nota.- Si el muestreo es sin reemplazo en una población finita de tamaño N y  5%
 N 
entonces resulta adecuado
adecuado usar el factor de corrección por población finita.

Ejemplo 1.- En cierta ciudad, se entrevistó a una muestra de 500 bebedores de cerveza, hallándose
que 114 de ellos preferían la marca X a la de Y. Hállese el intervalo de confianza del 98% para la
fracción de bebedores de cerveza de esa ciudad que prefieren la marca X.

Solución:
 x  N º de bebedores de cerveza que  prefieren la marca  X 
ˆ
Sea  p   propo
 proporción
rción muestral    pˆ  
n Tamaño de muestra
114
luego ˆ
 p   0.228
500

99

ˆ (1   p
 p ˆ)   ˆ (1   p
 p ˆ)
ˆ   Z  
 p     p   pˆ   Z  
2 n 2 n

ˆ ( 1   p
 p ˆ) 0.228 x 0.772
ˆ
 p   Z    0.228  2.33
2 n 500

0.228  0.044  0.18 4   p  0.272

Ejemplo 2.- De una lista de opinión pública, se invita a 100 personas de un total de 1,000 a expresar 
su preferencia por los productos A y B; 30 personas prefirieron A, de esto se concluye que entre 210
y 390 de la población prefieren el producto A. ¿Qué nivel de significación se usa en este informe?
Solución:
n
En este caso dado que N es conocido y  5%  usaremos el factor de corrección para poblaciones
 N 
finitas.

30
Se tiene que : n  100  N   1,  000  ˆ 
p  0.30
100

ˆ (1   p
 p ˆ)  N   n 0.30 x 0.70 1,000  100
ˆ   Z  
 p   Z   / 2   0.09
2 n  N  10
100
0 1,000

 Z   / 2 ( 0.046 ) ( 0.94868 )   0.09   Z   / 2 ( 0.0435 )   0.09   Z   / 2   2.07

 Luego      1   P (   2.07   Z   2.07 )  0.038

Ejercicios Propuestos

1. Una encuesta efectuada a una muestra aleatoria de 150 familias en cierta comunidad
urbana reveló que, en el 87 por ciento de los casos, por lo menos uno de los miembros de la
familia tenía alguna forma de seguro relacionado con la salud. Construir un intervalo de
100

confianza del 99 por ciento para la proporción real ( P ) de familias en la comunidad con las
características de interés.

2. Una muestra
muestra de 100 hombhombres
res adulto
adultoss aparent
aparentemente
emente san
sanos,
os, de 25 años de edad, muestran
muestran una
 presión sistólica sanguínea media de 125. Si se supone que la desviación estándar de la población es
de 15, calcular el intervalo de confianza del 90 por ciento para   .

3. En un estudio diseñado para establecer la relación entre un medicamento y cierta anomalía en los
embriones de pollo, se inyectaron con el medicamento 50 huevos fecundados al cuarto día de
incubación. En el vigésimo día de incubación se examinaron los embriones y se observó la presencia
de la anomalía en 12 de ellos.
ellos. Encontrar un intervalo de confianza
confianza del 90 por ciento para P.

4. En una muestra de 60 pacientes la cantidad mínima requerida para que un anestésico surta efecto
en una intervención quirúrgica fue por término medio de 50 mg, con una desviación típica de
10,2 mg, Obtener un intervalo de confianza para la media al 95%, suponiendo que la muestra fue
extraída mediante muestreo aleatorio simple sobre una población normal

5. Un psicólogo advierte que el tiempo medio de reacción de 36 ratas a un choque eléctrico de 18
voltioss es de 0.45 segundo
voltio segundos,
s, con desv
desviación
iación estánda
estándarr de 0.06 segundo
segundos.
s. Encu
Encuentre
entre un inter
intervalo
valo de
confianza del 90% para el tiempo medio de reacción de todas las ratas de la misma cepa a un choque
de 18 voltios?

6. Un estudio de 50 hogares de cuatro personas cada uno, tomados aleatoriamente, que viven en
cierta ciudad, mostró un gasto promedio de 76 dólares por semana en alimentos, con desviación
estándar de 3 dólares. Encuentre el gasto semanal promedio en alimentos en todos los hogares de
cuatro personas en dicha ciudad, con una confianza de un 98%.

7. Una muestra aleatoria de 49 personas que habitan en apartamentos de dos piezas en cierta ciudad,
mostró que pagaban un alquiler mensual promedio de $129.5 con desviación estándar de $18.75
Construya un intervalo de confianza del 99% para el alquiler promedio mensual pagado por 
apartamentos de dos piezas en dicha ciudad. Rpta [122.3 ; 136.7]

8. Un analista de investigación de mercados escoge una muestra aleatoria de 100 clientes de un
conjunto
El de 500
encuentra clientes
que de una gran
los clientes de latienda que gastaron
muestra declaran sus
en ingresos
la tiendamayores a $800.de $2,500 por 
un promedio
año. Si con este valor de la muestra se estima que el gasto promedio de la población varía entre
2,446 a 2554. ¿Qué nivel de confianza se utilizó? Suponga que la desviación estándar de la
$300. Rpta. 0.9556
 población es de $300.

9. Para determinar el rendimiento anual de ciertos valores, un grupo de inversionistas tomó una
muestra aleatoria de 49 de tales valores encontrando una media de 8.71% y una desviación estándar 
de 2.1%.
a) Estime el verdadero rendimiento anual promedio de tales valores mediante un intervalo de
confianza del 96%. Rpta. [8.1% ; 9.3%]
b) Calcule el nivel de significancia si el rendimiento anual promedio de todos los valores se estima
entre 7.96% y 9.46%. Rpta. 0.0124
10. El Gerente de ventas de la tienda “CREDITOS” quiere determinar el porcentaje de clientes
morosos por más de $100. Una muestra aleatoria de 200 de tales clientes de la tienda reveló que 50
de ellos eran morosos.

101

a) Halle un intervalo de confianza del 98% para la proporción de clientes morosos por más de $100?.
b) Si la estimación de la proporción de clientes mmorosos
orosos está en el intervalo [0.183 ; 0.317]. ¿Con
qué grado de confianza se realizó esta investigación?. Rpta. 0.9714

11. El consumo regular de cereales preendulzados contribuye a la caída de los dientes, enfermedades
del corazón y otros procesos degenerativos. En una muestra aleatoria de 20 porciones sencillas de un
cereal el contenido promedio de azúcar fue de 11.3 gr con desviación estándar de 2.45 gr.
Suponiendo que los contenidos de azúcar están distribuidos normalmente. Determine un intervalo de
confianza del 95% para el contenido promedio de azúcar en porciones sencillas de dicho cereal.
Rpta 10.15 < µ < 12.45

12. Algunos investigadores creen que la vitamina C puede ser útil para reducir el colesterol en las
 paredes internas de las arterias. Se observa el nivel de colesterol de 50 personas (con niveles de
colesterol mayores que lo normal) antes y después de un tratamiento de un mes bajo un régimen de
500 mg de vitamina C por día, obteniéndose una media de 64.3 mg/100ml y desviación estándar de
18.9 mg en la disminución del nivel de colesterol. Estime la disminución promedio por persona del
nivel de colesterol, usando un intervalo de confianza del 90%. Rpta 59.8 < µ < 68
68.8
.8

13. Se determinaron los niveles del PH de la saliva en una muestra aleatoria de niños de escuela
 primaria, los cuales presentaban
presentaban una alta incidencia de caries.
caries. Los resultados fueron los
los siguientes:
7.36 7.04 7.19 7.41 7.10 7.15 7.36 7.57 7.64 7.00 7.25 7.19
Halle un intervalo de confianza para la media con un 98% de confiabilidad.
14. Ciertos investigadores se interesan por la calidad del aire; uno de estos indicadores es el número
de microorganismos de partículas de suspensión por m 3. Para controlar la situación se hace una
lectura cada 6 días extrayendo 1m 3 de aire a través de un filtro y determinando el número de µg de
 partículas concentradas en él. Los datos observado
observadoss para un período de 30 días fueron:
58 70 57 61 59.
Supóngase que por experiencias anteriores se sabe que la variable número de microorganismos de
 partículas está distribuida normalmente con varianza de 9. Halle un intervalo de confianza para la
media con α = 0.01 Rpta 58 < µ < 64 aproximadamente
15. Se pretende estimar el número promedio de latidos por minuto para cierta población. Se encontró
que el número promedio de latidos por minuto para 49 personas era de 90. Considere que esos 49
 pacientes constituyen una muestra aleatoria y que la población sigue una distribución normal, con
una desviación estándar de 10. Use α = 0.02 Rpta 87 < µ < 93
16. Entre 100 peces capturados en cierto lago 18 no eran comestibles debido a la contaminación del
medio ambiente. ¿Con qué confianza se puede asegurar que el error de estimación es a lo mucho de
0.065? Rpta. 0.909
17. En una muestra al azar de 127 niños de guarderías infantiles se han diagnosticado 7 niños con
sintomatología autista y 12 niños con enuresis nocturna. Utilizando α = 0.05.
a) Determine un intervalo de confianza para la proporción de niños autistas que hay en la población,
origen de la muestra. Rpta. 0.015 < p < 0.095
 b) Determine un intervalo de confianza para la proporción
proporción de niños con enuresis nocturna que hay en
la población, origen de la muestra. Rpta. 0.043 < p < 00.14
.14

MUESTREO Y TAMAÑO DE LA MUESTRA


102

 
MUESTREO: Técnica estadística que permite seleccionar los elementos que se analizarán o
evaluarán de la población.

Se pueden realizar diferentes tipos de muestreo, que quedan clasificados en dos grandes grupos:
 probabilísticos y no probabilísticos. En el muestreo probabilístico, todos los individuos o elementos
de la población tienen la misma probabilidad de ser incluidos en la muestra extraída, asegurándonos
la representatividad de la misma. En el muestreo no probabilístico, por su parte, los elementos de la
muestra se seleccionan siguiendo criterios determinados.
MUESTREO PROBABILISTICO

Muestreo aleat
Muestreo aleatorio simplee, cuan
orio simpl cuando
do todo
todoss los
los elem
elemen
ento
toss de la po pobl
blac
ació
iónn tiene
tienenn la mi
mism
smaa
 probabilidad de ser seleccionados en la muestra y esta probabilidad es conocida. Este tipo de
muestreo es más recomendable, cuando las unidades de análisis son relativamente homogéneas. Para
seleccionar una muestra de este tipo se requiere tener en forma un listado
l istado de todos los elementos que
integran la población investigada y utilizar tablas de números aleatorios o un software estadístico.

Muestreo aleatorio sistemático ,  el cual es susceptible de ser más preciso que el muestreo aleatorio
simple. Se elige un primer elemento luego se van escogiendo los demás elementos a intervalos
constantes a partir del primero hasta completar el tamaño de la muestra.

Muestreo aleatorio estratificado,  se usa para estimar parámetros de poblaciones muy heterogéneas,
consistes en la separación de las unidades de la población en grupos o estratos, de tal manera que
entre estratos haya cierta heterogeneidad,
heterogeneidad, pero además exista cierta homogeneidad dentro ddee cada
estrato. De cada estrato se extrae una muestra aleatoria simple.

Muestreo aleatorio conglomerado,  no se necesita un marco muy específico como en el caso del
muestreo aleatorio simple en el que era necesario disponer de un listado de unidades de la población,
o como en el muestreo estratificado, donde era necesario disponer de listados de unidades por 
estratos. Se divide previamente a la población en conglomerados o áreas convenientes, de los cuales
se seleccionará algunos de ellos para la muestra, con lo que sólo es necesario un marco de
conglomerados que será más fácil de conseguir y más barato. Se pueden utilizar como marco
divisiones territoriales ya establecidas por necesidades administrativas para las cuales existe ya
información. También se pueden utilizar como marco áreas geográficas cuyas características están ya
muy delimitadas.

Tamaño de muestra(n)
PARA ESTIMAR LA MEDIA PARA ESTIMAR LA PROPORCIÓN
SITUACIÓN
POBLACIONAL POBLACIONAL
2
 z  . 
 
2
 z  2 . p.q
N ES INFINITA n 2
n 2

e
2
e2
2 2
 z . N . 
 
 z 2 . N . pq
 

N ES FINITA n 2
n 2

 z  ( N   1)e  pqz 2  ( N   1)e2


2 2 2
 
   
2 2

Donde:
103

Precisión de estimación (e)  llamado también margen de error o error de muestreo y viene a ser la
diferencia máxima que existirá entre el valor del estadístico y el parámetro.
 z     es llamado coeficiente de confiabilidad cuyo valor se encuentra en la tabla de la distribución
2
normal estándar y va depender del nivel de confianza.
N  corresponde al tamaño de la población.
  2  es la varianza poblacional.
p es la proporción que posee la característica que se estudia.  
q es la proporción que no posee la característica que se estudia.  (q =1- p)

Ejercicios Desarrollados

Ejemploo 1: Se quiere hacer una encuesta para estimar el tiempo


Ejempl
 promedio por semana que los niños ven televisión. Por estudios
anteriores se sabe que la desviación estándar de dicho tiempo es de 3
horas. Con el nivel de confianza del 95%.
a) ¿Qué tamaño de muestra se debe elegir, de tal manera que el error 
de estimación no sea superior a media hora?
Solución
2   2
  Z       1.96  x 3 
n     / 2        138.3  n  139 niños
  e     0.5  
El tamaño de la muestra es de aproximadamente 139 niños.
 b) ¿Qué costo se debe presupuestar para hacer la encuesta, si esta tiene un costo fijo de $5,000 más
un costo variable de $2 por cada entrevista?
Solución:
5,000 + 2 ( 139 ) = $5,278
El costo que se debe presupuestar es de $5,278
Ejemplo 2: Un analista de investigación de mercados escogió una muestra aleatoria de 100 clientes
de una población de 500 clientes de una gran tienda que declaran ingresos mayores a $800. El
encontró que los clientes de la muestra gastaban en la tienda un promedio de $ 1000 por año. Si con
este valor de la muestra estimó que el gasto
gasto promedio por año de esta población varía
varía de $9040 a
$1060. Suponga que la desviación estándar de tal población es de $300

a) ¿Qu
¿Quéé ni
nivel
vel de cconf
onfian
ianza
za ssee ut
utiliz
ilizó?
ó?

Datos

n = 100 Se sabe que: 9,040 <   < 1,060 luego e = $ 60


 N = 500
104

 Z       x  e
2

300 500  100


 Z    60
 X  $1,000 2 100 499
   $ 300
26.86  Z   60 luego  Z   2.23
  2   2

Lueg
Luegoo el
el ni
nive
vell de conf
confia
ianz
nzaa sser
erá:
á: .233  Z   2.23 ) = 0.9743
P ( - 22.2

Es decir se tiene una confianza del 97.43 % de que la media muestral  X   $1,000  difiere de
la media verdadera en a lo más $ 60.

 b) De qué tamaño tendrá que ser la muestra para que se tenga una confianza del 97 %
de que, al estimar la media de la población, el error de estimación no sea mayor a
$ 50.

 Z  2   2  N 
( 2.17 ) 2 ( 300 ) 2 500
n  2
  126.8   127
2
 Z 
 
2
  2  e2 ( N 1 ) 2 2
( 2.17 ) ( 300 )  ( 50 ) ( 499 ) 2

Ejemploo 3: La oficina de Planificación Familiar de cierto distrito


Ejempl
desea determinar la proporción de familias con un ingreso mensual
inferior a S/ 800. Estudios previos han indicado que esta proporción
era del 20%. ¿Qué tamaño muestral se requiere para asegurar con una
confianza del 95% que el error en la estimación de esta proporción
no sobrepase a 0.03?
Solución:
2
 Z 
    / 2  p q ( 1.96 ) 2 ( 0.2 ) ( 0.8 )
n  n    683  familias
e2 ( 0.03 ) 2

El tamaño de la muestra es de aproximadamente 683 familias.

Ejemplo 4. En una determinada región se tomó una muestra aleatoria de 125 individuos, de
los cuales 12 padecían afecciones pulmonares
pulmonares..
a) Estímese la proporción de in
individuos
dividuos con afecciones
afecciones pulmonare
pulmonaress en dicha región; con un
95% de confiabilidad.
 b) Si queremos estimar dicha proporción con un error máximo del 4%, con una confianza
del 95%, ¿qué tamaño de muestra debemos tomar?

Solución Se sabe que:


 x  Personas con afecciones pulmonares
Sea  p
ˆ   proporción muestral    pˆ  
n Tamaño de muestra
12
luego  p
ˆ   0.096
125
ˆ qˆ
 p ˆ qˆ
 p
 p  Z   / 2     p   p   Z   / 2
n n

105

 p
ˆ qˆ
en con sec uencia los límites  serán ˆ   Z   / 2
 p
n

0.096 x0.904
0.096  1.96 luego 0.096  0.052
125

Por lo tanto 0.044     p  0.148


Conclusiones:

- Pod
Podemo
emoss afir
afirmar
mar co
conn un 95% de cconf
onfiab
iabili
ilidad
dad que
que la propor
proporcióciónn de person
personas
as que
que
 padecen de afecciones pu
pulmonares
lmonares en dic
dicha
ha región estaría eentre
ntre el 4% y 15%
- Ta
Tamb
mbié
iénn po
pode
demo
moss afir
afirma
marr con
con un 95
95%% de co conf
nfia
iabi
bili
lida
dadd qu
quee la prprop
opor
orci
ción
ón de
 personas que padecen de afecciones
afecciones pulmonares en dicha región es del 9.6%, con un
margen de error de 5.2%

b) Si quere
queremos
mos estim
estimar
ar dicha pr
propor
oporción
ción con un er
error
ror máx
máximo
imo del 3%, para un
unaa
confianza del 95%, ¿qué tamaño de muestra debemos tomar?
ˆ qˆ
 p
Sabemos que  Z   / 2
n e (m arg en de error )

2
ˆ qˆ
 Z  / 2  p
luego n 2
Cuando no  se conoce  N 
e

(1.96) 2 (0.096) (0.904)


n    370.4  n  371  personas
(0.03) 2

Con una muestra de 371 personas estaremos 95% seguro, que a partir de dicha muestra
obtendremos una proporción muestral cuyo valor diferirá de la verdadera proporción en a lo
más 0.03
.

EJERCICIOS PROPUESTOS

1. Se ha pr
proy
oyec
ecta
tado
do una
una encu
encues
esta
ta para
para dete
determ
rmin
inar
ar los
los gast
gastos
os
médicos anuales promedio por familia de los empleados de una
gran compañía. La administración de la compañía desea tener una
confianza del 95% de que el promedio de la muestra esté correcto
en una escala de ± $50 de los gastos reales promedio por familia.

106

Un estudio piloto señala que la desviación estándar se puede estimar como $400. ¿Qué tamaño de
muestra se necesita?

2. Si un ger
gerent
entee de contr
control
ol de cal
calida
idadd qu
quisie
isiera
ra estim
estimar
ar la vid
vidaa pro
promed
medio
io de un produ
producto
cto en una
escala ± 20 horas con una confianza del 95% y también supone que la desviación estándar del
 proceso permanece en 100
100 horas ¿qué tamaño de de muestra se necesita?

3. Si una cadena de supermercado


supermercadoss quisier
quisieraa estimar el importe prom
promedio
edio de ventas en una escala de
± $100 con una confianza del 99% y si se supone que la desviación estándar de la población es
$200 ¿qué tamaño de muestra se necesita?

4. Si una compañía
compañía de gas quisi
quisiera
era estim
estimar
ar el tiempo de espe
espera
ra promed
promedio
io en días, den
dentro
tro de ±5 días
con una confianza del 95% y si se supone que la desviación estándar de la población es de 20 días
¿qué tamaño de muestra se necesita?

5. Un analista
analista políti
político
co quisie
quisiera
ra estimar la pro
proporc
porción
ión de votan
votantes
tes
que elegirán al candidato demócrata en una campaña presidencial.
El analista quisiera tener una confianza del 90% de que su
 predicción esté correcta en una escala de ±0.04 de la proporción
real. ¿Qué tamaño de muestra se necesita?

6. El geren
gerente
te de un banco quier
quieree tener una conf
confianza
ianza de
dell 90% de estar en lo correc
correcto
to en una escala
de ± 0.05 de la proporción real de depositantes, que tienen al mismo tiempo cuentas de ahorro y de
cheques. ¿Qué tamaño de muestra se necesita?

7. ¿Q¿Qué
ué tama
tamaño
ño de mu muesestr
traa se nece
necesi
sita
tará
rá si una
una comp
compañ
añía
ía de
autobuses
autobuses quisier
quisieraa reali
realizar
zar una encue
encuesta,
sta, en la que desearía tener 
una confianza del 95% de estar en lo correcto en una escala de ±
0.02 de la proporción real de viajeros que utilizarían el servicio de
autobús? En base a la experiencia con otras rutas, se supone que la
 proporción real es de
de aproximadamente 0.40.

8.   Un equipo de investigación médica está seguro sobre un suero que han desarrollado, el cual
curará cerca del 75% de los pacientes que sufren de ciertas enfermedades. ¿Qué tamaño debe ser la
muestra para que el grupo pueda estar seguro en un 98% que la proporción muestral de los que se
curan esté dentro de ± 0.04 de la proporción de todos los casos que el suero curará? Rpta. n = 637

9. El mantenimiento de cuentas puede resultar demasiado costoso, si


el promedio de compra por cuenta, baja de cierto nivel. El gerente de
un gran almacén por departamentos desea estimar el promedio de lo
comprado mensualmente por los clientes que usan la cuenta de
crédito, con un error de $2.500, y con un nivel de confianza del
95%.
95%. ¿C¿Cuá
uánt
ntas
as cuen
cuentas
tas debe
deberá
rá sele
selecc
ccio
iona
nar,
r, si se sabe
sabe que
que la
desviación estándar es de $ 30 000, la cual fue obtenida de los
 balances mensuales de las cuentas de crédito?
10. Una firma constructora desea estimar la resistencia promedio de las barras de acero utilizadas en
la construcción de edificios de apartamentos. ¿Qué tamaño de muestra requiere para garantizar con
nivel de significancia del 2% de no sobrepasar un error de 5kg.? La desviación estándar de la
resistencia de este tipo de barras se estima
e stima en 25 kg.

11.Un investigador está interesado en estimar la ganancia promedio


en peso total en 4 semanas de 2000 pollitos alimentados con una

107

nueva ración. Obviamente pesar cada ave seria tedioso y llevaría


ll evaría demasiado tiempo. Por tanto, se
debe determinar el número de pollitos a seleccionar en una muestra tomando en cuento que el error
máximo permitido es 10 gramos. Muchos estudios similares sobre nutrición de pollitos se han
llevado a cabo en el pasado. Usando datos de estudios, el investigador encontró que la varianza es
aproximadamente de 36 gramos. Determine el tamaño de muestra requerido.

12.Se desea realizar una investigación sobre el número de unidades


que se encuentran en mal estado en 4000 cajas y la proporción de
cajas que contienen unidades en mal estado. Se realiza una
encuesta preliminar de 80 cajas con el siguiente resultado,
 presentado en una tabla de
de frecuencias:

Nº de unidades deectuosas 0 1 2 3 4 5 10 12
Nº de cajas examinadas 27 15 12 12 6 4 2 2

Determine el tamaño de muestra con un error de 0.8 y un nivel de confianza de 94%.

13.  Se desea estimar el promedio de pH de las lluvias en un área que experimenta una gran
contaminación por parte de la descarga del humo de una planta de energía eléctrica. Si se sabe que la
desviación estándar tiene un valor de 0.5 pH y se desea que la estimación difiera a lo más en 0.1 de
la media verdadera con una probabilidad de 0.95. ¿Cuántas lluvias deben incluirse aproximadamente
en la muestra (una lectura de pH por lluvia)? Rpta. n = 97 aprox.
108

Pruebas de Hipótesis

PRUEBAS DE HIPÓTESIS ACERCA DE UNA SOLA MEDIA

1° Caso:σCuando
varianza 2
 conocidala muestra proviene de una población normal con
Sea X la media de una muestra aleatoria de tamaño n seleccionada de una población con media   y
varianza 2 supuestamente conocida.
Si la población es normal, entonces la distribución de la estadística X es exactamente normal
 N (, 2/ n)

La estadística para esta prueba es:

 X    
 Z  
      N (0, 1)
n

1.- Diez análisis repetidos de la concentración de mercurio en una muestra de condensado de gas


comercial proporcionaron los siguientes resultados en ng/mL
23.3 22.5 21.9 21.5 19.9 21.3 21.7 23.8 22.6 24.7
Suponiendo que la concentración de mercurio se distribuye normalmente con una desviación
estándar igual a 1.5 y teniendo en cuenta que a partir de una media igual a 24 existe una alta
toxicidad.
Con α = 0.05 ¿Evidencian los datos la existencia de una alta toxicidad?

Solución A partir de los datos obtenemos  X   22,32  luego plantearemos las hipótesis:

1)  Hipótesis  H 0 :    24
 H 1 :    24

2)  Nivel  de  significac
  ión :    0.05
 
 X     22.32  24
3)Variable estadístuca   Z     3.54
  1.5
n 10

 
4) Re gla de decisión : Re chazaremos  H 0  si  Z    1.64
645
5

( Valor  int erpolado hallado en la tabla normal  es tan darizada )

 Por  lo tan to la decisión  será rechazar  la hipótesis  H 0


5) Conclusión : Los datos no evidencian la existencia de una alta toxicidad .

109

Ejemplo 2. La estatura media de los alumnos de cierta universidad es de 1.68 m con desviación
estándar de 5 cm. ¿Hay razón para creer, que se ha producido un cambio en la estatura promedio, si
una muestra de 25 estudiantes
estudiantes dio una estatura prom
promedio
edio de 1.70 m? Use α = 0.05

Solución

1)  Hipó
 Hipótesis
tesis  H 0 :    1.68 m
   H 1 :    1.68 m

 
  2)  Nivel  de  significación :    0.05

 X     1.70  1.68


3) Variable estadística :  Z        Z    2
    0.05
n 25

4) Re gla de decisión : Re chazaremos  H 0  si  Z    V t  o  Z   Vt 


 
en donde V t   1.96 ( Valor  hallado en la tabla normal  es tan darizada )

 Por 
 Po r  lo tan to la decisión  será rechazar  la hipótesis  H 0

5) Conclusión : La muestra está evidenciando que


qu e la estatura  prom
 promed
edio
io ha cambiado.

2° Caso: Cuando la muestra proviene de una población normal con


varianza σ2 desconocida
Cuando el muestreo se realiza a partir de una población que sigue una distribución normal con una
varian
varianza
za pob
poblac
lacion
ional
al des
descon
conoci
ocida,
da, ent
entonc
onces
es la dis
distri
tribuc
bución
ión de la med
mediaia mue
muestr
stral
al sig
sigue
ue una
distribución T.

 La estadística de prueba es:

    
 X 
T  

n

Ejemplo 1.- Una máquina vendedora de refrescos se ajusta para servir 6 onzas por vaso. La máquina
se pone en funcionamiento y se analiza una muestra de 9 vasos obteniendo un llenado medio de 6.4
onzas con desviación estándar de 0.5 onzas. A un nivel de significancia de 0.05. ¿Esto evidencia de
que la máquina está llenando demasiado los vasos?
Solución
Sea X la variable aleatoria que denota la can
cantidad
tidad servida por la máquina.
máquina. Se supone que la va
variable
riable
X se distribuye normalmente con media µ y varianza σ2 desconocida.
110

1)  Hipóte
 Hipótesis
sis  H 0 :    6 onzas
 H 1 :    6 onzas

 
2)  Nivel  de  significación :    0.05

   X     6.4  6
3) Variable estadística : T       T    2.4
S  n 0.5 9

 Por  lo tan to rechazarem os la hipótesis  H 0


5) Conclusión :  Efectiv
 Efectivame
amente , los resultados evidencian que la máquina está llenando
demasiado los vasos

Ejemplo 2.- En su calidad de comprador comercial para una marca privada de un supermercado,
suponga que se toma una muestra aleatoria de 12 sobres de café de una empacadora. Se encuentra
que el peso promedio de café de cada sobre es de 15.97 gramos con desviación estándar de 0.15 gr.
Los empacadores afirman que el peso neto promedio mínimo de café es de 16 gr por sobre. ¿Puede
rechazarse esta afirmación con un nivel de significación del 5%?
Solución
1)  Hipóte
 Hipótesis
sis  H 0 :    16 onzas
 H 1 :    16 onzas

 
2)  Nivel  de  significación :    0.05

   X     15.97  16
3) Variable estadística : T        T     0.69
S  0.15
n 12

4) Re gla de decisión : Re chazaremos  H 0  si T   V t 


en donde V t   1.7959 (Valor  hallado en la tabla t  de Student ) con n  1  grados de libert 
 Por  lo tan to la decisión  será no rechazar  la hipótesis  H 0

5) Conclusión : No tenemos razones suficien


 suficiente
te s como  para rechazar  tal  afirmación.

Ej
Ejem
empl 3.-- Cuando funciona correctamente; un proceso produce frascos de mermelada, cuyo
ploo 3.
contenido pesa en promedio 200 gramos. Una muestra aleatoria de 9 frascos de una remesa presentó
los siguientes pesos (en gramos) para el contenido:
214 197 197 206 208 201 197 203 209
Contrastar la hipótesis nula, de que el proceso está funcionando correctamente, al nivel del 5%.
Solución
1)  Hipó
 Hipótesi
tesiss  H 0 :    200  gram
 gramos
os

 H 1 :    200  gram


 gramos
os
 
2)  Nivel  de  significación :    0.05

111

   X     203.56  200


3) Variable estadística : T        T    1.74
S  6.13
n 9

4) Re gla de decisión: Re chazaremos  H 0  si T    V t  o T   V t 


en donde V t   30 6 ( Valor hallado en la tabla t  de Student ) con n  1  gra dos de liberta
2.306

 Por  lo tan to la decisión  será no rechazar  la hipótesis  H 0

5) Conclusión: Los datos recogidos en la muestra  propo


 proporcion
rcionan evidencia  sufi cientecomo  par
 paraa
 sost ener que el   proceso está bajo control .

Ejemploo 4.- En el pasado una planta química ha producido un promedio de 1,100 kg/día de un
Ejempl
compuesto. Los archivos del año pasado en base a 260 días de operación muestran lo siguiente:
 X   1,060 kg  / día     S   340 kg 

  Se desea saber si el promedio de producción diaria ha bajado significativamente durante el


  año pasado. Use α = 0.05

  Solución: Utilizaremos la variab


variable
le Z por ser la mu
muestra
estra muy grande

1)  Hipó
 Hipótesis
tesis  H 0 :    1,100 kg 
 
 H 1 :    1,100 kg 

 
  2)  Nivel  de  significación :    0.05

 X     1,060  1,100


3) Variable estadística :  Z        Z     1.897
  ˆ
  340
n 260

4) Re  gla de decisión : Re chazaremos  H 0  si  Z    V t 


 
en donde V t    1.645 ( Valor  hallado en la tabla normal  es tan darizada )

 Por  lo tan to la decisión  ser á rechazar  la hipótesis  H 0

5) Conclusión : Lo
 Loss datos de la muestra evidencian que
qu e la  pro
 produ
du cci
cción
ón bajó  sig nific
ni ficat 
at ivamente

Ejemplo 5.- Se ha valorado el tiocianato en el plasma de los individuos de una muestra formada por 
38 fumadores y se ha observado una media de 1.1 mg/l y una desviación estándar de 0.4 mg. El
tiocianato en el plasma de la población adulta presenta una media de 0.9 mg/l.
¿El consumo de tabaco está relacionado con el nivel de tiocianato en el plasma? Use α = 0.05
 Solución:
Sea X la variable aleatoria que denota la cantidad de tiocianato en el plasma. Se supone que la
variable X se distribuye normalmente con media µ y varianza σ 2 desconocida.
1)  Hipót
 Hipótesis
esis  H 0 :    0.9 mg 
 H 1 :    0.9 mg 

112

 
2)  Nivel  de  significación :    0.05

   X     1.1  0.9


3) Variable estadística : T       T    3.08
S  0.4
n 38

4) Re  gla
 gl a de decisión: Re chazaremos  H 0  si T   Vt 
en donde Vt   1.6871 (Valor  hallado en la tabla t  de Student ) con n  1  gr
 grad
ados
os de libertad 

 Por  lo tan to la decisión  será rechazar  la hipótesis  H 0

5) Conclusión : Existe evidencia sufici


 suficiente
ente como  para concluir que el  consumo de tabaco está
relacionad o con el  nivel de tiocianato en el   plasma

Ejemploo 6.- Las especificaciones de determinado medicamento exigen 30% de aspirina en cada
Ejempl
comprimido. Se toman aleatoriamente y analizan 16 comprimidos; la concentración media de
aspirina es 30.4% con desviación estándar de 0.8%. ¿El fármaco, cumple las especificaciones a nivel
de significación de 0.01?
Solución:
1)  Hipótesis  H  :    30
0
 H 1 :    30

 
2)  Nivel  de  significación :    0.01

   X     30.4  30
3) Variable estadística : T        T    2
S  0.8
n 16

4) Re gla de decisión : Re chazaremos H si T   V o T  V 


0 t t 

en donde V t 
 2.9467 (Valor hallado en la tabla t de Stud
udeent ) con n  1 grados de libertad 

 Por  lo tan to la decisión  será no rechazar  la hipótesis  H 0

5) Conclusión :Tenemos razones sufuciente s como  para concluir que el    fármaco  si cumple
con las especificaciones establecid as.

PRUEBAS DE HIPÓTESIS ACERCA DE UNA SOLA


PROPORCIÓN

En muchos problemas prácticos, queremos contrastar hipótesis sobre la proporción de elementos de


una población que poseen cierto atributo. La inferencia sobre la proporción poblacional se basa en la
 proporción de individuos
individuos de una muestra aleatoria que
que poseen el atributo de interés.
interés.
Para
Para eva
evalua
luarr la mag
magnit
nitud
ud de la difere
diferenci
nciaa ent
entre
re la pro
propor
porció
ciónn mue
muestr al (  pˆ )   y la proporción
stral
 poblacional (p)irsupuesta,
nq ≥ 5) es dec
decir esroximadamente.
necesario que la muestra aleatoria sea lo suficientemente grande (np o
n ≥ 100 aproximadamente.
ap
La variable estadística para esta prueba es:

113

   pˆ   p
 Z  
 pq
n

Ejemplo 1.- Una industria lechera está estudiando la posibilidad de cambiar sus botellas para la
leche por envases de plástico; pero el cambio no se hará a no ser que por lo menos 70% de sus
clientes lo prefieran. Cuando se ha hecho una encuesta a 200 de sus clientes, 120 de ellos están a
favor del cambio. ¿Hará el cambio de envases a un nivel de significancia de 0.05?

Solución:
1)  Hipóte
 Hipótesis
sis  H 0 :  p  0.7
 H 1 :  p  0.7

 
2)  Nivel  de  significación :    0.05

 pˆ   p 0.6  0.7


3) Variable estadística :  Z       Z     3.08
 pq 0.7 x0.3
n 200

4) Re  gla de decisión : Re chazaremos  H 0  si  Z    V t 

en donde V t    1.645 ( Valor  hallado en la tabla normal  es tan darizada )

 Por  lo tan to la decisión  será rechazar  la hipótesis  H 0

5) Conclusión : No tenemos  suficiente razón como  para  sugerir  se haga el  cambio de envase

Ejemplo 2.- Un fabricante de lavadoras automáticas produce un modelo particular en tres colores A,
B y C. De las primeras 1,000 lavadoras vendidas, se nota que 400 eran del color A. ¿Concluiría que
los clientes tienen una preferencia por el color A? Use α = 0.01

Solución:
1)  Hipót
 Hipótesis
esis  H 0 :  p  0.33
 H 1 :  p  0.33

 
2)  Nivel  de  significación :    0.01

 pˆ   p 0.4  0.33


3) Variable estadística :  Z       Z    4.707
 pq 0.33 x 0.67
n 1,000
114

4) Re  gla de decisión : Re chazaremos  H 0  si  Z   V t 

en donde V t   2.33 ( Valor  hallado en la tabla normal  es tan darizada )


 Por  lo tan to la decisión  será rechazar  la hipótesis  H 0

5) Conclusión :  Los datos muestranevidencia mas que suficient


 suficiente
e como  para concluir que los
clientes tienen mayor   preferencia  por  el  color   A

Ej
Ejem
empl
ploo 3.
3.-- De una lista de 2,000 clientes de un banco comercial se seleccionó una muestra
aleatoria para obtener opinión acerca del servicio. En la muestra se halló que 215 no tenían quejas
del servicio, 25 tenían quejas y 10 no opinan al respecto. Tradicionalmente el 5% tenían quejas del
servicio, sin embargo, se cree que ahora este porcentaje aumentó. ¿Cuál es la situación actual si se
quiere una probabilidad de 0.008 de cometer error de tipo I?
Solución:
1)  Hipót
 Hipótesis
esis  H 0 :  p  0.05
 H 1 :  p  0.05

 
2)  Nivel  de  significación :    0.008

ˆ   p
 p 25
3) Variable estadística :  Z   en donde ˆ 
 p  0.10
   n 
 pq   N  250
 
n    N   

0.10  0.05
  Z    3.88
   250 
0.05 x 0.95  2,000
 
250   2,000  

4) Re  gla de decisión : Re chazaremos  H 0  si  Z   V t 

en donde V t   2.41 ( Valor  hallado en la tabla normal  es tan darizada )


 Por  lo tan to la decisión  será rechazar  la hipótesis  H 0

5) Conclusión :  La muestra está evidenciando que el   porcenta


 porcentaje
je de quejas a aumentado

Ejemplo 4.- Una compañía farmacéutica afirma que un fármaco que elabora alivia los síntomas del
resfriado común durante un período de 10 horas en el 90% de quienes lo ingieren. En una muestra
aleatoria de 400 personas que ingirieron el fármaco, 350 aliviaron durante 10 horas. Al nivel de
significación de 0.05 la afirmación del fabricante es exacta?

Solución:
1)  Hi
 Hipó
pótes
tesis
is  H 0 :  p  0.9
 H 1 :  p  0.9

115

 
2)  Nivel  de  significación :    0.05

ˆ   p
 p 0.875  0.9
3) Variable estadística :  Z       Z     1.67
 pq 0.9  x 0.1
n 400

 
4)  Decisión :  No rechazar   H 0  ya que V t   1.96

5) Conclusión : Se tiene razones suficiente s como  para estar  de acuerdo con


la afirmación del   fabricante.

OTRA FORMA: Usan


Usando
do la aproximación d
dee la Binomial a la Normal
Normal

 X   n  p 350  360


 Z      1.67
n  p q 400  x 0.9  x 0.1

Ejercicios Propuestos

1.- El jefe de la Biblioteca


Biblioteca Especializada
 Especializada de la Facultad de Ingeniería
Ingeniería Eléctrica
 Eléctrica y Electrónica
Electrónica de
 de la
UNAC manifiesta que el número promedio de lectores por día es de 350. Para confirmar o no este
supuesto se controla la cantidad de lectores que utilizaron la biblioteca durante 30 días. Se considera
el nivel de significancia de 0.05

Datos:

Día Usuarios Día Usuarios Día Usuario

1 356 11 305 21 429

2 427 12 413 22 376

3 387 13 391 23 328

4 510 14 380 24 411

5 288 15 382 25 397

6 290 16 389 26 365


7 320 17 405 27 405

116

8 350 18 293 28 369

9 403 19 276 29 429

10 329 20 417 30 364

2.- Los siguientes valores son las presiones sistólicas sanguíneas (en mm de Hg) de 12 pacientes que
experimentan terapia con drogas debido a que padecen de hipertensión.

  183, 152, 178, 157, 194, 163, 144, 114, 178, 152, 118, 158

¿Puede concluirse a base de estos datos que la media de la población es menor que 165?.
Utilice  = 0,05.

3.- Caso: Nivel de hemoglobina de la gestante

INTRODUCCIÓN
El nivel bajo de hemoglobina
hemoglobina en gestantes durante el embarazo es pprevisible
revisible por las modif
modificaciones
icaciones
fisiológicas que suceden en el sistema circulatorio materno al final del embarazo, modificaciones a
las que se tiene que adaptar el cuerpo de la gestante.  El nivel bajo de hemoglobina en la sangre de la
gestante puede conllevar a muchas patologías durante el embarazo, parto y puerperio,
puerperio, entre ellas el
 parto pretérmino.

En el Hospital Santa Rosa se observa que la mayoría de las gestantes que acuden en el tercer 
trimestre presentan un nivel de hemoglobina por debajo de lo normal, así como también se reportan
con frecuencia casos de amenaza de parto pretérmino; por lo cual se desea realizar un estudio para
evaluar la relación que existe entre el nivel de hemoglobina y el parto pretérmino.

ANTECEDENTES:

La Encuesta Demográfica de Salud Familiar 2000 (ENDES 2000) reporta un 38.6% de la


l a prevalencia
de anemia (hemoglobina < 11g/dl.) en la mujer gestante . La OMS considera a la anemia como un
factor que aumenta el riesgo de parto pretérmino en la gestante.

Por ello el Ministerio de Salud en coordinación con el Centro Latinoamericano de Perinatologìa


(CLAP), establecen pautas para el control pre natal, una de ellas es la suplementación de hierro a
todas las gestantes que acuden al control, pero esto aún no se logra inclusive en un hospital de
referencia.

 PLANTEAMIENTO DEL PROBLEMA:

El Jefe del Ser


Servic
vicio
io de Gin
Gineco
eco-Ob
-Obste
stetri
tricia
cia del Ho
Hospi
spital
tal San
Santa
ta Rosa desea sabe
saberr si el niv
nivel
el de
hemoglobina en promedio, de las ggestantes
estantes en el tercer trimestre con diagnós
diagnóstico
tico de parto pre-términ
pre-términoo
es menor a 11 mg / dl; para lo ccual
ual toma una muestra aall azar de 30 gestantes con dicho de diagnós
diagnóstico,
tico,
con un nivel
nivel de significancia del 5%.
BASE DE DATOS: Nivel de Hemoglobina en el
el 3er. Trimestre

117

10.9 11.2 9.8 11.6 9.9 10.0 11.2 10.2 10.8 9.5 10.0 10.9 11.5 10.4 10.9
10.3 11.7 11.2 9.8 10.4 11.4 11.3 10.5 10.2 11.1 10.6 9.9 8.9 10.8 9.5

4.- Un fabricante de cereales afirma que el peso promedio de cada caja de cereal es de 500 gramos.
¿Los datos que a continuación
continuación se le dan apoyan la afir
afirmación
mación del fabricante? Pruebe con α = 0.10

 
506, 508, 499, 503, 504, 510, 497, 512,
514, 505, 493, 496, 506, 502, 509, 496

5.- Los siguientes datos corresponden a los ppesos


esos en Kg de 1155 hombres escogidos al azar: 72, 68,
63, 75, 84, 91, 66, 75, 86, 90, 62, 87, 77, 70, 69.

Pruebe la Ho :     74 con un nivel de significancia de 0.05.

6.-Los húmeros de animales de la misma especie tienden a tener aproximadamente las mismas
razones longitud/anchura. Cuando se descubren húmeros fósiles, los arqueólogos con frecuencia
 pueden determinar
de los huesos. la especie
Se sabe a la queApertenece
que la especie tiene unaelrazón
animal examinando
media las razones
de 8,5. Suponga que longitud/anchura
se desenterraron
41 húmeros fósiles en una excavación del África Oriental, donde se cree que habitó la especie A. Se
midieron las razones longitud/anchura de los huesos y se presentan en la
l a siguiente tabla:

10,73 8,89 9,07 9,2 10,33 9,98 9,84 9,59


8,48 8,71 9,57 9,29 9,94 8,07 88,,37 6,85
8,52 8,87 6,23 9,41 6,66 9,35 8,86 9,93
8,91 11,77 10,48 10,39 99,,39 9,17 9,89 8,17
8,93 8,8 10,02 8,38 11,67 8,3 9,17 12,0
9.38
Queremos probar si los huesos desenterrados pertenecen a la especie A con un nivel de significación
de un 5%.

7.- Las especificaciones de construcción en cierta ciudad requieren que las tuberías de desagüe
empleadas en áreas residenciales tengan una resistencia media a la ruptura de más de 2.500 libras por 
 pie lineal. Un fabricante que quisiera proveer a la ciudad de tubos para desagüe ha presentado una
licitación junto con la siguiente información adicional: un contratista independiente seleccionó al
azar siete secciones de los tubos del fabricante y determinó su resistencia a la ruptura. Los resultados
(libras por pie lineal) son los siguientes:
2610 2750 2420 2510 2540 2490 2680

¿Hay suficientes pruebas para llegar a la conclusión de que los tubos de desagüe del fabricante
cumplen con las especificaciones requeridas? Utilice un nivel de significación de un 10%.

8.- Un fabricante de cigarrillos afirma que sus cigarrillos no contienen más de 25 mg. de nicotina.
Una muestra de 16 cigarrillos tiene una media de 26.4 y una desviación estándar igual a 2.
¿Proporcionan estos datos suficiente evidencia para no estar de acuerdo con la afirmación del
fabricante? Use α = 0.05
9.- Al investigar prácticas comerciales pretendidamente desleales, una comisión estatal toma una
muestra aleatoria de 49 barras de chocolate de “9 onzas” de un gran despacho. La media de los pesos

118

muestrales fue de 8.94 onz y la desviación estándar 0.12. Mostrar que a un nivel de significación de
0.05, la comisión tiene fundamentos para proceder contra el fabricante.

10.- Se encuentra que el número promedio de empleados para una muestra de 50 empresas de una
industria específica es de 420.4 con una desviación estándar de 55.7 Existe un total de 380
empresas en ese ramo industrial. Antes de recolectar los datos, se planteó la hipótesis de que el
número promedio de empleados por empresa en esa industria no era superior a 408.
Pruebe esa hipótesis con un nivel de ssignificación
ignificación de 0.05.
11.- Al gerente del departamento de crédito de una compañía petrolera le gustaría determinar si el
saldo promedio mensual en contra de los tarjetahabientes
tarjetahabientes es igual a $75. Un auditor selecciona una
muestra aleatoria de 100 cuentas y encuentra que la deuda promedio es de $83.4 con desviación
estándar de la muestra de $23.65. Utilizando el nivel de significación de 0.05 ¿Debería el auditor 
llegar a la conclusión de que existe evidencia de que el saldo promedio es diferente de $75?

12.- Las cajas de un cereal producidas en una fábrica deben tener un contenido de 16 onzas. Un
inspector tomó una muestra que arrojó los siguientes pesos en onzas:
15.7 15.7 16.3 15.8 16.1 15.9 16.2 15.9 15.8 15.6
Indicar si es razonable que el inspector, usando un nivel de significación del 5 % ordene se multe al
fabricante.

13.- En una oficina gubernamental se investiga a un empacador de pescado congelado. Los


empaquetes que utiliza indican que contiene 12 onzas de pescado, en tanto que se han recibido
quejas de que ello no es cierto. La oficina adquiere 100 paquetes de pescado procesado por esta
compañía y encuentra que:
100 100

 X   1,150
i 1
i    X 
i 1
i
2
 13,249.75

Con base a esta muestra y con  = 0.01. ¿Cuál es su conclusión?

14.- Ante un reclamo sobre el tiempo de realización de una tarea, los empleados de una compañía
sostienen que en promedio ellos completan la tarea en a lo más 13 minutos. Si Ud. Es el gerente de
la compañía.
¿Qué conclusión obtiene si para una muestra de 400 tareas se obtiene un promedio de tiempo de
terminación de 14 minutos? Se sabe que por información de trabajos similares, que los tiempos de
ejecución de la tarea tiene una distribución normal, con desviación estándar de 10 min.
Use  = 0.05

15.- Un vendedor de seguros de vida dice que en promedio un trabajador en la ciudad de Lima
Metropolitana tiene no más de S/ 25,000 de seguro de vida personal. Para probar esto, muestrea
aleatoriamente 100 trabajadores en L.M. y encuentra que esta muestra de trabajadores promedia
S/ 26,650 de seguro de vida personal y que la desviación estándar es S/ 12,000.
Determine si la prueba muestra suficiente evidencia para rechazar la hipótesis nula planteada por el
vendedor. Use  = 0.05

16.- Al estudiar si conviene o no una sucursal en la ciudad de Tarapoto, la gerencia de una gran
tienda comercial de Lima, establece el siguiente criterio para tomar una decisión. Abrir la sucursal
solo si el ingreso promedio familiar mensual
mensual en dicha ciudad es no menos de $500 y no abrirla en
caso contrario. Si una muestra aleatoria de 100 ingresos familiares de esa ciudad ha dado una
media de $480. ¿Cuál es la decisión a tomar al nivel de significación del 5 %
119

17.- Los sacos de café que recibe un exportador de cierto proveedor deben tener un peso promedio
de 100 kilos. Un inspector tomó una muestra de 50 sacos de un lote de 500 sacos de café
encontrando una media de 99 kilos y una desviación estándar de 3 kilos.
Con  = 0.01 ¿Es razonable que el exportador rechace el lote de sacos de café?.

18.- Un investigador está realizando una prueba para determinar si una nueva medicina tiene el
efecto colateral de elevar la temperatura del cuerpo. Se entiende que la temperatura del cuerpo
humano se distribuye normalmente con una media de 98.6 ºF. Se administra la nueva medicina a 9
 pacientes, se toman las temperaturas y se obtiene una media de 99 ºF y una desviación estándar de
0.36 ºF.¿Debería permitirse a la compañía poner a la venta la nueva medicina, si el nivel de
significación se especifica en 0.01?

19.- Cinco hipertensos reciben un nuevo fármaco que disminuye la presión arterial en:
14 25 13 18 20 ppuuntos respectivamente.
¿El nuevo fármaco disminuye la presión arterial en por lo menos 20 puntos?

20.- Se conoce que el valor medio de protombina en la población normal es de aproximadamente


20 mg/100ml de plasma. Una muestra de 625 pacientes con deficiencia de vitamina K presenta un
nivel medio de protombina de 18.50 mg/100ml. La desviación estándar de la muestra es 4 mg.
¿Tienen los pacientes con deficiencia de vitamina K un nivel significativamente más bajo de
 protombina que la población general?

21.-
21.- Se llevó a cabo un estudio sobre nutrición en un país en desarrollo. Una muestra de 500
campesinos adultos reportó un consumo diario de 1985 calorías con una desviación estándar de 210.
¿Puede concluirse a partir de estos datos que la media de la población es menor que 2,000?
Use α = 0.05

22.- Antes el número medio de ataques de angina de pecho por semana entre los pacientes era de
1.03. Se está probando un nuevo medicamento y se espera que reduzca esta cifra. Los datos se
obtienen mediante la observación de una muestra de 20 pacientes que están utilizando el nuevo
fármaco.

1 3 0 1 1 1 0 2 2 0 0 1 0
0 0 1 1 1 1 0

¿Puede rechazarse la hipótesis de investigación al nivel 0.01?

23.- Un productor de cápsulas de uña de gato envía al mercado en promedio 1,000 por semana. La
demand
dem andaa tie
tiene
ne distr
distribu
ibució
ciónn nor
normal
mal;; sin emba
embargo
rgo en un estud
estudio
io rec
recien
iente,
te, una mues
muestra
tra de 36
semanas dio una demanda promedio de 850 cápsulas y una desviación estándar de 360 cápsulas.
En el nivel de significación de 0.05. ¿Es posible concluir que la media de la demanda semanal está
 bajando?

24.- El gerente de un laboratorio farmacéutico quiere determinar si cierto somnífero aumenta las
horas de sueño en las personas. Para este fin, selecciona una muestra aleatoria de 10 pacientes y
registra el número de horas de sueño ganadas al aplicar el somnífero a cada paciente; los resultados
fueron:

Paciente: 1 2 3 4 5 6 7 8 9 1100
 Nº de horas: 1.2 -1.3 1.7 0.9 2.4 0.8 -1.0 1.8 2.0 2.1
Suponiendo que las horas de sueño ganadas con el somnífero en cada paciente es una variable
aleatoria con distribución normal. Al nivel de significancia del 5%. ¿Hay prueba de que el
somnífero aumenta las horas de sueño?

120

25.- Se sospecha que una nueva medicina es eficaz en menos del 90% para curar cierta enfermedad,
 pero el laboratorio que la fabrica cree que es efectiva por lo menos en un 90%. En una muestra de
400 personas que tenían la enfermedad, 320 se curaron con la aplicación de la medicina. ¿Se ha de
concluir que la medicina es eficaz por lo menos en un 90%? Use α = 0.05

26.- Un fabricante de televisores afirma que su póliza de garantía que en el pasado no más de 10%
de sus aparatos de televisión necesitaron reparación durante sus primeros dos años de operación.
Con el fin de probar la validez de esta afirmación, una agencia de pruebas del gobierno selecciona
una muestra
muestra de 100 apara
aparatos
tos de televi
televisió
siónn y enc
encuen
uentra
tra que 14 de ellos
ellos req
requir
uirier
ieron
on alg
alguna
una
reparación dentro de los dos primeros años de operación.
Utilizando un nivel de significación de 0.01
¿Es válida la afirmación del fabricante o existe evidencia de que ésta no es válida?

27.- Una cadena de tiendas de ropa está considerando la propuesta de un fabricante sobre la venta
de un gran lote de camisas, a precios de liquidación.
El fabricante afirma que no más del 2 % de las camisas tienen defectos de fabricación. Los
representantes de la cadena inspeccionan una muestra de 400 camisas del lote y encuentran 15
camisas con defectos de fabricación.
¿Deberá la cadena rechazar la propuesta del fabricante, si ha decidido comprar el lote, a condición
de que lo afirmado por el fabricante sea cierto con una probabilidad de 1 en 10?
121

PRUEBAS DE HIPÓTESIS ACERCA DE LA DIFERENCIA DE


DOS MEDIAS POBLACIONALES

CASO: Muestras independientes provenientes de dos poblaciones


normales con varianzas desconocidas e iguales
Si dos muestras aleatorias e independientes de tamaños n 1  y n2 respectivamente, se sacan de dos
 poblaciones normales con medias µ1  y µ2 y con varianza común pero desconocidas, entonces la
variable aleatoria

( X 1    X 2 )  (  1   2 )


T  
(n1  1) S 1  ( n2  1) S 2   1 1  
2 2
  
n1  n2  2  n1 n2  

Tiene distribución T con n 1 + n2 – 2 grados de libertad.


li bertad.

El
 objetivo
  odello análisis
que es es
que el demcontrastar
lomism
lomis o   la 
 hipótesis
0  de que las medias poblacionales son iguales:
1 2 1 2

Nota.- En caso de existir duda sobre la igualdad de las varianzas debe llevarse a cabo la prueba de
igualdad de varianzas.

La prueba T de Student para muestras independientes es una técnica de análisis frecuentemente


uti
utiliz
lizada
ada par
paraa ana
analiz
lizar
ar dat
datos
os.. Sir
Sirve
ve par
paraa ave
averig
riguar
uar si dos gru
grupos
pos difier
difieren
en en alg
alguna
una var
variab
iable
le
cuantitativa de interés; así `por ejemplo, para comparar en una variable cuantitativa: un grupo
experimental y un grupo control, o dos grupos distintos. (hombres y mujeres: fumadores y no
fumadores; etc). Muestras independientes es sinónimo de grupos aleatorios; esto implica que se está
trabajando con dos grupos de sujetos distintos, aleatoriamente seleccionados de sus respectivas
 poblaciones

Ejemploo 1.- Un fabricante de cigarrillos anuncia que el contenido de alquitrán de los cigarrillos
Ejempl
marca B es menor que los de la marca A. Para probarlo se anotan los contenidos de alquitrán:
Ma rca A ( mg ) :
Mar 12 9 13 11 14
Marca B ( mg ) : 8 10 7

Utilice α = 0.05 para determinar si el anuncio es válido.

Solución

1)  Hip
 Hipótes
ótesis
is  H 0 :   A    B
 H 1 :   B    A

 
2)  Nivel  de  significación :    0.05
122

 
 

3) Variable estadístic a : T  
  X   B
  
  X  A      A    B 
( n A  1) S  A2  ( n B  1) S  B2   1 1  
  
n A  n B  2 n
   A n B  

Cálculos :  X  A  11.8  X  B  8.33 S  A2  3.7 S  B2  2.33

8.33  11.8
 T     2.64
4 ( 3.7 )  2 ( 2.33 )   1 1  
  
5 3 2   5 3  

 Por  lo tan to la decisión  será rechazar  la hipótesis  H 0

5) Conclusión :  El  anuncio es válido

Ejemplo 2.-  Se aplicó un mismo test a dos grupos de personas con el objeto de analizar si existe o
no diferencia entre
entre las puntuaciones medias; elija α = 0.05

Grupo I: 26 2244 1188 1177 1188 2200 1188


Grupo II: 38 26 24 24 30 22

Solución

1)  Hi
 Hipót
pótesi
esiss  H 0 :  1   2
 H 1 :  1   2

 
2)  Nivel  de  significación :    0.05

3) Variable estadística : T  
    X 
1   X 2     1   2 
( n1  1) S 1  ( n2  1) S 2   1 1  
2 2

  
n1  n2  2 n
  1 n 2  

 X 1  20.14  X 2  27.33 S 1  12.143 S 2  34.667


2 2
Cálculos :

20.14  27.33
 T     2.73
6 (12.143)  5 ( 34.667 )   1 1  
  
7 6 2   7 6  
123

4) Re  gla de decisión : Re chazaremos  H 0  si T    V t  o T   Vt 

en donde V t   2.201 ( Valor  hallado en la tabla t  de Student  con 11  grados de libertad  )
 Por  lo tan to la decisión  será rechazar  la hipótesis  H 0

5) Conclusión : Sí  existe diferencia  signifi


 significat 
cat iva entre las  puntaci
 puntacione
one s observadas en ambos  gru

Ejemplo 3. La Directora de presupuesto de una cierta Compañía desea comparar los gastos diarios
(en dólares) respecto al transporte del equipo de ventas y del personal de cobranza. Recopiló la
siguiente información muestral:

Ventas ( $ ) 131 135 146 165 136 142


Cobranza ( $ ) 130 102 129 143 149 120 139

Al nivel de significancia de 0.05 ¿Puede concluirse que los gastos medios diarios del equipo de
ventas son mayores?

H0: µ1 = µ2
H1: µ1 > µ2
α = 0.05
Cálculos
 x1  14
142
2.5  x2  130.3
 s1  149.9  s2  24
2 2
249
9.24

142.5  130.3 12.2


T     1.534
5 (149.9)  6 (249.24)  1 1  7.954
  
672  6 7 

Según la tabla T de Stud


Student
ent con 11 grados de liberta
libertadd y para α= 0.05 se tiene un valor
t = 1.7959

La regla de decisión será rechaz


rechazar
ar H0  si: T > 1.7959. Por lo tanto:

Decisión.- No rechazar H0

Conclusión.- Los datos de la muestra evidencian que los gastos promedios diarios en
transporte del equipo de ventas y del personal de cobranza son iguales.
CASO: Muestras dependientes o datos apareados

124

En este caso se supone que las muestras aleatorias no son independientes y se tomaron
aleatoriamente de poblaciones normales. En realidad; no se trata de dos grupos aleatorios,
sino de un solo grupo de sujetos al que se toman dos medidas o una medida en dos
momentos distintos. No hay necesidad de probar la igualdad de varianzas ya que es una sola
la población; así por ejemplo:

• Cuando un mismo test es administrado al mismo grupo de personas en dos ocasiones


distintas (antes y después de un tratamiento)
tr atamiento)
•  Dos productos son evaluados por un conjunto de degustadores o catadores.
•  Dos conjuntos de mediciones de las mismas personas; de mediciones tomados a
hermanos, mellizos o gemelos.

La variable estadística de la prueba es:


n


 d  i

T   en donde d   i 1
S d  n
n
2
  n  
n
  d i 
 d 2   i 1  
i n
S  
2 i 1

n 1

Ejemplo 1.- Un fabricante de productos alimenticios hace una prueba previa con cierto tipo de salsa
envasada, que puede preparar en una forma más espesa (A) o en otra forma menos espesa (B). Para
medir la preferencia por uno y otro tipo de salsa, utiliza una muestra de diez amas de casa, quienes
manifiestan sus preferencias por dichos tipos de salsa, con los siguientes resultados en puntajes

Salsa A ( ptos ): 3 1 5 2 0 4 3 3 2 5
Salsa B ( ptos ): 2 4 4 7 3 4 6 5 5 8
Al nivel de significación del 5% ¿Se puede concluir que el tipo de salsa menos espesa ( B ) tiene
mayores oportunidades de funcionar en el mercado, que el tipo más espeso ( A )?.

Solución

1)  Hip
 Hipótes
ótesis
is  H 0 :   A    B
 H 1 :   A    B

 
2)  Nivel  de  significación :    0.05

3) Var
Variab
iable
le es
estad
tadíst
ística
ica ddee la pprue
rueba:
ba:
125


T  
S d 
n

Salsa A ( ptos ): 3 1 5 2 0 4 3 3 2 5
Salsa B ( ptos ): 2 4 4 7 3 4 6 5 5 8
Diferencias: 1 -3 1 -5 -3 0 -3 -2 -3 -3
10 10

 d    20
i 1
i    d 
i 1
i
2
 76

Cálculos
76 
  20  2

10  20
S d    4  d    2 S d   2
2

9 10

d  2
 Luego
 Luego T      3.16
S d  2
n 10

4) Re  gla de decisión : Re chazaremos  H 0  si T    V t 

en donde V t    1.8331 ( Valor  hallado en la tabla t  de Student  con 9  grados de libertad  )
 Por  lo tan to la decisión  será rechazar  la hipótesis  H 0

5) Conclusión :  Las muestras  proporcion an evidencia  sufic


 suficiente
iente como  para concluir  que
la  salsa  B tiene mayor  oportunida d  de venta

Ejemplo 2.- Se desea analizar el efecto de una droga sobre la presión de la sangre para lo cual se
utiliza una muestra de 10 personas, obteniendo los siguientes datos (presión codificada). Utilice α =
0.05

Antes de la droga 14 15 12 9 14 12 10 9 13 12
Después de la droga 10 12 12 7 15 10 7 8 11 11

Solución

1)  Hi
 Hipót
pótesis
esis  H 0 :   A    D
 H 1 :   A    D

 
2)  Nivel  de  significación :    0.05

3) Var
Variab
iable
le es
estad
tadíst
ística
ica ddee la pprue
rueba:
ba:


T  
S d 
n

126

 
 

Antes: 14 15 12 9 14 12 10 9 13 12
Después: 10 12 12 7 15 10 7 8 11 11
Diferencias: 4 3 0 2 -1 2 3 1 2 1

Cálculos
10 10

d i  17 d i2  49

i 1   
i 1

49 
 17  2

10  2.233 17
S d    d    1.7 S d   1.494
2

9 10

d  1.7
 Luego
 Luego T     3.6
S d  1.494
n 10

4) Re  gla de decisión : Re chazaremos  H 0  si T   V t 

en donde V t   1.8331 ( Valor  hallado en la tabla t  de Student  con 9  grados de libertad  )
 Por 
 Po r  lo tan to la decisión  será rechazar  la hipótesis  H 0

5) Conclusión :  Lo
 Loss resultados de la muestra evidencian qu
quee la droga  sí  tuvo efecto
 signifi
 sig nifica
cat 
t ivo  pa ra reducir  la  presi
 presión
ón  sang
 sa nguín
uín ea
127

Ejercicios Propuestos

1.- En un estudio sobre


sobre cáncer pulmonar se dispone del contenido ddee nicotina de varios cigarrillos
tomados de dos marcas diferentes:

Marca X : 17; 20; 20; 23


Marca Y : 18; 20; 21; 22; 24

Utilizando el nivel de significación de 0,05, ¿puede concluirse que el contenido nicotínico de


ambas marcas de cigarrillos no es el mismo?

2.- Dos empresas dedicadas a servir comidas rápidas a domicilio han alcanzado una notable
 popularidad en cierta ciudad. Se pide a siete clientes habituales de cada empresa que informen sobre
los tiempos (en minutos) que ha tardado su pedido, obteniéndose los siguientes resultados:

Empresa A: 15 23 30 22 22 29 25
Empresa B: 12 21 25 22 15 21 15

Con esta información y con un nivel de significación del 1%. ¿Se puede considerar que los tiempos
de entrega de los pedidos son iguales en ambas empresas?

3.- Se desea comparar la calidad de dos nuevas clases de trigo. Para ello se toman 10 fincas al azar,
 plantando en cada una de ellas y en dos partes distintas ambas clases. Los datos sobre la producción
en las 10 fincas son los siguientes:

Clas e A: 57 49 60 55 57 48 50 61 52 56
Clase
Clase B: 55 48 58 56 54 48 52 56 50 58

¿Podemos aceptar que la producción es la misma para ambas clases de trigo con un 95% de
confianza, suponiendo que las distribuciones son normales?

4.- Los datos que siguen corresponden a 10 hombres entre 45 y 55 años. Se trata de lecturas del
colesterol tomadas tras 12 horas de ayuno y repetidas una hora después de comer.

S
Auyjuentoo 180 210 3195 4220 5210 6190 7225 8260 9200 12010
Después 185 225 200 225 200 180 235 265 195 220

  ¿Hubo un incremento significativo del colesterol después de la comida?

5.- Se dividieron 30 pacientes de epilepsia en dos muestras aleatorias iguales. Al grupo A se les dio
un tratamiento que incluía dosis diarias de vitamina D. Al grupo B se le dio el mismo tratamiento
excepto que no recibió vitamina D sino un placebo en su lugar. Las medias del número de ataques
experimentados durante el tratamiento por los dos grupos fueron:

 X  A  15  X  B  24   S  A  8 S B  12


  2 2
 

¿Hay suficiente evidencia que indique que la vitamina D reduce el número de ataques epilépticos?
Use α = 0.05 Rpta. La vitamina D si reduce el Nº de ataques
ataques epilépticos
6.- Los siguientes datos fueron recabados en un experimento que fue diseñado para verificar si existe
una diferencia sistemática en los pesos en gramos obtenidos con dos diferentes balanzas:
128

Ba
Bala
lanz
nzaa I: 11.2
11 .233 14.3
14 .366 8.
8.33
33 10.5
10.500 23
23.4
.422 9.15
9. 15 13
13.4
.477 6.47
6. 47 12
12.4
.400 19
19.3
.388
Balanza II: 11.27 14.41 8.35 10.52 23.41 9.17 13.52 6.46 12.45 19.35

¿Existe diferencia significativa entre los pesos obtenidos con las dos balanzas? Use  = 0.05

7.- Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y mujeres para realizar 
determinada tarea. Una muestra aleatoria de 9 hombres y 8 mujeres han dado los siguientes tiempos
en minutos:

Hombres: 12 28 10 25 24 19 22 33 17
Mujeres: 16 20 16 20 16 17 15 21

¿Se puede concluir que los hombres emplean mayor tiempo que las mujeres para hacer la ttarea?
area?
Use  = 0.05

8.- Se desea determinar el contenido de grasa en la carne para poder fijar su precio de venta al
consumidor. Una compañía empacadora de carne está considerando el uso de dos métodos diferentes
 para determinar el porcentaje de grasa. Ambos métodos fueron usados para evaluar el contenido de
grasa en doce diferentes muestras de carne. Los resultados se muestran en la siguiente tabla:


Méto
Método
todo
do A:
B: 224
24.1
3..17 28
28.1
27.1
.4 26
25.9 28
28.6
28.6
.2 23
23.2
23.2
.5 28
28.1
28.1
.4 24
24.2
24..26 25
25.7
25..74 22
22.8
22.8
.5 24
2 2254 28
27.2

¿Sugieren estos datos que los dos métodos difieren en su medición del contenido de grasa en la
carne? Use  = 0.05

9.- Un gerente de publicidad de una compañía de cereales para el desayuno desea determinar si un
nuevo envase podría aumentar las ventas del producto. Para probar la factibilidad de la nueva forma
del envase se seleccionó una muestra de 40 tiendas similares y se asignaron en forma aleatoria, 20 de
ellas como mercado de prueba de la nueva forma del envase, en tanto que las otras 20 continuarían
recibiendo el envase antiguo. Las ventas semanales durante el tiempo del estudio fueron las
siguientes:

 Nuevo Antiguo

Media = 130 cajas Media = 117 cajas


Desv. Estándar = 10 cajas Desv. Estándar = 12 cajas

Con α = 0.05. ¿La nueva forma del envase dio como resultado mayores ventas?

10.- Un investigador cree tener razón para creer que cierto medicamento aumentará el contenido de
hemoglobina en gr/100 ml para ello mide el contenido de hemoglobina de 8 sujetos antes y después
de la administración del medicamento.

Antes 10 9 1111 12 8 7 12 10
Después 12 11 13 14 9 10 12 14

Analice los datos y determine


determine el efecto del medicamento. Utilice α = 0.01
Rpta. El medicamento sí es efectivo
11.- Los siguientes datos son porcentajes de grasa encontrados en dos tipos de carne:

129

Carne A: 30 2266 3300 1199 2255 3377 2277 3388 2266 3311
Carne B: 40 34 28 29 26 36 28 37 35 42

¿Tienen las carnes diferente contenido de grasa? Use  = 0.05

12.- Un psicólogo desea verificar que cierto fármaco aumenta el tiempo de reacción a un estímulo
dado. Para una muestra de 4 individuos se obtuvieron los siguientes tiempos de reacción en décimos
de segundo, antes y después de inyectarse el fármaco:

Tiempo de reacción
Individuo Antes Después
1 7 13
2 2 3
3 12 18
4 12 13

Con un nivel de significación del 5 % realice una prueba para determinar si el fármaco aumenta
significativamente el tiempo de reacción.

13.- Se desea
músicos comparar
excedidos dos45dietas.
de peso; Se seleccionaron
integrantes de este grupo80 individuos
recibieron al azar
la dieta en otros
A, los una población
35 la dieta de
B.
Las pérdidas de peso en libras durante un período de una semana resultaron ser los siguientes:

Dietas Media muestral Varianza muestral


( lbs )
Dieta A 10.3 7.0
Dieta B 7.3 3.25

Usando α = 0.01. ¿Cuál dieta fue mejor en la reducción de peso?

14.- Se administran dos nuevos medicamentos a pacientes con un padecimiento cardíaco. El primer 
medicamento bajó la presión sanguínea de 16 pacientes en un promedio de 11 puntos con una
desviación estándar de 6. El segundo medicamento bajó la presión sanguínea de otros 20 pacientes
en un promedio de 12 puntos con una desviación estándar de 8.
¿Existe diferencia significativa entre los efectos de ambos medicamentos? Use α = 0.05
Rpta. No existe diferencia sign
significativa
ificativa

15.- Veinticuatro animales de laboratorio con deficiencia de vitamina D, se dividieron en dos grupos
iguales: El grupo I recibió un tratamiento consistente en una dieta que proporcionaba la vitamina D.
El grupo II no fue tratado. Al término del período experimental se hicieron las determinaciones del
calcio en el suero, obteniéndose los siguientes resultados:
GRUPO TRATADO GRUPO  NO TRATADO
 X 1  11.1mg / 100ml   X 2  7.8mg / 100ml 
S 1  1.5 mg  S 2  2.0 mg 

Suponiendo que las poblaciones son normales. ¿Existe diferencia significativa? Rpta. Sí 
130

16.- El tiempo de recuperación fue observado para pacientes al azar y sometidos a dos tipos distintos
de procedimientos quirúrgicos. Los datos son los siguientes:

 PROC
 PROCED
EDIMIE 
IMIE 
 NTO
 NTO  I   PROC
 PROCED
EDIMI
IMIE 

 NTO
 NTO  II 
n1  21 n2  23
 X 1  7.3  X 2  8.9
S 12  1.23 S 22  1.49

Presentan los datos suficiente evidencia para concluir que hay diferencia entre los tiempos medios de
recuperación de los dos procedimientos quirúrgicos?. Use α = 0.05

17.- Once estudiantes de medicina midieron la presión sanguínea del mismo paciente y repitieron la
medición al día siguiente. A continuación se listan las lecturas sistólicas en mmHg.

Día 1: 138 11330 11335 11440 11220 11225 11220 11330 11330 11444 11443
Día 2: 116 120 125 110 120 135 124 118 120 130 140

Con α = 0.05 ¿Existe diferencia significativa entre ambas mediciones?


131

Análisis de Varianza (ANOVA)


Términos básicos

Unidad experimental
Es el sujeto u objeto, intervalo de espacio o tiempo, sobre el que se experimenta o se aplica el
tratamiento.
Ejemplo:
En el campo industrial: el trabajador, una máquina, un lote de material.

Factor
Es una variable independiente de interés del experimentador, en la cual se desea estudiar su efecto
sobre la variable respuesta. En la gran mayoría de las investigaciones de tipo cualitativo o
cuantitativo, se trabaja con más de una variable independiente.

• Factor cualitativo:

 – Tipos de dietas de animales.


animales.
 – Marcas de fármacos
fármacos utilizados para el tratamiento de una enfermedad.

• Factor cuantitativo:

 – Cantidad de nutrientes de un tipo de alimento en diferentes cantidades.


cantidades.
 – Cantidad de megabytes de memoria en las computadoras.
computadoras.

Niveles de un factor
Son los diferentes tipos o grados específicos del factor que se tendrán en cuenta en la realización del
experimento. Los niveles de un factor reciben el nombre de “tratamientos”.

Ejemplo:

• En fármacos para la relajación muscular:


 Niveles: Innovar, Droperidol,
Droperidol, Fentanyl.
• En temperatura:
 Niveles: 40°C, 50°C,
50°C, 60°C.

Tratamientos
Un tratamiento es un efecto que se desea estudiar. Implica el nivel particular de
un factor que deben imponerse a una unidad experimental dentro del marco del
diseño seleccionado.
Ejemplo:
• Utilizar en el cultivo de trigo la variedad Buck Ponch.
• Utilizar el Droperidol como fármaco para la l a relajación muscular.

PRINCIPIOS BÁSICOS DE UN DISEÑO EXPERIMENTAL


Existen tres principios básicos:

• Repetición del experimento.


• Aleatoriedad.
Formación de bloques.

132

El modelo de clasificación de un solo factor completamente aleatorizado es:


 
Xij = µ + αi + εij (i = 1,2,………….k , j = 1,2,………………ni)
 
Xij Denota la j- ésima unidad experimental sujeta al i-ésimo tratamiento
µ : es la media general o media ttotal
otal
αi : es el i- ésimo tratamiento
εij : error experimental causados por todos los factores desconocidos.

En el modelo de clclasificación
asificación de un factor completamente aleatorizado los valores Xij se registran
en la siguiente tabla.

Donde:
Ti◼: es la suma de datos de la muestra i.
Ti◼◼: es la suma total de datos de las k muestras
n: es el total observado en las k muestras
i◼: es la media de la muestra i
◼◼: es media total muestral

HIPOTESIS PARA MODELOS DE CLASIFICACIÓN DE UN SOLO FACTOR 


COMPLETAMENTE ALEATORIZADOS

La prueba del ANOVA se basa en dos estimaciones independientes de la varianza poblacional σ²


(Varianza entre grupos y Varianza dentro de los grupos)
Estas estimaciones se obtienen particionando la suma de cuadrados en dos componentes, las cuales
son:

SCT = SCTR + SCE


Donde:

SCT: es la suma de cuadrados totales

133

SCTR: es la suma de cuadrados entre los tratamientos

SCE: es la suma de cuadrados del error (o dentro de los tratamientos)

Ejercicios de Análisis de Varianza

Ejemplo 1:
Se realizan cuatro mezclas experimentales para medir la resistencia de concreto y se sometieron a
cargas de compresión hasta romperse. ¿Hay evidencia estadística que permita concluir que los tipos
de mezcla influyen en la resistencia del concreto? Use un nivel de significación del 5%.

Mezcla A Mezcla B Mezcla C Mezcla D


2.3 2.2 2.15 2.25
2.2 2.1 2.15 2.15
2.25 2.2 2.2 2.25

Resolución

  Mezcla A Mezcla B Mezcla C Mezcla D


2.3 2.2 2.15 2.25
2.2 2.1 2.15 2.15
2.25 2.2 2.2 2.25
Total 6.75 6.5 6.5 6.65 26.4
n 3 3 3 3 12
Medias 2.25 2.17 2.17 2.22 8.8

2 2 2 2 2
SCT   2.3  2.2  2.25  ....  2.25  26.4  0.035  
12

134

6.75 6.5 6.5  6.65 26.4 2


SCTR       0.015
3 3 3 3 12

SCE   0.035  0.015  0.02

1.Planteamiento de Hipótesis
Ho:  µ1  µ 2    µ3  µ 4  (la resistencia del concreto en los distintos tipos de mezclas es la misma).
H1: La resistencia del concreto
concreto en al menos uno de los cu cuatro
atro tipos de mezclas es diferente.
diferente.

2. Nivel de significancia
α = 0.05

3. Estadígrafo o estadístico

Suma de Grados de Cuadrados Razón F 


Fuente de Variación cuadrados libertad  Medios calculada
Tratamientos 0.015 3 0.005 2
Error 0.02 8 0.0025

Total 0.035 11

4. Regla de Decisión
Región Crítica

Primero se encuentra el valor crítico que es F(1-α, k-1, n-k)=F(0.95 , 3, 8) = 4.07.

La regióndecritica
El valor es: (4.07, a+∞).
2 no pertenece la región critica por lo tanto no se debe rechazar Ho.

5. Conclusión
Finalmente hay suficiente evidencia estadística para decir que no hay diferencias entre las
resistencias del concreto en los distintos tipos de mezclas.

Ejemplo 2:
La fábrica de pantalones A&M tiene cuatro trabajadores que se dedican exclusivamente a coser 
 pantalones previamente cortados. El gerente de A&M sospecha que los trabajadores no están
trabajando a un mismo nivel. Para probar su sospecha, el gerente decide registrar en forma aleatoria
el tiempo (en minutos) que demora cada trabajador en coser un pantalón. Cinco observaciones fueron
registradas para cada trabajador, obteniéndose la siguiente información:
135

Trabajador 1 Trab
Trabaj
ajad
ado
or 2 Trab
Trabaj
ajad
ado
or 3 Trab
Trabaj
ajad
ador
or 4
28 27 29 27
25 28 30 28
29 30 32 26
30 28 35 28
28 25 37 27

Resolución

Trabajador Trabajador Trabajador Trabajador


  1 2 3 4  
28 27 35 27  
25 28 45 28  
29 30 38 26  
30 28 35 28  
28 25 42 27  
Total 140 138 195 136 609
n   5 5 5 5   20
Medias 28 27.6 39 27.2 121.8

 
6092
SCT   28  25  29  ....  27   596.95  
2 2 2 2

20

140 138 195   136 56092


SCTR       488.95
5 5 5 5 20

SCE   596.95  488


  .95  108

1.Planteamiento de Hipótesis
Ho:  µ1  µ 2    µ3  µ 4  (Los tiempos promedios que demoran los trabajadores
en coser un pantalón es el mismo).
H1: Al menos unos de los tiempos promedios que demoran los trabajadores en coser un pantalón es
diferente).

2. Nivel de significancia
α = 0.05
3. Estadígrafo o estadístico
Suma de Grados de Cuadrados Razón F 
Fuente de Variación cuadrados libertad  Medios calculada

136

24.15
Tratamientos 488.95 3 162.9833
Error 108 16 6.75

Total 596.95 19
19

4. Regla de Decisión
Región Crítica

Primero se encuentra el valor crítico que es F(1-α, k-1, n-k) = F(0.95 , 3, 16) =3.24.
La región critica es: (3.24, +∞).
El valor de 24.15 si pertenece a la región critica por lo tanto se debe rechazar Ho.

5. Conclusión
Finalmente hay suficiente evidencia estadística para decir que hay diferencias entre los tiempos
 promedios que demoran
demoran los trabajadores en cos
coser
er un pantalón.

Ejemplo 3:
Los datos de la siguiente tabla representan el número de horas de alivio que proporcionan cinco
marcas diferentes de tabletas contra el dolor de cabeza que se administran a 25 sujetos que sufren de
fiebres de 38ºC o más.
Realice el análisis de varianza y pruebe la hipótesis, en el nivel de
significancia de 0.05 que el número promedio de horas de alivio que proporcionan las tabletas es el
mismo para las cinco marcas.

Tabletas
A B C D E
5 .2 9.1 3.2 2.4 7 .1
4 .7 7.1 5.8 3.4 6 .6
8 .1 8.2 2.2 4.1 9 .3
6 .2 6.0 3.1 1.0 4 .2
3 .0 9.1 7.2 4.0 7 .6

Solución
 H 0 :  1     2    3   4 ( El  número  prom
 promedi
edio
o de horas de alivio es el  mismo  pa
 para
ra las cinco
marcas de tabletas )
 H 1 :  En al  menos una
un a de las marcas de tabletas el  tiempo  prom
 promedio
edio de alivio no es el  mismo.

. α = 0.01
(137.9) 2
SCT   (5.2) 2
 ( 4.7)  .....................  (7.6) 
2 2

25
  = 898.61-760.66 = 137.95

(27.2) 2  (39.5) 2  (21.5) 2   (14.9) 2  (34.8) 2 (137.9) 2


SCA    78.42
5 25
SCE   137.95  78
  .42  59.53

137

Suma de Grados de Cuadrados Razón F 


Fuente de Variación cuadrados libertad  Medios calculada
6.59
Tabletas 78.42 4 19.61
Error 59.53 20 2.98

Total 137.95 24

4. Regla de Decisión
Primero se encuentra el valor crítico que es F(1-α, k-1, n-k) = F(0.95 , 4, 20) =2.87.
La región critica es: (2.87, +∞).
El valor de 6.59 si pertenece a la región critica por lo tanto se debe rechazar Ho.

5. Conclusión
Hay suficiente evidencia estadística para concluir que existe diferencia significativa entre los efectos
de las tabletas con respecto al tiempo promedio de alivio.

7
   o
   i
   v
   i
   l
   a
   e
   d 6
   o
   i
   d
   e
   m
   o
   r 5
   p
   s
   a
   r
   o
   H 4

 A  B C D E

Tabletas
 

EJERCICIOS PROPUESTOS

1.- Cinco laboratorios participan en un estudio para la determinación de la concentración de plomo


en muestras de agua. Los resultados, obtenidos para réplicas de cada muestra analizada en los
laboratorios, se expresan en ppm y se presentan en la siguiente tabla:

Réplica Lab. A Lab. B Lab. C Lab. D Lab. E


1 9,8 9,5 10,1 9,2 10,6
2 11,4 9,6 10,4 9,3 10,5
3 10,3 9,9 10,0 8,6 11,1
¿La determinación de los niveles de concentración de plomo en muestras de agua es la misma en
dichos laboratorios? Use α = 0.05

138

  

2) Un fabricante está interesado en estudiar la resistencia a la tensión de una fibra sintética, y


sospecha que puede estar relacionada con el porcentaje de algodón en su composición. Con este fin,
estudia la resistencia de la fibra considerando 5 niveles de porcentaje de algodón en su composición.
Los datos observados se muestran en la siguiente tabla.

Porcentaje de algodón

  15 20 25 30 35
     a
     r
     u
7 12 14 19 7
       t
     p
     u
     r
7 17 18 25 10
 
     e
        d
  15 12 18 22 11
     n
        ó
       i
     s 11 18 19 19 15
     n
     e
       T
9 18 19 23 11

Contrastar al 5 % de significación si el fabricante está acertado en su sospecha.

3.- Se recolectaron muestras de agua en 4 lugares distintos de un río, para determinar si la cantidad
de oxígeno disuelto, varía de un lugar a otro. Los lugares 1 y 2 se escogieron arriba de una planta
industrial, una cerca de la orilla y la otra a mitad del río; el lugar 3 se tomó adyacente a la descarga
del agua industrial de la planta y el lugar 4 se tomó río abajo a mitad del río. Los datos se presentan
en la siguiente tabla (a mayor contaminación, menor es la lectura de oxígeno):

Lugar Conteni
Contenido
do medio de oxígeno disuelt
disueltoo
Lugar 1: 5.9 6.1 6.3 6.1 6.0
Lugar 2: 6.3 6.6 6.4 6.4 6.5
Lugar 3: 4.8 4.3 5.0 4.7 5.1
Lugar
ug ar 4: 6.
6.00 6.
6.22 6.
6.11 5.
5.88

Al nivel de significación de 0.01 ¿Proporcionan los datos evidencia suficiente para indicar una
diferencia entre las cantidades medias de oxígeno disuelto para los
l os 4 lugares?

4.- La siguiente tabla muestra las concentraciones arteriales de epinefrina en plasma sanguíneo (en
-8
10  gramos
el que por mililitro)
estuvieron que se encontró
anestesiados, usando en 15 pacientes
3 tipos sometidos
diferentes a cirugía
de anestesia, durante un
aplicando período
cada en
tipo de
anestesia a cada uno de los 5 pacientes elegidos al azar de los 15:

Anes
neste
tessia P a c i e n t e s
Ti po 1 9 12 10 8 15
Tipo 2 20 21 23 17 30
Tipo 3 6 5 8 16 7
 
Tomando α = 0.01 ¿Se puede decir que si se observan diferencias en la concentración de epinefrina
según el tipo de anestesia usada?

5) Tres profesores dan clases teóricas en una misma autoescuela. Se desea contrastar, si existen
diferencias significativas en la forma de enseñanza de los tres profesores. Para ello se seleccionan
tres muestras de alumnos y se anota el número de preguntas correctas en el examen.

Proesor 1 Proesor 2 Proesor 3

139

43 48 29
35 47 31
44 44 28
46 46 42
39 39 31
44 45 36
38 48 35
42 48 36
45 45 39

Contrastar al 5 % de significación si existen diferencias entre los profesores.

6.- Se realizó un estudio para determinar la proliferación de hongos debido al exceso de residuos
alimenticios de los peces. Se observaron estas condiciones con peces en estadíos de alevines,
 juveniles y adultos. Los peces alevines, juveniles y adultos fueron alimentados con cantidades de
alimento que variaban entre 3, 6 y 9 gramos al día respectivamente. Los datos a continuación
representan el número de colonias de hongos presentes en cada acuario.

3 gramos 6 gramos 9 gramos


18 22 41
14 26 32
7 13 47
9 33 51
19 55
20
29
48 162 226
Total = 436

Con α = 0,01 ¿Cuál es su conclusión?

7)  Un fabricante de cereales tiene que elegir entre tres colores para las cajas de cereales: rojo,
amarillo y azul. Para averiguar si el color influye en las ventas, se eligen 16 tiendas de tamaño
 parecido. Se envían cajas rojas a 6 de estas tiendas, cajas amarillas a 5 y cajas azules a las 5
restantes. Después de unos días, se comprueba el número de cajas vendidas en cada tienda. La tabla
adjunta muestra los resultados (en decenas de cajas) obtenidos.

Rojo Amarillo Azul


43 52 61
52 37 29
59 38 38
76 64 53
61 74 79
81

Comp
Comple
lete
te la tab
tabla
la de
dell an
anál
ális
isis
is de la va
vari
rian
anza
za y co
cont
ntra
rast
stee la hip6tes
hip6tesis nula de que las medias
 poblacionales de los niveles
niveles de ventas de las cajas de los tres colores son iguales.
8)  Un profesor tiene una c1ase de 23 estudiantes. Al comienzo de cada cuatrimestre asigna a cada
estudiante

140

aleatoriamente a uno de los cuatro profesores ayudantes que tiene: Sánchez, Hervás, Alarcos o
Blázquez. Anima a los estudiantes a reunirse con su profesor ayudante para que les explique la
materia difícil del curso. AI final del cuatrimestre, se hace un examen. La tabla adjunta muestra las
calificaciones obtenidas por los estudiantes que trabajan con estos profesores ayudantes.

Sánchez Hervás Alarcos Blázquez

72 78 80 79
69 93 68 70
84 79 59 61
76 97 75 74
64 88 82 85
  81 68 63

Complete la tabla del aná


análisis
lisis de la varianza y contraste la hipótesis nula de la igualdad de las medias
 poblacionales de las calificaciones de estos
estos profesores
 profesores ayudan
ayudantes.
tes.

9)  Tr
Tres
es pr
prov
ovee
eedo
dore
ress su
sumin
minis
istr
tran
an pi
piez
ezas
as en en enví
víos
os de 50
5000 un
unid
idad
ades
es.. Se ha
hann co
comp
mpro
roba
bado
do
minuciosamente muestras aleatorias de seis envíos de cada uno de los tres proveedores y se ha
anotado el número de piezas que no se ajustan a las normas. La tabla muestra este número.

Proveedor A Proveedor B Proveedor C


28 22 33
37 27 29
34 29 39
29 20 33
31 18 37
33 30 39

Contraste la hip6tesis nula de que la igualdad de las medias poblacionales del número de piezas por 
envío de los tres proveedores no se ajusta a las normas.

10)  La Aso
Asociac
ciación
ión Nac
Nacion
ional
al de com
comerc
ercian
iantes
tes en Au
Autom
tomóvi
óviles
les(A
(ANCA
NCA)) qui
quiere
ere com
compar
parar
ar el
comportamiento del gasto de gasolina de distintas marcas de auto, para ello obtuvo una muestra
aleatoria del consumo de gasolina en litros de dichos automóviles en 40 de sus distintos modelos.
Utilice α = 0.05. ¿El consumo de gasolina tiene un comportamiento similar?
Honda-Civic Honda-Accord Nissan-Sentra Nissan Tillda
50 35 40 37
30 32 36 40
39 33 38 42
47 38 42 30
35 48 65 33
53 35 38 38
48 43 46 40
42 40 45 46
40 50 50 49
55 49 50 50
Regresión y Correlación Lineal

141

En diversos problemas vinculados con el análisis de la información es importante estudiar las


relaciones que pueden existir entre dos o más variables. Preguntas como: ¿las personas con mayor 
 poder adquisitivo tienen mayor grado de educación? están referidas a las relaciones que podrían
existir entre las variables “poder adquisitivo” y “educación”. Las relaciones entre variables pueden
explorarse algunas veces usando gráficos adecuados, pero también existen medidas que indican no
solo la existencia de la relación sino también la fuerza de esta. A estas medidas se les llama medidas
de correlación cuando las variables en estudio son numéricas u ordinales y medidas de asociación si
las variables son nominales.

El coeficiente de correlación de Pearson Es un número que indica el grado de asociación entre dos
variables cuantitativas (numéricas) y se define del siguiente modo:

r 
 XY    X  Y 
n

n X     X   n Y     Y  


i
2 2
i
2 2

Los valores que


que puede tomar el coeficiente de ccorrelación
orrelación "r" son
son:: -1 ≤ r ≤ 1.
Si "r" > 0 La correlación lineal es positiva (si sube el valor de una variable sube el de la otra). La
correlación es más fuerte cuanto más se aproxime a 1.
Si "r" < 0 La correlación lineal es negativa (si sube el valor de una variable disminuye el de la otra).
La correlación negativa es tanto más fuerte cuanto más se aproxime a -1.
Si "r" = 0 No existe correlación lineal entre las variables, aunque podría existir otro tipo de
correlación (parabólica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera próximo a 1 ó -1, tampoco esto quiere decir 
obligatoriamente que existe una relación de causa-efecto entre las dos variables, ya que este
resultado podría haberse debido al puro azar.

Diagrama de dispersión Se utiliza para graficar la relación entre dos variables X e Y, consiste en
una nube de puntos que nos mostrará visualmente si existe o no correlación dependiendo de la
tendencia de los puntos.

Regresión Lineal El modelo de regresión lineal se usa para expresar la relación lineal que puede
existir entre los valores de una variable “ Y” y los valores de una variable “X”.
X: Variable independiente.
Y: Variable dependiente.
Modelo de regresión lineal simple Los modelos de regresión que relacionan valores x de una
variable independiente X con valores y de una variable dependiente Y, cuya forma es

Y    0    
  1 X    

La ex
expr
presiónn  0     1  X  es la pa
esió parte
rte estru
estructu
ctural
ral linea
lineal,l, mientras que     resume la parte
mientras
aleatoria que influye débilmente en la variable dependiente Y. A la ecuación  y   0     1  X 
, que expresa la estructura lineal, se llama la ecuación de regresión lineal. A los
coeficientes  0 y  1 se les llama coeficiente de regresión.
Se considera de este modo que los puntos (x,y) no necesariamente esta sobre la recta
 y   0     1  X   sino que fluctúan aleatoriamente a su alrededor.
 
Se asume que
constante.  es una variable aleatoria cuya distribución es normal de media 0 varianza

Ecuación de regresión lineal

142

La estimación de los valores   0 y  1  se realiza usando el método de mínimos cuadrados
y los valores obtenidos de la muestra ( x1  ,  y1 ),.....,
  ( xn ,  y n )

El modelo estimado es Y ˆ   ˆ  0     ˆ1  X 


Donde:

 ˆ 0     ˆ1 x
   y
  n     n    n  
n  xi y i     xi   y i 
 ˆ1 
  i 1    i 1    i 1  
2
  n 2    n  
n  x i     xi 
  i 1     i 1  

Coeficiente de Determinación( R
  2
) Medida de Bondad
Bondad de Ajuste: Mide la proporció
proporciónn de la
variabilidad total de Y que es explicada por X a través del modelo de regresión lineal
simple.  R 2   r 2

Ejercicios de Regresión y Correlación Lineal

Ejemplo 1.- El costo de fabricar un lote de cierto producto depende del tamaño del lote, como se
aprecia en el siguiente conjunto de datos:
Cost
Co stoo ($10
$1 0): 30 70 1140
40 270 530 1010 250
25 00 5020
02 0
Tamaño del lote: 1 5 10 25 50 100 250 500
(100 unidades)

  a) Grafique un diagrama de dispersión


  b) Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.
c) Grafique sobre el diagrama de dispersión, la línea de regresión.
  d) Estime el costo para un lote cuyo tamaño es de 500 unidades
e) Calcule eelinterprete
f) Calcule error estándar de estimación
el coeficiente de correlación.
g) Interp
Interpret
retee el coefi
coeficie
ciente
nte de de
deter
termin
minaci
ación.
ón.

Solución

a) Di
Diag
agra
rama
ma de Di
Disp
sper
ersi
sión
ón
143

Gráfica
Gráfic a de d
dispersi
ispersión
ón de Y vs. X 

5000

4000
   Y
  :
   )
  s
  e
  r 3000
  a
   l
   ó
   d
   0
   1
   ( 2000
  o
   t
  s
  o
   C
1000

0 100 200 300 400 500

Tamaño del lote ( 100 unidades): X 

 b) Determinación de la Ecuación ddee regresión lineal: ˆ  a


Y   b  X 

a 
  X   Y     X    X 
i
2
i i i Y i
n   X      X  
2 2
i i

b 
n   X  Y    X   Y 
i i i i

n   X      X  2 2
i i

en donde :
 X   94
941
1
Y   9570
 
    X  Y   3271030  X 
2
i i   i i i  325751
325751 ( 9570 )  941 ( 3271030 )
Luego a       22.8987
8 ( 325751 )   941  2

8 ( 3271030 )  ( 941 ) ( 9570 )


  b     9.975
8 ( 325751 )  ( 941 ) 2

 
 Por  lo tan to la ecuación de regresión   lineal   será : ˆ 
Y  22.8987  9.975  X 

Interpretación: Al aumentar el tamaño del lote en 100 unidades, el costo aumentará en 9.975
decenas de dólar o sea aproximadamente en 100 dólares.
c) Grá
Gráfic
ficaa de llaa lín
línea
ea ddee reg
regres
resión
ión lineal
lineal

144

Gráfica
Gráfi ca de lí
línea
nea aju
ajustada
stada
 Y = 22,90
22,90 + 9,9
9,975
75 X

S 12,0374
5000
R-c uad. 100,0%
R-cua
-cuad.
d.(a
(aju
jus
stado)
do) 100,0%

4000

   )
   Y 3000
   (
   o
   t
   s
   o 2000
   C

1000

0 100
100 200
200 300
300 400
400 500
500
Tamaño del lote ( X )

d) Costo estimado para un lote de 500 unidades: ˆ  22 .8987  9.975 ( 5 )  72 .8


Es decir, el costo es
estimado
timado sería de 728 dólares.

e) Cálculo del Error Estándar de Estimación


Estimación:: Sy/x

S  y /  x     Y  2
a  Y   b   X  Y 
n 2

32849700  22 .8987 ( 9570 )  9.975


97 5 ( 3271030 )
S  y /  x   12 .0374 decenas de dólares
8  2

f) Cálculo del Coeficiente de Correlación: r 



r   n  X  Y   X  Y 
 
n  X i   X 
2 2 
 
n  Y i 2
      Y   2

8 ( 3271030 )  ( 941) ( 9570 )


r     1.00
 8 ( 325751)  ( 941) 2
  8 ( 32849700)  ( 9570 ) 2

Interpretación: Existe una correlación lineal positiva perfecta; a medida que el tamaño del lote
se incrementa, el costo también crecerá.
Determinación:: r 2  = 1
g) Cálculo del Coeficiente de Determinación
Interpretación: Las variaciones que se observa en el costo, se debe únicamente a la variación del
tamaño del lote.
Ejemplo 2.- Se llevó a cabo un experimento para estudiar el efecto de cierto medicamento para
Ejemplo
disminuir la frecuencia cardíaca en adultos. La variable independiente es la dosis en miligramos

145

del medicamento y la variable dependiente es la diferencia entre la frecuencia cardíaca más baja
después de la administración del medicamento y un control antes de administrarlo. Se reunieron
los siguientes datos:

Dosis Disminución de la frecuencia


(mg) cardíaca (latidos/min)
0.50 10
0.75 08
1.00 12
1.25 12
1.50 14
1.75 12
2.00 16
2.25 18
2.50 17
2.75 20
3.00 18
3.25 20
3.50 21

 
a) Grafique un diagrama de dispersión
  b) Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.
c) Grafique sobre el diagrama de dispersión, la línea de regresión.
  d) Estime la disminución de la frecuencia cardíaca para una dosis de 2 mg
e) Calcule el error estándar de estimación
f) Calcule e interprete el coeficiente de correlación.
  g) Calcule e interprete el coeficiente de determinación

Solución:

a) Diagrama de Dispersión

   ) Gráfica de dispersión de Y vs. X 


  n
   i
  m22
   t
   /
  a
   l
   (
  a 20
  c
  a
   í
   d
  r 18
  a
  c
  a
   i
  c 16
  n
  e
  u
  c
  e 14
  r
   f
  a
   l
  e 12
   d
  n
   ó
   i
  c 10
  u
  n
   i
  m
  s 8
   i
   D
  :
   Y 0.5 1.0 1.5 2.0 2.5 3.0 3.5
 X: Dosis ( mg
mg )
 b) Determinación de la Ecuación de regresión lineal: ˆ  a
Y   b  X 

a 
  X   Y     X    X 
i
2
i i i Y i
b 
n  X  Y    X  Y 
i i i i
146
n   X      X   n   X      X  
2 2 2 2
i i i i

en donde :  X  i  26 Y   198 i


 
    X  Y  
  i i 442.5  X  i
2
 63.375

63.375 ( 198 )  26 ( 442.5 )


Luego a       7.055
13 ( 63.375 )   26 
2

13 ( 442.5) ( 26) (198 )


  b     4.088
13 ( 63.375 )  ( 26 ) 2

 Po r  lo tan     lineal   será :


ta n to la ecuación de regresión ˆ
Y   7.05 5  4.08 8 X 

Interpretación: Al aumentar la dosis del medicamento en 1 mg. la reducción de los latidos del
corazón,delsecorazón
latidos incrementan en 4 lat/min
se reducen apr
aproximadamente;
oximadamente; es decir por cada mg de la dosis, los
en 4 aproximadamente.
c) Gráfica de la línea de regresión lineal
Gráfica de línea ajustada
 Y = 7.05
7.055
5 + 4.088 X
22 S 1.35579
   Y
  : R-cuad. 90.4%
   a
   c 20 R- cu
cu ad
ad .(
.( a
ajj u
us
stad o
o)
) 89.5%
   a
   í
   d
   r
   a
   c 18
   a
   i
   c
   n 16
   e
  u
   c
   e
   r
   f 14
   a
   l
   e
   d 12
   n
   ó
   i
   c 10
   c
  u
   d
   e
   R 8

0.5 1.0 1.5 2.0 2.5 3.0 3.5


Dosis: X 

d) Disminución estimada de la frecuencia cardíaca para una dosis de 2 mg:


ˆ  7.055   4.088 ( 2 )  15

Es decir, para una dosis de 2 mg de dicho medicamento, se espera que la frecuencia cardíaca
disminuya en 15 lat/min aproximadamente.
e) Cálculo del Error Estándar de Estimación: S y/x

147

S  y /  x 
   Y  2
 a  Y   b   X  Y 
n  2

3226  7.055 (198 )  4.088 ( 442.5 )


S  y /  x   1.3558 latidos
13  2

f) Cálculo del Coeficiente de Correlación: r  


n X  Y     X   Y 
n  X      X    n   Y     Y   
2 2 2 2
i i

13 ( 442.5 )  ( 26 ) ( 198 )
r     0.9507
 13 ( 63.375 )  ( 26 ) 2   13 ( 3226 )  (198 ) 2 
Interpretación
Interpret ación:: Existe una correlación lineal positiva entre la dosis del medicamento y la
reducción de la frecuencia cardíaca; a medida que se aumenta la dosis del medicamento entonces
la reducción de la frecuencia también aumentará.
Determinación:: r 2  = 0.904
g) Cálculo del Coeficiente de Determinación
Interpretación
Interpret ación:: El 90.4% de las variaciones que se observa en la reducción de la frecuencia
cardíaca, se debe a la variación de la dosis del medicamento; el 9.6% restante se debe a la
influencia o efecto de alguna otra variable no tomada en cuenta en el presente estudio.

EJERCICIOS PROPUESTOS

1. Una muestra aleatoria de cinco familias da la siguiente información en relación al ingreso


familiar mensual y los gastos mensuales en gastos en seguros de salud.

Familia Ingreso mensual Gastos en seguros de salud a)


Ávila 3500 320
Benavides 2800 280
Calderón 4700 410
Díaz 2100 120
Ercilla 3150 340
a) GrGraf
afiq
ique
ue uunn di
diag
agrarama
ma ddee di
disp
sper
ersi
sión
ón
 b) Determine la ecuación de regresión lineal. Interprete el coeficiente de regresión lineal.
Grafique sobre el diagrama de dispersión, la línea de regresión.
c) Pruebe
Pruebe otr
otros
os mo
modelos
delos de regregresió
resiónn y eli
elija
ja el me
mejor
jor a bbase
ase de
dell coefi
coeficient
cientee de de
determin
terminación.
ación.
d) Est
Estíme
ímese
se el gast
gastoo anua
anuall en preve
prevenci
nción
ón de la salu
saludd de una famil
familia
ia cuyo iningre
greso
so mensua
mensuall es
2500 soles.
e) Cal
Calcul
culee el eerro
rrorr es
están
tándar
dar de llaa es
estim
timació
aciónn de
dell mod
modelo
elo
f) Cal
Calcul
culee e iinte
nterpr
rprete
ete el ccoef
oefici
icient
entee de det
determ
ermina
inació
ciónn
2.- Con la siguiente información:
Horas-hombre por mes de instrucción 200 500 450 800 900 150 300 600
Accidentes por millón de Horas- 7.0 6.4 5.2 4.0 3.1 8.0 6.5 4.4

148

hombre

a) Gra
Grafiq
fique
ue eell di
diagr
agrama
ama de ddisp
ispers
ersión
ión
 b) Determine una ecuación qu quee describa la relación entre la frecuencia
frecuencia de accidentes y el nivel de
educación preventiva. Grafique esta ecuación.
c) Inter
Interprete
prete los vvalore
aloress de los ccoefic
oeficientes
ientes de re
regresi
gresión.
ón.
d)
e) Calcu
Calcule
le el errorprete
e inter están
estándar
interprete eldar ddee laiente
ccoefic
oeficienteeestima
stimación
de ción
correddel
el mod
modelo.
correlación . elo.
lación.
f) Cal
Calcul
culee e inter
interpre
prete
te el coe
coefic
ficien
ientete de det
determ
ermina
inació
ción.
n.
g) Estim
Estimee el número ddee acciden
accidentes tes si el núm
número
ero de ho
horas
ras de ins
instrucci
trucción
ón fues
fuesee 340.

3.-  El editor en jefe de un importante periódico metropolitano ha


intentado convencer al dueño del periódico para que mejore las
condiciones de trabajo en el taller de prensas. Está convencido de
que, cuando trabajan las prensas, el grado de ruido crea niveles no
saludables de tensión y ansiedad. Recientemente hizo que un
 psicólogo realizara una prueba
prueba durante la cual los prensistas
prensistas se
situaron en cuartos con niveles variables de ruido y luego se le hizo
otra prueba para medir niveles de humor y ansiedad. La siguiente
tabla muestra el índice de su grado de ansiedad o nerviosismo y el
nivel de ruido al que se vieron expuestos. (1 es bajo y 10  es alto).
 Nivel de ruido 4 3 1 2 6 7 2 3
Grado de ansiedad 39 38 16 18 41 45 25 38

 a) Represente gráficamente estos datos.


 b) Desarrolle una ecuación de estimación que describa los datos.
 c) Pronostique el grado de ansiedad que podríamo
podríamoss esperar cuando el nivel de ruido es 5.
 d) Calcule e interprete eell coeficiente de cor
correlación
relación
 e) Calcule e interpre
interprete
te el coeficiente de ddeterminación
eterminación
 f) Calcule el error estándar de la eestimación.
stimación.

4.- Se ha medido la variación de creatinina en pacientes tratados con


Captopril (droga antihipertensión) tras la suspensión del tratamiento
con diálisis, resultando la siguiente tabla:
Días tras la diálisis: X 1 5 10 15 20 25 35
Creatinina (mg/dl): Y 5.7 5.2 4.8 4.5 4.2 4 3.8
a) Calcule el mmodelo
odelo de rregresión
egresión lineal
 b) Interprete la variación de creatinina, en función de los días
transcurridos tras la diálisis.
c) Si un individuo presenta 8 días tras la suspensión del tratamiento
con diálisis, que sucede con la creatinina (mg/dl).

5.- En un grupo de 8 pacientes se registran las medidas antropométricas peso (kg) y edad (años)
obteniendo el modelo de regresión:
Yˆ  20.61  2.83 X 
a) Interprete la recta de regresión lineal
li neal
 b) ¿Cómo cree Ud. que será el diagrama de dispe
dispersión?
rsión?

6.- Una cadena de restaurantes de comida rápida decide llevar a cabo un experimento para medir la
influencia del gasto en publicidad sobre las ventas. En 8 regiones del país, se realizaron diferentes
variaciones relativas en el gasto de publicidad, comparado con el año anterior y se observaron las
variaciones en los niveles de ventas resultantes. La tabla muestra los resultados:

149

Incremento del gasto


en publicidad ( % ) 0 4 14 10 9 8 6 1
Increm
Increment
entoo en las ven
ventas
tas ( % ) 2.4 7.2 10.
10.33 9.1 10.
10.22 4.1 7.6 3.5

a) Calcule
Calcule el coe
coeficien
ficiente
te de co
correlac
rrelación
ión line
lineal.
al.
 b) Estimar la ecuación regresión lineal del incremento en las ventas sobre el incremento del gasto en

c)  publicidad
Calcule
Calcule el err
error
or está
estándar
ndar ddee estim
estimación
ación..
d) Estime el incremento en las ventas, si el gasto en publicidad es del 10%.

7.- Los siguientes datos se refieren al número de horas de estudio


invertidas por los estudiantes fuera de clase durante un período de
tres
tres sem
semana
anass par
paraa cie
cierto
rto curso
curso,, jun
junto
to con las cal
califi
ificac
caciones que
iones
obtuvieron en un examen aplicado al final de ese período.
Calificaciones 64 61 84 70 88 92 72 77
Horas
oras de es
estu
tuddio 20 16 34 23 27 32 18 22

a) Calcule
Calcule el coe
coeficien
ficiente
te de co
correlac
rrelación
ión line
lineal.
al.
 b) Estimar la ecuación regresión linea
lineall
c) Calcule
Calcule el err
error
or está
estándar
ndar ddee estim
estimación
ación..
d) Estime la calificación para
para un estudiante que estudió 24 horas durante dicho período de tiempo.

8.- Un editor tomó una muestra de 7 libros anotando el precio y el número de páginas respectivo,
obteniendo los siguientes datos.

 Número de páginas 630 550 400 250 370 320 610


Precio ( $10 ) 10 8 7 4 6 6 9

a) Calcule
Calcule el coe
coeficien
ficiente
te de co
correlac
rrelación
ión line
lineal.
al.
 b) Estimar la ecuación regresión linea
lineall
c) Calcule
Calcule el err
error
or está
estándar
ndar ddee estim
estimación
ación..
d) Estimar
Estimar el precio de un libro de 300 pág páginas.
inas. Si a este libro
libro se le incremen
incrementa
ta 20 páginas en una
segunda edición. ¿En cuánto se incrementará su precio?

9.- Un investigador de una fábrica de refrescos ha tomado al azar 8


semanas del año observando en cada semana la temperatura media
(ºC ) y la cantidad de refrescos (miles) pedidos durante cada uno de
dichos períodos. La información es la siguiente:

Te
Temp
mper
erat
atur
uraa 10 28 12 31 30 19 24 15
Pedidos 21 65 19 72 75 36 67 24

a) Calcule
Calcule el coe
coeficien
ficiente
te de co
correlac
rrelación
ión line
lineal.
al.
 b) Halle la ecuación regresión linea
lineall
c) Calcule
Calcule el err
error
or está
estándar
ndar ddee estim
estimación
ación..
d) Estimar el pedido de refrescos para una semana cuya temperatura me
media
dia es de 20º
20ºC.
C.
150

10.-  Se efectúa un experimento médico para determinar el efecto de la droga efedrina en las
 pulsaciones del corazón. Un paciente recibe diversas dosis diarias de la droga durante seis días.
La tabla que sigue resume los resultados del experimento.
Dosis diaria total  Nº de
de pul
pulsacio
saciones
nes
de efedrina (granos)  por minut
minutoo
3 70
2 60
1 50
3 80
5 100
4 90
 Nota. 1 grano = 0.06 gramos
a) Grafique un diagrama de dispersión
 b) Determine la ecuación de regresión lineal. Interprete los coeficientes de regresión lineal.
Grafique sobre el diagrama de dispersión, la línea de regresión.
c) Estímese el número de pulsaciones ppara ara una dosis diaria de 4 ggranos
ranos de efedrina
efedrina..
d) Calcu
Calcule
le el erro
errorr está
estándar
ndar de la estim
estimación
ación del m modelo
odelo
e) Calcu
Calcule
le e inter
interprete
prete el ccoefic
oeficiente
iente de corre
correlación
lación..
f) Cal
Calcul
culee e inter
interpre
prete
te el coe
coefic
ficien
iente
te de det
determ
ermina
inació
ciónn

11.- La siguiente tabla ilustra los valores del consumo de metil mercurio y la cantidad total de
mercurio en la sangre de 12 individuos expuestos a la primera sustancia por haber consumido peces
contaminados.

Consumo de metil Mercurio en la sangre


mercurio ( ng/g )
(µgHg/día)
180 90
200 120
230 125
410 290
600 310
550 290
275 170
580 375
105 70
250 105
460 205
650 480

a) Cal
Calcul
culee el coef
coefici
icient
entee de cor
correl
relaci
ación
ón lin
lineal
eal..
 b) Estimar la ecuación regresión lineal de la cantidad de mercurio en la sangre sobre el
consumo de metil mercurio.
c) Cal
Calcul
culee el er
error
ror eestá
stánda
ndarr de es
estim
timaci
ación.
ón.
d) Es
Estim
timee la cant
cantid
idad
ad de memerc
rcur
urio
io en la sang
sangre
re,, cons
consid
ider
eran
ando
do una inge
ingest
staa de 300 µg de
mercurio.

12.- Se quiere determinar la relación entre la experiencia en


12.-
ventas y el volumen de ventas para cada vendedor basado en un
grupo de 10 vendedores de una compañía de seguros. Los años
de experiencia en ventas y los volúmenes de ventas son:

Experi
Experienc
encia
ia eenn vvent
entas
as Vo
Volum
lumen
en de ven
ventas
tas
151

(años) ($10,000)
1 3
2 2
3 5
4 4
5 6
67 89
8 9
9 12
10 10

a) Halle llaa ecuac


ecuación
ión de re
regres
gresión
ión lin
lineal.
eal. In
Interpr
terprete
ete el co
coeficie
eficiente
nte de re
regres
gresión
ión
 b) Estime las ventas para un vvendedor
endedor con 5 años de experiencia
experiencia
c) Calcu
Calcule
le e inter
interprete
prete el ccoefic
oeficiente
iente de corre
correlación
lación
d) Interp
Interpret
retee el coefi
coeficie
ciente
nte de de
deter
termin
minaci
ación
ón

13.-  En una
una mu
muesestr
traa de 8 paci
pacien
ente
tess se mide
midenn las
las cant
cantid
idad
ades
es antro
antropo
pomé
métr
tric
icas
as peso
peso y edad
edad
obteniéndose los siguientes resultados

E
Pedsaod ((kagñ)os) 1526 842 1501 511114 470 739 1409 151484

a) Calcu
Calcule
le e inter
interprete
prete el ccoefic
oeficiente
iente de corre
correlación
lación
 b) Halle la ecuación de regresión lineal
c) Est
Estime
ime el peso
peso ppara
ara un ppaci
acient
entee de 10 añ
años
os de eedad
dad
d) Deter
Determine
mine e interp
interprete
rete eell coe
coeficien
ficiente
te de deter
determinaci
minación
ón

14.-  Consideremos los siguientes datos respecto al precio de venta ($1,000) de una muestra de
viviendas y sus áreas (100 pies 2) correspondientes a cada una de ellas, en cierta ciudad.

Precio de venta: 41 32 24 44 42 36 35 40 29 26
Área de la vivienda: 13 10 08 14 14 12 10 12 10 08

a) Hal
Hallar
lar llaa ecu
ecuaci
ación
ón ddee re
regre
gresió
siónn lin
lineal
eal
 b) Interprete el coeficiente de regresregresión
ión lineal
c) Estim
Estimee el pr precio
ecio ddee venta para uuna
na viv
vivienda
ienda cuya áárea
rea es de 1,0
1,000
00 pies2
pies
d) Calcu
Calcule
le e iinterp
nterprete
rete eell coef
coeficien
iciente
te de corre
correlación
lación lineal
e) Interp
Interpret
retee el coe
coefic
ficien
iente
te de de
deter
termin
minaci
ación
ón
152

CHI CUADRADO
PRUEBA DE INDEPENDENCIA

Es una prueb
pruebaa de
independientes hipótesis
entre sí. que tiene por objeto probar si dos variable
variabless cuali
cualitativa
tativass nomin
nominales
ales son

Hipótesis:

H0: X e Y son independientes (no están relacionados)


H1: X e Y no son independientes (están relacionados)

Estadístico de prueba:

r  c  o   eij 2 n  i  n j
  c   
2 2
ij
  ~    r 1  c 1 eij 
i 1  j 1 eij n
 
 
Criterio de rechazo:
  c2      2 ,  r 1  c 1  

Conclusión:

Ejemplo 1.- Se tiene la siguiente información obtenida de una muestra de 5,000 fallecidos.

DIAGNÓSTICO
Muerte por cáncer Muerte por otras Total
de pulmón causas

Fumadores 348 3,152 


3,152  3,500
 No 82 1,418 1,500
Fumadores
Total 430 4,570 5,000

Se desea probar la hipótesis de que el fumar y la muerte por cáncer pulmonar son independientes con
α = 0.01

Solución

 H 0 :  No existe relación entre el  hábito de   fumar   y la muerte  por  cáncer   pulm
 pulmona
onar 

 H 1 : Si existe relación entre el  hábito de   fumar   y la muerte  por  cáncer   pu
 pulmona
lmona r 
 Nivel  de  significa
 significanncia    0.01
DIAGNÓSTICO
Muert
Muertee por cán
cáncer
cer ddee pul
pulmón
món Mue
Muerte
rte ppor
or ootra
trass cau
causa
sass Total

153

Fumadores 348 301   3,152


3,152   3199 3,500
 No Fumadores 82 129   1,418 1371 1,500
Total 430 4,570 5,000

(348  301) 2 (3,152  3,199) 2 ( 82  129 ) 2 (1,418  1,371) 2


  2      26.764
301 3,199 129 1,371

Re  gla de decisión : Re chazar   H 0  si   2  Vt  ( Valor  hallado en la tabla   2 con 1 g ..l 
 En este caso Vt   6.635  Por  lo tan to rechazarem os  H 0

Conclusión: Los resultados muestrales proporcionan evidencia suficiente como para concluir que
ambos factores están relacionados.

PRUEBA DE HOMOGENEIDAD

Se caracteriza porque tiene como objetivo probar la igualdad de proporciones (probar si los datos de
cierta muestra provienen de la misma población).
Además, los totales ya sea de filas o columnas son determinados o fijados de antemano por el
investigador.

Hipótesis:

H0: Las proporciones son iguales


H1: Al menos una de las
l as proporciones no es la misma.

Estadístico de prueba:

r  c  o   eij 2 n  i  n j
  c2    2
ij
  ~    r 1  c 1 eij 
e
i 1  j 1   ij
  n
Criterio de rechazo:
  c2      2 ,  r 1  c 1
 

Ejemplo 1.- El Director de compras de una fábrica grande debe decidir por la compra de una de las
cuatro marcas que hay en el mercado. Para probar si existe diferencia significativa en la calidad de
las máquinas, obtiene una muestra de la producción de 150 artículos para cada una de ellas y observa
el número de defectuosos. Los resultados se dan en la siguiente tabla:
M Á Q U I NA S

154

A B C D Total
Defectuosos 21 12 15 18 66
Buenos 129 138 135 132 534
Total 150 150 150 150 600

Solución
 H 0 :  p A   p B   pC    p D ( La  propo
 proporción
rción de defectuoso s son las mismas en cada una de las máquinas)
 H 1 :  Al  menos en una de las máquinas la  propo
 proporción
rción de defectuoso s no es la misma.
 Nivel  de  sign
 significan
ificancia    0.05
M A QU I N A S
CALIDAD A B C D Total
Defectuo
tuosos 21 16.5 12 16.5 15 16.5 18 16.5 66
Buenos 129 133.5 138 133.5 135 133.5 132 133.5 534
Total 150 150 150 150 600

( 21  16 .5 ) 2 ( 129  133 .5 ) 2 ( 132  133 .5 ) 2


  
2
   ....................................   3.064
16 .5 133 .5 133 .5

Re  gla de decisión : Re chazar   H 0  si   2  Vt   ( Valor  hallado en la tabla   2 con 3 g ..l 
 
en este caso Vt   7.815.  Por  lo tan to   no rechazarem os H 0

Conclusión: La proporción de piezas defectuosas en las cuatro máquinas es la misma.

Ejemplo 2.- Se sostiene que una droga determinada es efectiva para la curación del catarro común.
En un experimento con 164 personas con catarro, a la mitad de ellas se le suministró la droga y a la
otra mitad se le suministró píldoras azucaradas. Las reacciones de los pacientes aparecen anotadas en
la siguiente tabla:

REACCIONES
Nuulo Total
Mejorados Empeorados Efecto N

Droga 52 1100 20 82

Azúcar 44 12 26 82

Total 96 22 46 164

Solución
 H 0 :  La droga  y las  píldora
 píldorass tienen igual  efecto
 H 1 :  La droga  y las  píldor
 píldoras
as no tienen igual  efecto.
 Nivel  de  significa
 significanncia    0.05

REACCIONES
Mejorado Em
Empe
peor
orad
ados
os Ef
Efec
ecto
to Nu
Nulo
lo Total
s
Droga 52 48 10 11 20 23 82

155

Azúcar 44 48 12 11 26 23 82

Total 96 22 46 164

2 2 2
2
    ( 52  48 )  ( 10  11)  .................... ................  ( 26  23 )  1.631
48 11 23

Re gla de decisión : Re chazar   H 0  si   2  Vt  ( Valor  hallado en la tabla   2 con 2  g ..l 
en este caso Vt   5.991  Por  lo tan to no rechazarem os  H 0
Conclusión: Las drogas y las píldoras azucaradas producen reacciones similares.

EJERCICIOS PROPUESTOS

1.- Una encuesta realizada en 378 hospitales por el Colegio de


Cirujanos Americanos produjo los datos de la tabla siguiente:
Tipo de tumor Total
Benigno Maligno
Usan 138 49 187
anticonceptivos
 No usan 39 41 80
 No conocen su uso
uso 35 76 111
Total 212 166 378
¿Proporcionan los datos evidencia suficiente para indicar una dependencia entre el tipo de tumor y el
anticonceptivos orales? Use α = 0.05 Rpta. Sí 
uso de anticonceptivos

2.- Sobre una muestra de 500 niños de cierta escuela primaria se hizo un estudio acerca de su estado
de nutrición y el desempeño académico, obteniéndose los siguientes resultados:
Dese
De semp
mpeñ
eñoo A
Aca
cadé
démi
mico
co Esta
Estado
do de Nutri
utrici
ción
ón To
Tota
tall
Pobre Bueno
Malo 105 15 120
Satisfactorio 80 300 380
Total 185 315 500

Existe relación entre el desempeño


desempeño académico y el estado de nutrición.
nutrición. Use α = 0.01 Rpta. Sí 

3.- Se llevó a cabo una encuesta con respecto a la preferencia del consumidor para determinar si
existía alguna predilección entre las tres marcas competitivas (A, B y C) dependiendo de la región
geográfica en la que habita el consumidor. La información obtenida es la siguiente:
Región I Región IIII Región III Total
Marca A 40 52 25 117
Marca B 52 70 35 157
Marca C 68 78 60 206
Total 160 200 120 480 156

Con esta información ¿La preferencia por una determinada marca depende de la región geográfica?
Rpta. No 

4.- Se tomó una muestra de 400, 500 y 400 compradores de las ciudades de Piura, Trujillo y
Chiclayo respectivamente con la finalidad de determinar si la proporción verdadera de compradores
que se inclinan por el producto A en lugar del B, es la misma en las tres ciudades. Use α = 0.05

Producto A Producto B Total


Piura 232 168 400
Trujillo 260 240 500
Chiclayo 197 203 400
Total 689 611 1300

5.- Se examinó una muestra de 2,000 registros médicos los cuales dieron los siguientes resultados:

Muerte por cáncer  Muerte por otras causas Total


del intestino
Fumadores 22 1,178 1,200
 No Fumadores 26 774 800
Total 48 1,952 2,000

Probar la hipótesis que las dos clasificaciones son independientes con α = 0.05

6.- Cierta compañía desea determinar si el ausentismo se relaciona


con la edad. Se toma una muestra de 200 empleados al azar y se
clasifica según su edad y causa de ausentismo:

CAUSA EDAD

Enfermedad Meno40
s de 30 3028
- 50 Más52de 50
Otras 20 36 24
¿Está la edad relacionada con el ausentismo? Use α = 0.01

7.- Una fábrica de automóviles quiere averiguar si el sexo de sus


 posibles clientes no tiene relación con la preferencia del modelo. Se
toma una muestra aleatoria de 2,000 posibles clientes y se clasifican
así:

SEXO MODELO
I II III
  Masculino 350 270 380
Femenino 340 400 260
Contrastar la hipótesis de que el sexo no tiene relación con la preferencia hacia un determinado
modelo para un α = 0.01

157

8.- Se desea determinar si existe algún tipo de relación entre la concentración de procaína usada en
operacion
oper aciones
es del molar mandi
mandibular
bular y el porc
porcentaje
entaje de caso
casoss satis
satisfactor
factorios
ios (efectivid
(efectividad
ad clínic
clínicaa de la
anestesia). Se tuvo la siguiente información:

Solu
Soluci
ción
ón ddee pr
proc
ocaí
aína
na Caso
Casoss sa
sati
tisf
sfac
acto
tori
rios
os Ca
Caso
soss no ssat
atis
isfa
fact
ctor
orio
ioss
1.0de
Más %1.0 % 07
63 18
12

Contrastar la hipótesis use un nivel de significancia de α = 0.05

9.- Un investigador estudia el nivel de efectividad de tres remedios


R1, R2 y R3 para aliviar cierta enfermedad. Para esto escogió tres
mues
mu estr
tras
as al
alea
eato
toria
riass de tama
tamaño
ñoss 50,
50, 70 y 60 pacipacien
entes
tes con
con la
enfermedad, suministrando a la primera el remedio R1, a la segunda
muestra el remedio R2 y a la tercera el remedio R3; y midiendo la
efectividad de los remedios en tres niveles: Sin alivio, cierto alivio y
alivio total. Los resultados del experimento se dan en la tabla que
sigue:

Efec
Efecti
tivi
vida
dadd Re
Reme
medi
dios
os ppar
araa la aale
lerg
rgia
ia
R1 R2 R3
Sin alivio 10 20 15
Cierto 30 20 20
alivio 10 30 25
Alivio total

¿Puede inferir que los tres remedios para la alergia son igualmente efectivos?

10.- El ingeniero quiere saber si hay diferencias en la calidad de los productos procesados en los tres
turnos operativos de una fábrica. Para esto se tomó una muestra aleatoria de tamaño 100 de cada
turno del día anterior y las clasificó según el turno de su producción: mañana, tarde y noche; y según
su calidad: defectuoso o no defectuoso. Los resultados se dan en la siguiente tabla:

Calidad Turnos de producción


Mañana Tarde Noche
Defectuosos 3 12 15
 No defectuosos 97 88 85

Pruebe al nivel de significación del 5% la hipótesis de la igualdad de las tres proporciones reales de
 producción defectuosa.
defectuosa.

You might also like