Estadística Aplicada

M. I. César Enrique Estrada Gutiérrez
Objetivo
 Proporcionar las herramientas fundamentales para
que sean capaz de organizar, analizar e interpretar
adecuadamente los cuadros estadísticos y gráficos;
establecer conclusiones a partir de la lectura de los
mismos y puedan identificar e interpretar los
principales estimadores estadísticos, así como
aplicar las técnicas estadísticas adecuadas,
establecer conclusiones a partir de resultados, cuya
finalidad es la toma de decisiones en aquellas
situaciones que se tiene incertidumbre de realidades
desconocidas.
3
Temario (I)
 Introducción al análisis estadístico
 Representaciones estadísticas y análisis de
gráficas
 Descripción de datos económicos y
administrativos (medidas de posición y de
variabilidad)
 Probabilidad
 Introducción a SPSS
 Distribución de probabilidades para variables
aleatorias discretas
4
Temario (II)
 Distribuciones de probabilidad para variables
aleatorias continuas
 Distribuciones de muestreo e intervalos de
confianza para la media
 Pruebas de hipótesis referentes al valor de la
media de la población
 La prueba Chi cuadrada
 Análisis de varianza
 Análisis de regresión y correlación lineal
5
Bibliografía
 Estadística aplicada a la administración y a la
economía. Leonard J. Kazmier. Ed. Mc Graw Hill
 Estadística con SPSS para Windows. Juan Camacho
Rosales. Ed. Alfaomega
 SPSS 11 Guía para el análisis de datos. Pardo
Merino Antonio y Ruíz Díaz Miguel Angel. Ed Mc
Graw Hill
 Estadística para la administración y la economía.
Berenson y Levin. Ed. Prentice hall
 Análisis estadístico con SPSS para windows.
Visauta. Ed. Mc Graw Hill
6
Introducción al análisis estadístico
 Estadística. Es el conjunto de técnicas que se
emplean para la recolección, organización,
análisis e interpretación de datos. Los datos
pueden ser cuantitativos o cualitativos
 Estadística aplicada. Sirve para tomar
mejores decisiones a partir de la
comprensión de las fuentes de variación y de
la detección de patrones
7
Estadística descriptiva
 Comprende las técnicas que se emplean
para resumir y describir datos numéricos.
(gráficas o análisis computacional)
 Ejemplo 1
 Volumen anual de ventas del año pasado, se
puede graficar en barras o lineas
8
Estadística inferencial
 Comprende las técnicas con las que con base
únicamente en una muestra sometida a observación
se toman decisiones sobre una población o proceso
estadístico (requiere de probabilidad)
 Censo. Procedimiento para la medición de las
características de todos los miembros de la población
 Estadísticas muestrales. Se refiere a las
características medidas de una muestra.
 Ejemplo 2
 Muestra de focos y revisión de los mismos hasta poder
estimarse la probabilidad de falla

9
Variables discretas y continuas
 Una variable discreta puede tomar valores
observados únicamente en puntos aislados
(proceso de conteo).
 Una variable continua puede adoptar un valor
en cualquier punto fraccionario a lo largo de
un intervalo especificado
 Ejemplo 3
 Discretos. Número de personas por hogar en una
colonia
 Continuas. Promedio de personas por hogar en
una colonia
10
Obtención de datos
 Observación directa. El investigador ejerce un control
deliberado de algunos o todos los factores que
pueden influir en la variable
 Ejemplo 4
 Una línea de ensamble para detectar
elementos defectuosos con base en un
criterio
 Encuesta. Cuando la información se debe obtener de
fuentes individuales mediante entrevistas personales,
entrevistas telefónicas o cuestionarios
 Ejemplo 5
 Nivel de empleo en diferentes empresas
mediante una encuesta a cada una de ellas
11
Muestreo aleatorio
 Es un tipo de muestreo donde todos los
elementos de la población de interés o
población objetivo tienen una oportunidad
conocida, usualmente igual de ser elegidos
 Muestreo simple
 Muestreo sistemático
 Muestreo estratificado
 Muestreo por conglomerados
12
Muestreo aleatorio simple
 Es aquel cuyos elementos se seleccionan
individualmente de la población objetivo
entera con base en el azar
 Ejemplo 6
 Uso de la función aleatorio de Excel

13
Muestreo sistemático
 Es una muestra aleatoria, cuyos elementos
se seleccionan de la población de un
intervalo uniforme en una lista ordenada
 Ejemplo 7
 Seleccionar al azar una cuenta bancaria y a partir
de ahí elegir las siguientes nueve
14
Muestreo estratificado
 Los elementos de la población son
primeramente clasificados por el investigador
en distintos subgrupos o estratos sobre la
base de una o más características
importantes
 Ejemplo 8
 Las elecciones pasadas antes de la votación

15
Muestreo por conglomerados
 Es un tipo de muestreo aleatorio donde los
elementos de la población ocurren
naturalmente en subgrupos
 Ejemplo 9
 Un analista de un departamento estatal de
seguridad económica desea estudiar los índices
salariales por hora que se pagan en el área
metropolitana, sería complicado hacerlo
trabajador por trabajador, en cambio podría
obtenerse una lista de las empresas en esa zona.
El analista puede tomar una muestra simple de
ese conglomerado

16
Problemas
 En el área de las mediciones estadísticas,
como las representadas por cuestionarios, la
confiabilidad se refiere a la consistencia del
instrumento de medición y la validez a su
precisión. Si un cuestionario ofrece
resultados similares tras ser contestado por
dos grupos equivalentes de informantes,
puede describírsele como confiable. ¿El
hecho de que sea confiable garantiza por lo
tanto que sea valido?
17
Problemas
 En los siguientes tipos de valores, designe variables
discretas y variables continuas
a) El número de unidades de un artículo en existencia
b) Razón de activos circulantes contra pasivos
circulantes
c) Tonelaje total embarcado
d) Cantidad embarcada en unidades
e) Volumen de tráfico en una carretera de paga
f) Asistencia a la asamblea anual de una compañia
18
Problemas
 ¿Cuáles son muestra y cuáles una
población?
a) El universo completo
b) Aplicación de conceptos de probabilidad
c) Inspección de cada artículo ensamblado
d) Inspección de cada décimo artículo
ensamblado

19
Trabajo de investigación
 Un auditor desea tomar una muestra
aleatoria simple de tamaño 50 de 9 600
cuentas por cobrar de una gran empresa. Las
cuentas se enumeran secuencialmente de la
0001 a la 9600. Use la hoja de cálculo Excel
para obtener una lista de los 50 números
aleatorios requeridos y mándela por correo
electrónico
20
Correo electrónico
 ceg@softcat.com.mx
 ceg@tutopia.com
 Se creará un correo electrónico donde
mandaré algunas prácticas y lecturas
complementarias
 estadistica@softcat.com.mx
 Password essof
 Para entrar: http://owa.vivetelmex.com
21
Representaciones estadísticas y
análisis de gráficas
 Distribución de frecuencias. Es una tabla en
la cual se agrupan en clases valores posibles
de una variable y donde se registra el
número de valores observados
correspondientes a cada clase
22
Datos agrupados
Son los datos organizados en una
distribución de frecuencias
 Ejemplo 10


Salario Semanal Numero de trabajadores (f)
$ 240-259
260-279
280-299
300-319
320-339
340-359
7
20
33
25
11
4
Total 100
23
Límites nominales
 Son los valores incluidos en cada clase
 Ejemplo 11
Salario Semanal Numero de trabajadores (f)
$ 240-259
260-279
280-299
300-319
320-339
340-359
7
20
33
25
11
4
Total 100
24
Limites exactos de clase
 Son los puntos específicos que sirven para separar
clases adyacentes en una escala de medición de
variables continuas
 Ejemplo 12
Salario semanal
(límites nominales)
Limites exactos de
clase
$ 240-259
260-279
280-299
300-319
320-339
340-359
$ 239.50-259.50
259.50-279.50
279.50-299.50
299.50-319.50
319.50-339.50
339.50-359.50
25
Punto medio de clase
 Se refiere a la suma del límite inferior de la
clase con el límite superior dividido entre dos
 Ejemplo 13
Salario semanal
(límites nominales)
Limites exactos de
clase
Punto
medio
$ 240-259
260-279
280-299
300-319
320-339
340-359
$ 239.50-259.50
259.50-279.50
279.50-299.50
299.50-319.50
319.50-339.50
339.50-359.50
$249.50
269.50
289.50
309.50
329.50
349.50
26
Intervalo de clase
 Se identifica restando el límite exacto de
clase inferior del límite exacto de la clase
superior
 Ejemplo 14
 Intervalo de clase=259.50-239.50=20

27
Intervalo aproximado



 Ejemplo 15
 Intervalo aproximado=(360-240)/6=20

deseadas clases de número
agrupados no
datos en r menor valo
agrupados no
datos en r mayor valo
aproximado Intervalo
(
¸
(

¸

÷
(
¸
(

¸

=
28
Histograma de frecuencias
 Un histograma es una gráfica de barras de
distribución de frecuencias, se acostumbra colocar
los límites exactos
 Ejemplo 16
0
5
10
15
20
25
30
35
239.50 259.50 279.50 299.50 319.50 339.50 359.50
29
Polígono de frecuencias
 Es una gráfica de líneas de distribución de
frecuencias, donde suele identificarse el punto medio
de cada clase
 Ejemplo 17
0
5
10
15
20
25
30
35
229.5 249.5 269.5 289.5 309.5 329.5 349.5 369.5
30
Curva de frecuencias
 Es un polígono de frecuencias pero suavizado
 Ejemplo 18
0
5
10
15
20
25
30
35
229.5 249.5 269.5 289.5 309.5 329.5 349.5 369.5
31
Curtosis
 Platicurtica: plana, con las observaciones
distribuidas en forma relativamente pareja
 Leptocurtica: afilada, con las observaciones
concentradas en un estrecho rango de
valores
 Mesocurtica: ni plana ni afilada
32
Asimetría
 Asimétrica negativa
 Simétrica
 Asimétrica positiva
33
Frecuencias acumuladas
 Identifica el número acumulado de observaciones
incluidas bajo el límite exacto superior de cada clase
de la distribución
 Ejemplo 19
Salario semanal
(límites nominales)
Limites exactos
de clase
superior
Número de
trabajadores
Frecuencias
acumuladas
$ 240-259
260-279
280-299
300-319
320-339
340-359
$ 259.50
279.50
299.50
319.50
339.50
359.50
7
20
33
25
11
4
7
20+7=27
33+27=60
25+60=85
85+11=96
96+4=100
34
Ojiva
 Se le denomina a la gráfica de una
distribución de frecuencias acumuladas
0
20
40
60
80
100
120
239.5 259.5 279.5 299.5 319.5 339.5 359.5
35
Diagramas circulares
 Es una figura en forma de pastel cuyas
piezas representan divisiones de una
cantidad total, como podría ser la distribución
de las ventas de una compañia
65% 5%
5%
25%
Principal
Nichos
En Desarrollo
En crecimiento
36
Problemas
 En la siguiente tabla se enlistan los tiempos
requeridos para la conclusión de una tarea
de ensamble para una muestra de 30
empleados que presentaron su solicitud de
ascenso a un puesto de ensamble de
precisión
10 14 15 13 17
16 12 14 11 13
15 18 9 14 14
9 15 11 13 11
12 10 17 16 12
11 16 12 14 15
37
Problemas (2)
 Determine el tamaño del intervalo
correspondiente
 Intervalo aproximado=(18-9)/5=1.80
 Por lo que nuestro intervalo es conveniente
cerrarlo a 2.0, así que nuestra distribución de
frecuencias quedaría de la siguiente forma
Tiempo en min. Número de empleados
9-10
11-12
13-14
15-16
17-18
4
8
8
7
3
Total 30 Emp.
38
Problemas (3)
 La tabla con límites exactos y punto medio para
cada clase quedaría de la siguiente forma
Tiempo en min. Punto medio Número de
empleados
8.5-10.5
10.5-12.5
12.5-14.5
14.5-16.5
16.5-18.5
9.5
11.5
13.5
15.5
17.5
4
8
8
7
3
Total 30 Emp.
39
Problemas (4)
 Elaborar un histograma en Excel
 Elaborar el polígono de frecuencias en Excel
 Elaborar la curva de frecuencias en Excel
 Describir la curva de frecuencias

40
Problemas (5)
 Elaborar una distribución de frecuencias
acumuladas y
a) Trace la ojiva de porcentajes de esos datos
b) ¿En que punto percentil se encontraría un
tiempo de ensamble de 15.5 minutos?
c) haga una grafica circular de los empleados
con respecto a los tiempos
41
Problemas (6)
Tiempo, en min. Frecuencia Frecuencia
acumulada
% acumulado
8.5-10.5
10.5-12.5
12.5-14.5
14.5-16.5
16.5-18.5
4
8
8
7
3
4
12
20
27
30
4*100/30=13.3
12*100/30=40
66.7
90
100
 Elaborar una distribución de frecuencias
acumuladas
42
Problemas (7)
 Ojiva de la frecuencia
acumulada y del
porcentaje acumulado
 El porcentaje percentil
en 15.5 minutos es 80
 La gráfica circular se
muestra

0
20
40
60
80
100
120
8.5 10.5 12.5 14.5 16.5 18.5
13%
27%
27%
23%
10%
8.5
10.5
12.5
14.5
16.5
43
Trabajo de investigación 2
 En la tabla siguiente se presentan las cantidades de 40
préstamos personales utilizados para financiar la compra de
muebles y aparatos eléctricos. Ordene en una distribución de
frecuencias con un total de siete clases
a) ¿Cuál sería el intervalo de clase más conveniente?
b) Elabore una distribución de frecuencias iniciando con un
límite de clase inferior de 300 y aplicando el intervalo de
clase del inciso A
c) Elabore un histograma de distribución de frecuencias
d) Elabore un polígono de frecuencias y una curva de
frecuencias
e) Describa la curva de frecuencias resultante
f) Elabore una distribución de frecuencias acumuladas de la
distribución de frecuencias y trace la ojiva con esos datos
g) Genere una gráfica circular
h) Entregue todos los resultados anteriores en Excel
44
Trabajo de investigación 2
$832 $1100 $456 $1227
615 654 1290 854
652 873 400 2012
1800 666 1616 446
1100 728 1524 780
1300 1388 1000 870
2300 850 1890 600
486 429 835 2000
1700 1423 700 380
1219 800 656 1490
45
Descripción de datos económicos y administrativos
(Medidas de posición y de variabilidad)
 Medida de posición. Es un valor calculado de
un grupo de datos que sirve para describir a
éstos de alguna manera
46
Media aritmética
 Es la suma de los valores del grupo de datos
dividida entre el número de valores
muestra una de a descriptiv Media
población una de a descriptiv Media
n
X
N
X
¿
=
¿
=
X
µ
47
Media aritmética
 Ejemplo 20
 Durante los meses del verano, ocho vendedores de
una empresa de servicios de calefacción y aire
acondicionado vendieron el siguiente número de
unidades centrales de aire acondicionado:
8,11,5,14,8,11,16,11
unidades
N
X
5 . 10
8
84
= =
¿
= µ
48
Media ponderada
 Es una media aritmética en donde cada uno de los
valores se pondera de acuerdo con su importancia
en el grupo general. Las fórmulas de la media
ponderada poblacional y muestral son idénticas
¿
¿
=
w
wX
w
w
) (
X ó µ
49
Media ponderada
 Ejemplo 21
 El margen de utilidad en el último año fiscal de las
cuatro líneas de productos de una compañía
fabricante de múltiples bienes fue: Línea A=4.2%;
Línea B=5.5%; Línea C=7.4%; Línea D=10.1%
 Si sacamos la media con la fórmula anterior quedaría




 Sin embargo, como las ventas de los cuatro productos
no son iguales, este promedio no ponderado es
incorrecto

% 8 . 6
4
27.2
= =
¿
=
N
X
µ
50
Media ponderada
 Así que debemos observar la tabla de ventas







 Con respecto a la fórmula
Línea de productos Margen de
utilidad (X)
Ventas (w) wX
A
B
C
D
4.2%
5.5%
7.4%
10.1%
$30,000,000
20,000,000
5,000,000
3,000,000
1,260,000
1,100,000
370,000
303,000
% 2 . 5
000 , 000 , 58 $
000 , 033 , 3 $
) (
= =
¿
¿
=
w
wX
w
µ
51
Mediana
 La mediana de un grupo de elementos es el
valor del elemento inmediato cuando todos
los elementos de un grupo siguen, en
términos de valor, un orden ascendente o
descendente


 De nuestro ejemplo 20, al ordenar en forma
ascendente, quedaría 5,8,8,11,11,11,14,16,
el valor de la mediana es:
X(8/2+1/2)=X4.5=11
| | ) 2 / 1 ( ) 2 / ( +
=
n
X Med
52
Moda
 Es el valor que ocurre más frecuentemente
en un conjunto de valores . Para nuestro
ejemplo anterior, la moda es 11
53
Relación entre media, mediana y moda
 Cuando la curva graficada es simétrica, la
moda, mediana y media son iguales, cuando
es asimétrica positiva, la media siempre es
mayor que la mediana y la moda, viceversa
en una asimétrica negativa
 ¿Cómo sería la curva para nuestro ejemplo
anterior?
54
Uso de media, mediana y moda
 Con respecto a población
 El valor de la moda indica la posición de la
mayoría de los valores observados. Puede ser
útil como medida descriptiva de un grupo de la
población, aunque sólo si existe una moda
claramente perceptible
 La mediana siempre es una medida excelente
para representar el nivel «típico» de los
valores
 La media también es un valor excelente
siempre y cuando la población sea simétrica,
por lo que para datos de población la mediana
es más significativa
55
Uso de media, mediana y moda
 Con respecto a muestras
 El valor de la moda no es aceptable
 La mediana es más aceptable
 La media para éste caso es mejor ya que es
más estable
 Ejemplo 22
 Índices salariales de los 650 empleados de una
empresa
 Una muestra aleatoria de 100 trabajadores
56
Cuartiles, deciles y percentiles
 Es lo mismo que la mediana, sólo que los
cuartiles dividen la muestra en cuartos, los
deciles en décimos y los percentiles en 100
partes

| |
| |
| | ) 2 / 1 ( ) 100 / 70 ( 70
) 2 / 1 ( ) 10 / 3 ( 3
) 2 / 1 ( ) 4 / ( 1
percentil) imo (septuagés
decil) (tercer
cuartil) (primer
+
+
+
=
=
=
n
n
n
X P
X D
X Q
57
Problemas
 En una muestra de las compras de 15 estudiantes en
la tienda de una escuela primaria se observan las
siguientes cantidades de ventas, dispuestas en
orden de magnitud ascendente: $ 1.00, 1.00,2.50,
2.50, 2.50, 3.50, 4.00, 5.30, 9.00, 12.50, 13.50,
24.50, 27.10, 30.90, 41.00 Determine la media,
mediana y la moda
 Media= $12.05
 Mediana= X8= $5.30
 Moda= $2.50
 Dado que la media es sustancialmente mayor que la
mediana, la distribución de valores es claramente
asimétrica positiva
58
Problemas
 Con base en la siguiente tabla, determine el
porcentaje global de artículos defectuosos
ensamblados durante la semana muestreada
Turno Porcentaje de artículos
defectuosos (X)
Número de artículos
en miles (w)
wX
1
2
3
1.1%
1.5%
2.3%
210
120
50
2.31
1.80
1.15
% 4 . 1
380 $
26 . 5 $
) (
= =
¿
¿
=
w
wX
w
X
59
Trabajo de investigación (3)
 El número de accidentes ocurridos en un mes dado en los 13
departamentos de manufactura de una planta industrial fue:
1,2,2,3,3,10,1,0,8,1,0,5,10. Calcule la media, la mediana y la
moda. Describa la distribución de índices de accidentes en
términos de asimetría
 Supongamos que los precios de menudeo de artículos
seleccionados cambian como se indica en la tabla siguiente.
Determine el cambio porcentual medio en precios al menudeo
sin referencia a los gastos promedio incluidos en la tabla y
posteriormente el cambio porcentual medio ponderado
Artículo Incremento
Porcentual
Gastos promedio por
mes
Leche
Carne de res
Ropa
Gasolina
8%
-2
-4
8
$30
40
50
60
60
Medida de variabilidad en conjuntos de datos
 Las medidas de posición son útiles para la
identificación del valor representativo de un
grupo de valores. Por su parte, las medidas
de variabilidad o dispersión se ocupan de la
descripción de la variabilidad entre los
valores mediante diversas técnicas: rango,
rangos modificados, desviación media,
varianza, desviación estándar y el coeficiente
de variación
61
Rango
 El rango, o R, es la diferencia entre los
valores más alto y más bajo incluidos en un
conjunto de datos
 Ejemplo 23
 Durante un mes de verano, los ocho vendedores
de una empresa de equipos de calefacción y aire
acondicionado vendieron los siguientes números
de unidades: 8, 11, 5, 14, 8, 11, 16, 11
 Rango= My-Mn = 16-5 = 11 unidades
62
Rango modificado
 Es un rango que se construye eliminando
algunos de los valores extremos de cada una
de las porciones finales de la distribución. El
50% central es el rango entre los valores en
el 25º punto percentil y el 75º punto percentil
de la distribución. De este modo, también es
el rango entre el primer y tercer cuartiles de
la distribución. Por este motivo, el rango del
50% central suele llamársele rango
intercuartil (RIC)
 RIC=Q
3
-Q
1
63
Rango modificado
 Ejemplo 24
 Los datos de ventas de unidades centrales
presentados en el ejemplo anterior son en
orden ascendente los siguientes:
5,8,8,11,11,11,14,16. En consecuencia, el
número de observaciones es N=8
 Q
3
= X
[(75N/100)+(1/2)]
= X
[6+(1/2)]
= X
6.5
= 12.5
 Q
1
= X
[(25N/100)+(1/2)]
= X
[2+(1/2)]
= X
2.5
= 8
 RIC= Q
3
-Q
1
= 12.5-8= 4.5


64
Desviación media
 Se basa en el valor absoluto de la diferencia entre
cada valor del conjunto de datos y la media del grupo
n
X X
N
X
¿
=
¿
=
÷
÷
| |
| |
muestra la de DMA
población la de DMA
µ
65
DMA
 Ejemplo 25
 Durante un mes de verano, los ocho vendedores de una
empresa de equipos de calefacción y aire acondicionado
vendieron los siguientes números de
unidades:8,11,5,14,8,11,16,11
 Media aritmética o µ es 10.5 de acuerdo con el ejemplo anterior
X X-µ |X-µ|
5
8
8
11
11
11
14
16
-5.5
-2.5
-2.5
0.5
0.5
0.5
3.5
5.5
5.5
2.5
2.5
0.5
0.5
0.5
3.5
5.5
21.0
21/8=2.6
unidades
66
DMA
 Por lo tanto, podemos decir que en promedio,
la venta de unidades de equipo de aire
acondicionado de un vendedor difiere en 2.6
unidades respecto de la media grupal, en
cualquier dirección
67
Varianza
 La varianza se asemeja a la desviación
media absoluta en que se basa la diferencia
entre cada valor del conjunto de datos y la
media del grupo, pero se distingue de ella en
un muy importante aspecto, cada diferencia
se eleva al cuadrado
N
x
X V
¿
= =
÷
2
) (
2
) (
µ
o
68
Varianza
 A diferencia de lo que ocurre con las demás
estadísticas muestrales, la varianza de una muestra
no equivale exactamente, en términos de cálculo, a
la varianza de una población. En esencia en esta
fórmula se incluye un factor de corrección, a fin de
que la varianza muestral sea un estimador insesgado
1
) (
2
2
÷
÷
=
¿
n
X X
s
69
Desviación estándar
 En general es difícil interpretar el significado
de la varianza, porque las unidades en las
que se expresa son valores elevados al
cuadrado. Debido en parte a esta razón, es
más frecuente el uso de la raíz cuadrada de
la varianza, representada por la letra griega σ
o por «s» en el caso de una muestra. A esto
se le llama desviación estándar
70
Desviación estándar
 Las fórmulas son:
1
) (
) (
2
2
muestra la De
población la De
÷
÷
÷
¿
=
¿
=
n
X x
N
x
s
µ
o
71
Desviación estándar
 Ejemplo 26
 Durante un mes de verano, ocho vendedores de una
empresa de equipos de calefacción y aire acondicionado
vendieron los siguientes números de unidades:
8,11,5,14,8,11,16,11
 La media aritmética o µ es 10.5 de acuerdo con el ejemplo
anterior
X X-µ (X-µ)
2
5
8
8
11
11
11
14
16
-5.5
-2.5
-2.5
0.5
0.5
0.5
3.5
5.5
30.25
6.25
6.25
0.25
0.25
0.25
12.25
30.25
86.00
72
Desviación estándar
3 . 3 75 . 10
8
86
2
) (
= = =
¿
=
÷
N
x µ
o
73
Cálculos simplificados
1
2
2
2
2 2
2
2
2
2 2
muestra la de estandar Desviación
1
s muestra la de Varianza
población la de estándar Desviación
población la de Varianza
÷
÷
÷
¿
=
÷
÷
=
¿
=
÷
=
¿
¿
n
X n X
N
N X
s
n
X n X
N
N x
µ
o
µ
o
74
Desviación estándar
 Ejemplo 27
 Durante un mes de verano, ocho vendedores de una
empresa de equipos de calefacción y aire acondicionado
vendieron los siguientes números de unidades:
8,11,5,14,8,11,16,11
 Media aritmética o µ es 10.5 de acuerdo con el ejemplo
anterior
X X
2
5
8
8
11
11
11
14
16
25
64
64
121
121
121
196
256
968
3 . 3 75 . 10
8
) 5 . 10 ( 8 968
2
2 2
= =
÷
=
¿
=
÷
N
N X µ
o
75
Uso de la desviación estándar
 Cuando existe una distribución de valores, tanto
simétrica como mesocúrtica, la curva de frecuencias
de una distribución se le llama curva normal, siempre
que ocurre una curva semejante a esto, 68% de los
valores quedan dentro del margen de la desviación
estándar y 95% quedan incluidos dentro de un
margen de dos unidades de desviación estándar
68
% 95%
76
Descripción de datos
 Ejemplo 28
 Las cuentas de energía eléctrica de una zona
residencial correspondientes al mes de junio
tienen una distribución normal, si se calcula
que la media de estas cuentas es de $84.00
con una desviación estándar de $24.00, de
ello se desprende que 68% de las cantidades
facturadas están entre $60.00 y $108.00, así
como que 95% de los valores están entre
$36.00 y $132.00
77
Coeficiente de variación
 Indica la magnitud relativa de la desviación estándar
en comparación con la media de la distribución de las
medidas, expresada como porcentaje, es útil cuando
se desea comparar la variabilidad de dos conjuntos
de datos en relación con el nivel general de los
valores (y por lo tanto con la media)
100 Muestra
100 Población
× =
× =
X
s
CV
CV
µ
o
78
Coeficiente de variación
Ejemplo 29
Respecto a dos emisiones de acciones ordinarias de la
industria electrónica, durante el periodo de un mes fue de
$150 con una desviación estándar de $5 para las acciones A
y de $50 con una desviación estándar de $3 para las
acciones B. Con base en la comparación absoluta, la
variabilidad del precio de las acciones A fue mayor a causa
de una mayor desviación estándar. Pero en cuanto al nivel
de los precios se deben comparar mediante el coeficiente de
variación
A acciones las que
variables más veces dos casi fueron B acciones las que Concluimos
% 0 . 6 100
50
3
100 ) (
% 3 . 3 100
150
5
100 ) (
= × = × =
= × = × =
µ
o
µ
o
B CV
A CV
79
Coeficiente de asimetría de Pearson
 Mide la desviación respecto de la simetría
expresando la diferencia entre la media y la mediana
en relación con la desviación estándar del grupo de
medidas
s
Med X
Med
) ( 3
muestra la de Asimetría
) ( 3
población la de Asimetría
÷
=
÷
=
o
µ
80
Pearson
Ejemplo 30
Con respecto a los datos de ventas de
equipos de aire acondicionado, la media es
10.5, la mediana 11 y la desviación estándar
3.3 por lo que el coeficiente de asimetría es
Asimetría= 3(µ-Med)/σ= 3(10.5-11.0)/3.3=
-0.45
 Por lo que la distribución de cantidades de
ventas es en cierto modo asimétrica negativa
o sesgada a la izquierda
81
Problemas
 Una muestra de 20 obreros obtuvo los siguientes
salarios por una semana dada, redondeados al dólar
más cercano y dispuestos en orden ascendente:
$240, 240, 240, 240, 240, 240, 240, 240, 255, 255,
265, 265, 280, 280, 290, 300, 305, 325, 330, 340.
Determine:
a) El rango
b) EL RIC
c) DMA
d) Varianza
e) Desviación estándar
f) Varianza y desviación estándar con la fórmula
alternativa
g) El Coeficiente de variación
h) El coeficiente de asimetría de Pearson
82
Problemas
a) Rango. R=My-
Mn=$340-240=$100
b) RIC=Q3-
Q1=X(3n/4+1/2)-
X(n/4+1/2)= X(15.5)-
X(5.5)=295-240=$55
c) Se debe obtener
primero la media
muestral=X=$5410/20
=$270.50
X X-X |X-X| (X-X)2
$ 240.00 -$ 30.50 $ 30.50 $ 930.25
$ 240.00 -$ 30.50 $ 30.50 $ 930.25
$ 240.00 -$ 30.50 $ 30.50 $ 930.25
$ 240.00 -$ 30.50 $ 30.50 $ 930.25
$ 240.00 -$ 30.50 $ 30.50 $ 930.25
$ 240.00 -$ 30.50 $ 30.50 $ 930.25
$ 240.00 -$ 30.50 $ 30.50 $ 930.25
$ 240.00 -$ 30.50 $ 30.50 $ 930.25
$ 255.00 -$ 15.50 $ 15.50 $ 240.25
$ 255.00 -$ 15.50 $ 15.50 $ 240.25
$ 265.00 -$ 5.50 $ 5.50 $ 30.25
$ 265.00 -$ 5.50 $ 5.50 $ 30.25
$ 280.00 $ 9.50 $ 9.50 $ 90.25
$ 280.00 $ 9.50 $ 9.50 $ 90.25
$ 290.00 $ 19.50 $ 19.50 $ 380.25
$ 300.00 $ 29.50 $ 29.50 $ 870.25
$ 305.00 $ 34.50 $ 34.50 $ 1,190.25
$ 325.00 $ 54.50 $ 54.50 $ 2,970.25
$ 330.00 $ 59.50 $ 59.50 $ 3,540.25
$ 340.00 $ 69.50 $ 69.50 $ 4,830.25
Total $ 572.00 $21,945.00
83
Problemas
Por lo que el DMA de la muestra quedaría:



d) La varianza sería



e) La desviación estándar
60 . 28 $
20
00 . 572 $ | |
= =
¿
÷
N
X µ
00 . 1155
1 20
00 . 21945
1
) (
2
2
=
÷
=
÷
÷
=
¿
n
X X
s
99 . 33 $ 00 . 1155 ~ = s
84
Problemas
f) Ocupando las fórmulas obtenemos



g) Dado que X=$270.50 y s=$33.99
 CV=s/X*100=33.99/270.50=.1256*100=12.6%
h) Asimetría=3(X-Med)/s=3(270.5-260)/33.99=0.93
 Por lo que concluimos que la distribución de los datos
salariales es ligeramente asimétrica positiva
9 . 33 1155 muestra la de estandar Desviación
1155
19
) 5 . 270 ( 20 1485350
1
s muestra la de Varianza
1
2
2
2
2
2 2
= =
¿
=
=
÷
=
÷
÷
=
÷
÷
¿
n
X n X
s
n
X n X
85
Trabajo de investigación 4
 Las siguientes calificaciones en examen dispuestas en orden
ascendente fueron obtenidas por 20 estudiantes inscritos en un
curso de análisis de decisión:
49,46,67,75,80,82,82,85,87,89,89,89,89,89,89,89,93,94,97,100.

Determine
a) El rango
b) EL RIC
c) DMA
d) Varianza
e) Desviación estándar
f) Varianza y desviación estándar con la fórmula alternativa
g) El coeficiente de variación
h) El coeficiente de asimetría de Pearson
86
Probabilidad
 Históricamente se han desarrollado tres enfoques
conceptuales para definir la probabilidad: los
enfoques clásico, de frecuencias relativas y subjetivo.
De acuerdo con el enfoque clásico




 Dado que este enfoque permite determinar valores de
probabilidad antes de que sean observados
cualesquiera eventos muestrales, también se le
conoce como enfoque a priori

) (
) (
) (
S N
A N
A P =
87
Probabilidad
Ejemplo 31
 En un mazo de naipes debidamente barajado
que contiene 4 ases y otros 48 naipes, la
probabilidad de obtener un as en una sola
extracción es de:
 4/52=0.077
88
Expresión de probabilidad
 La probabilidad de un evento se indica con el
símbolo P. Así, P(A) denota la probabilidad
de que ocurra el evento A en una sola
observación o experimento.

89
Momios
 La razón de momios a favor de la ocurrencia
de un evento es la razón del número relativo
de resultados, representados por «a», a favor
de A respecto del número relativo de
resultados, representados por b, que no
están a favor de A:
 Momios=a:b (léase «a a b»)
90
Momios
 Ejemplo 32
 Supongamos que un éxito se define como la
extracción de cualquier naipe con figura o de
un as de un mazo debidamente barajado de
52 naipes. Dado que 16 de los 52 naipes son
ya sea sota, reina, rey o as. Por lo tanto, los
momios asociados al éxito son 16:36. Por lo
tanto la probabilidad de éxito es
 P(A)=N(A)/N(S)=a/(a+b)=16/(16+36)=16/52
91
Eventos mutuamente excluyentes y no
excluyentes
 Excluyentes. Son eventos que no pueden
ocurrir al mismo tiempo, por ejemplo sacar un
rey y un as al mismo tiempo
 No excluyentes. Son eventos que pueden
ocurrir al mismo tiempo, por ejemplo sacar un
as y un trebol
92
Reglas de la adición
 Excluyentes
 P(A o B) =P(AυB)=P(A)+P(B)
 No excluyentes
 P(A o B) =P(A)+P(B)-P(A y B)
 Ejemplo 33
 ¿Cuál es la probabilidad de extraer un as o un
rey? = 4/52+4/52=8/52
 ¿Cuál es la probabilidad de sacar un as o un
trébol o ambos en una sola extracción? =
4/52+13/52-1/52=16/52
93
Eventos independientes, eventos
dependientes y probabilidad condicional
 Dos eventos son independientes cuando la ocurrencia o
no ocurrencia de un evento no tiene ningún efecto en la
probabilidad de ocurrencia del otro evento. Dos eventos
son dependientes cuando la ocurrencia o no ocurrencia
de un evento afecta la probabilidad de ocurrencia del
otro evento
 Ejemplo 34.
 Una moneda es independiente en cada
lanzamiento
 Obtener un as en una baraja es dependiente,
puesto que para la siguiente extracción sólo se
podrá sacar una probabilidad de 3/51
 P(A)=P(A|B)
94
Reglas de la multiplicación
 Se refieren a la determinación de la
probabilidad de la ocurrencia conjunta de A y
B. Existen dos variantes de la regla de la
multiplicación si los eventos son
independientes o dependientes
 Para eventos independientes
 P(A y B)=P(A ∩ B)=P(A)P(B)
 Para eventos dependientes
 P(A y B)=P(A)P(B|A)
 P(B y A)=P(B)P(A|B)
95
Ejemplos de multiplicación
 Ejemplo 35
 Si una moneda equilibrada se lanza dos veces, la
probabilidad de que ambos lanzamientos den por
resultado «sol» es:


 Ejemplo 36
 Supongamos que se sabe que un conjunto de 10
partes de repuesto contiene ocho partes
aceptables y dos partes defectuosas. ¿Cuál es la
probabilidad de que las dos partes seleccionadas
sean defectuosas?, ¿cuál es la probabilidad de
que sean aceptables?

4
1
2
1
2
1
= ×
aceptables
90
56
9
7
10
8
= ×
96
Teorema de Bayes
 En su forma algebraica más simple, el teorema de
Bayes consiste en la determinación de la
probabilidad condicional del evento A dada la
ocurrencia del Evento B. Sin embargo, la especial
importancia del teorema de Bayes es que se aplica
en el contexto de eventos secuenciales y, además,
que la versión de cálculo de la fórmula es la base
para determinar la probabilidad condicional de que
un evento haya ocurrido en la primera posición
secuencial una vez que un evento en particular ha
sido observado en la segunda posición secuencial


) ' | ( ) ' ( ) | ( ) (
) | ( ) (
) | (
A B P A P A B P A P
A B P A P
B A P
+
=
97
Diagramas de árbol
 Ejemplo 37
 Supongamos que contamos con dos urnas U
1
y U
2
. La
urna 1 contiene 8 pelotas rojas y 2 pelotas verdes,
mientras que la urna 2 contiene 4 pelotas rojas y 6
pelotas verdes, si se selecciona aleatoriamente una
urna y de ella se selecciona aleatoriamente una pelota,
el proceso y las probabilidades secuenciales pueden
representarse mediante un diagrama de árbol.

.50
.50
U1
U2
R
V
R
V
.80
.20
.40
.60
98
Ejemplos del teorema
 Ejemplo 38
 Supongamos que observamos una pelota verde en el
segundo paso, ¿cuál es la probabilidad de que la urna
1 haya sido seleccionada en el paso uno?
25 . 0
40 . 0
10 . 0
) 60 . 0 )( 50 . 0 ( ) 20 . 0 )( 50 . 0 (
) 20 . 0 )( 50 . 0 (
) | ( ) ( ) | ( ) (
) | ( ) (
) | (
2 2 1 1
1 1
1
= =
+
=
+
=
U V P U P U V P U P
U V P U P
V U P
99
Permutaciones
 Ejemplo 39
 Tres miembros de una organización social se
ofrecen como voluntarios para fungir como
dirigentes el siguiente año en los puestos de
presidente, tesorero y secretario. El número
de maneras (permutaciones) en los que los
tres pueden asumir los puestos es:
 n!=3!=(3)(2)(1)=6 maneras
 Cuando nos interesan las permutaciones de
un subgrupo se ocupa la fórmula
)! (
!
r n
n
P
r n
÷
=
100
Combinaciones
 En el caso de las permutaciones, el orden de
acomodo de los objetos es importante. En el
caso de las combinaciones, lo que nos
interesa es el número de diferentes
agrupaciones de los objetos que pueden
ocurrir sin reparar en su orden (hacerlo en
clase)
)! ( !
!
r n r
n
P
r n
÷
=
101
Problemas de probabilidad
 Determine el valor de la probabilidad aplicable a
cada una de las siguientes situaciones
 La probabilidad de accidentes industriales en un año.
Una muestra aleatoria de 10 empresas con 8 000
empleados, reportó la ocurrencia de 400 accidentes
 La probabilidad de acertar a un número ganador en un
juego de ruleta, los números son 0, 00 y del 1 al 36
 Respuesta 1. P=400/8000=0.05
 Respuesta 2. P=1/38
102
Problemas de adición
 Determine la probabilidad de obtener un as (A), un
rey (R) o un dos (D), al extraer un naipe de un mazo
debidamente barajado de 52 naipes
 De 300 estudiantes de administración, 100 están
actualmente inscritos en contabilidad y 80 están
actualmente inscritos en estadística aplicada. Estas
cifras de inscripción incluyen a 30 estudiantes
inscritos en ambos cursos. ¿Cuál es la probabilidad
de que si se elige a un estudiante al azar esté
inscrito en contabilidad o en estadística?
 Respuesta 1. P=4/52+4/52+4/52=12/52
 Respuesta 2. P=100/300+80/300-30/300=150/300=.5
103
Problemas de multiplicación
 En general, la probabilidad de que un prospecto
realice una compra después de haber sido
contactado por un vendedor es P=0.40. Si un
vendedor selecciona aleatoriamente tres prospectos
de un expediente y establece contacto con ellos,
¿cuál es la probabilidad de que los tres realicen la
compra?
 De 12 cuentas contenidas en un expediente, cuatro
contienen un error de procedimiento en su saldo. Si
un auditor selecciona aleatoriamente dos de estas
cuentas, ¿cuál es la probabilidad de que ninguna de
ellas contenga un error de procedimiento? elabore un
diagrama de árbol para representar este proceso de
muestreo secuencial
104
Solución de problemas de multiplicación
 Problema 1. Dado que los compradores son
independientes entre sí P=.40x.40x.40=0.064
 Problema 2. Los eventos de este ejemplo son
dependientes, porque el resultado de la primera
cuenta muestreada afecta las probabilidades para la
segunda por lo que P=8/12x7/11=56/132=0.42
E1
E1
E2
E2
E2
E2
4/12
8/12
3/11
8/11
4/11
7/11
105
Problemas teorema de Bayes
 Se sabe que la caja A contiene una moneda de un centavo y
una moneda de 10 centavos. Mientras que la caja B contiene
dos monedas de 10 centavos. Se elige aleatoriamente una de
ellas, de la que después se selecciona aleatoriamente una
moneda.
a) Elabore un diagrama de árbol para describir esta situación
de eventos secuenciales.
b) Si en el primer paso se selecciona la caja A, ¿cuál es la
probabilidad de que en el segundo se seleccione una
moneda de 10 centavos?
c) Si en el segundo paso se selecciona una moneda de 10
centavos, ¿cuál es la probabilidad de que provenga de la
caja A?
d) Si en el segundo paso se selecciona una moneda de un
centavo, ¿cuál es la probabilidad de que provenga de la
caja A?
106
Solución teorema de Bayes
a) P(D|A)=1/2=0.50

b)
A
B
C
D
C
D
1/2
1/2
1/2
1/2
0
1
33 . 0 ) (
) ( ) (
) (
) 1 )( ( ) )( (
) )( (
) | ( ) ( ) | ( ) (
) | ( ) (
) (
) (
) | (
3
1
2
1
4
1
4
1
2
1
2
1
2
1
2
1
2
1
~ =
+
=
+
=
+
= =
B D P B P A D P A P
A D P A P
D P
AyD P
D A P
107
Solución teorema de Bayes
c)




 Los cinco individuos que componen la dirección de una pequeña
empresa manufacturera serán sentados juntos en un banquete.
a) Determine el número de diferentes disposiciones posibles de
los asientos para los cinco individuos
b) Supongamos que sólo tres de los cinco directivos se les
pedirá representar a la compañía en el banquete. ¿Cuántas
diferentes disposiciones serán posibles en la mesa
considerando que pueden ser elegidos tres cualesquiera de
los cinco individuos?
1
) (
) (
)() ( ) )( (
) )( (
) | ( ) ( ) | ( ) (
) | ( ) (
) (
) (
) | (
4
1
4
1
2
1
2
1
2
1
2
1
2
1
= =
+
=
+
= =
B C P B P A C P A P
A C P A P
C P
AyC P
C A P
108
Permutaciones y combinaciones
 Solución al anterior
 P=n!=5x4x3x2x1=120
 P=n!/(n-r)!=5!/(5-3)!=60
 En relación con el problema anterior, supongamos
que no nos interesa el número de diferentes
disposiciones de asientos posibles, sino el número
de diferentes agrupaciones de los tres (de cinco)
directivos que podrían asistir al banquete. ¿Cuántas
diferentes agrupaciones hay?
 C=n!/r!(n-r)!=5!/3!(5-3)!=10
109
Trabajo de investigación 5
Determine lo siguiente:
 La probabilidad de que la suma de los puntos de dos dados
una vez lanzados sea de siete
 Obtenga la probabilidad equivalente de los momios
siguientes:
 2:4 de que un competidor consiga un avance
tecnológico
 8:3 de que un nuevo producto sea rentable
 De un total de 800 empleados, 400 participan en el plan de
reparto de utilidades de una empresa (P), 600 disponen de
cobertura de seguro de gastos médicos mayores (M) y 200
participan en ambos programas. ¿Cuál es la probabilidad de
que un empleado aleatoriamente seleccionado:
 participe en al menos uno de los dos programas
 no participe en ningún programa?
110
Trabajo de investigación 5
 Durante un periodo específico, 70% de las emisiones
de acciones ordinarias de una industria con sólo 8
compañías elevaron su valor en el mercado. Si un
inversionista elige aleatoriamente dos de estas
emisiones.
 ¿Cuál es la probabilidad de que el valor de mercado
de ambas haya aumentado durante este periodo?
 Supongamos que un inversionista elige aleatoriamente
cuatro de esas emisiones accionarias. Elabore un
diagrama de árbol para describir los diversos
resultados posibles de la secuencia de cuatro
emisiones

111
Trabajo de investigación 5
 Supongamos que contamos con dos urnas U1 y U2, y que U1
contiene tres pelotas rojas y dos pelotas verde, mientras que U2
contiene dos pelota roja y cuatro pelotas verdes. Si se
selecciona aleatoriamente una urna y después de esa urna se
obtiene una pelota roja. ¿Cuál es la probabilidad de que la urna
seleccionada haya sido U1?
 Supongamos que hay siete diferentes lugares de capacitación
para asignar siete empleados en el programa preliminar de
capacitación administrativa de una empresa.
 ¿De cuantas maneras diferentes pueden ser asignados los
siete individuos a los siete lugares distintos?
 Si sólo se dispone de seis diferentes lugares para los siete
candidatos. ¿De cuántas maneras diferentes pueden
asignarse los siete lugares distintos a cuatro de los siete
individuos?
112
Distribución de probabilidad para
variables aleatorias discretas
 ¿Qué es una variable aleatoria?
 Es un evento numérico cuyo valor se
determina por medio de un proceso aleatorio
 Distribución de probabilidad. Es cuando se le
asignan valores X a una variable aleatoria, ya
sea mediante un listado o una función
matemática.
 La suma de las probabilidades de todos los
resultados numéricos posibles debe ser igual
a 1.0

113
Variable aleatoria discreta
 Es cuando todos los posibles valores
numéricos de la variable pueden enlistarse
en una tabla junto con sus respectivas
probabilidades.
114
Variable aleatoria continua
 Todos los posibles valores fraccionarios de la
variable no pueden enlistarse, motivo por el
cual las probabilidades se determinan por
medio de una función matemática.
115
Descripción de una variable aleatoria
discreta
 Lo mismo que en el caso de recolecciones de
datos muestrales y poblacionales a menudo
es útil describir una variable aleatoria en
términos de su media, varianza y desviación
estándar.
 La media a largo plazo de una variable
aleatoria X se le conoce como «valor
esperado», se expresa por E(X) y se da por
la fórmula:
 E(X)=ΣXP(X)
116
Valor esperado
 Ejemplo 40
 El número de vagonetas solicitadas en renta en una
agencia de alquiler de automóviles durante un periodo
de 50 días, se identifica en la siguiente tabla. Obtenga
el valor esperado de la variable discreta
Demanda
posible X
Número de días Probabilidad
P(X)

Valor ponderado
X[P(X)]
3
4
5
6
7
8
3
7
12
14
10
4
50
0.06
0.14
0.24
0.28
0.20
0.08
1.0
0.18
0.56
1.20
1.68
1.40
0.64
E(X)=5.66
117
Varianza de una variable aleatoria
discreta
 Se expresa como V(X), se calcula respecto a
E(X) como la media de la distribución de
probabilidad y se tienen dos fórmulas para
sacarla:
2 Fórmula )] ( [ ) ( ) (
1 Fórmula ) ( )] ( [ ) (
2 2
2
X E X E X V
X P X E X X V
÷ =
÷ =
¿
118
Varianza y desviación estándar
 Ejemplo 41
 Obtener la varianza del ejemplo anterior con la fórmula dos








 Por lo tanto la varianza es
 V(X)=33.78-5.66
2
=33.78-32.04=1.74
 Desviación estándar= raíz cuadrada de la
varianza=1.32
Demanda
posible X
Probabilidad
P(X)

Valor ponderado
X[P(X)]
Demanda
cuadrada (x
2
)
Cuadrado
ponderado x
2
P(X)
3
4
5
6
7
8
0.06
0.14
0.24
0.28
0.20
0.08
1.0
0.18
0.56
1.20
1.68
1.40
0.64
E(X)=5.66
9
16
25
36
49
64
0.54
2.24
6.00
10.08
9.80
5.12
E(x
2
)=33.78
119
Distribución binomial
 Es una distribución de probabilidad discreta
aplicable como modelo para situaciones de
toma de decisiones en las que puede
suponerse que un proceso de muestreo
responde a un proceso de Bernoulli, que es:
 Cada observación tiene dos resultados «éxito
y fracaso»
 Las observaciones constituyen eventos
independientes
 La probabilidad de una observación a otra es
constante
120
Distribución binomial
 Para esta formula se requiere de los siguientes
elementos:
 El número establecido de éxitos «X»
 El número de ensayos u observaciones «y»
 La probabilidad de éxito de cada ensayo «p»
p) - (1 q donde
)! ( !
!
) , | (
=
÷
=
÷x n x
q p
X n X
n
p n X P
121
Distribución binomial
 Ejemplo 42
 La probabilidad de que un prospecto de venta
aleatoriamente elegido realice una compra es de 0.20,
si un representante de ventas visita a seis prospectos,
la probabilidad de que realice exactamente cuatro
ventas se determina de la siguiente forma:

01636 . 0 80 . 0 20 . 0
)! 4 6 ( ! 4
! 6
) 20 . 0 , 6 | 4 (
2 4
=
÷
= = = = p n X P
122
Distribución binomial
Ejemplo 43
 Con respecto al ejemplo anterior, la
probabilidad de realizar cuatro o más ventas
se determina de la siguiente forma
 P(X≥4|n=6,p=0.20)=P(X=4)+P(X=5)+P(X=6)
 De acuerdo con el ejemplo anterior
 =0.01636+0.001536+0.000064=0.016960
123
Distribución binomial
 Para obtener el valor esperado, la varianza y
la desviación estándar de una distribución
binomial se ocupan las siguientes fórmulas:
 Ejemplo 44
 E(X)= np= 6(0.20)= 1.2 ventas
 V(X)= npq= 6(.20)(.80)= 0.96
 σ= raíz de la varianza= 0.98
124
Distribución hipergeométrica
 Cuando el muestreo se realiza sin reemplazo de cada
elemento muestreado tomado de una población finita de
elementos, no se aplica el proceso de Bernoulli, porqué cuando
se eliminan elementos de la población existe un cambio
sistemático en la probabilidad de éxito por lo que para este tipo
de casos se ocupa la fórmula de distribución hipergeométrica,
con los siguientes elementos: N= número total de elementos de
la población, T= número total de éxitos incluidos en la
población, X= número establecido de éxitos y n=número de
elementos de la muestra
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
÷
÷
=
n
N
X
T
X n
T N
n T N X P ) , , | (
125
Distribución hipergeométrica
 Ejemplo 45
 De seis empleados tres han permanecido en la
compañía por cinco o más años. Si de este grupo de
seis se elige aleatoriamente a cuatro empleados. La
probabilidad de que exactamente dos de ellos tengan
una antigüedad de cinco o más años es:

60 . 0
15
3 3
! 2 ! 4
! 6
! 1 ! 2
! 3
! 1 ! 2
! 3
4
6
2
3
2
3
4
6
2
3
2 4
3 6
) 4 , 3 , 6 | 2 (
= = =
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
÷
÷
= = = = =
x
n T N X P
El 1! es el
complemento
para llegar a
3!
El 2! es el
complemento
para llegar a
6!
126
Distribución de Poisson
 Se ocupa para determinar la probabilidad de
ocurrencia de un número establecido de
eventos cuando éstos ocurren en un
continuum temporal. Este proceso se llama
proceso de Poisson, aunque es semejante al
Bernoulli, se distingue de él en que los
eventos ocurren a lo largo de un intervalo de
tiempo temporal. En pocas palabras se
define la distribución de Poisson cuando la
probabilidad que se requiere sacar sucede de
manera X en un lapso.
127
Distribución de Poisson
 La fórmula para determinar la probabilidad de un
número establecido de éxitos X en una distribución
de Poisson es:




 Por lo general esta media se representa como λ y
significa el número medio de eventos a largo plazo
en la dimensión temporal. El número «e» es la
constante 2.7183, base de los logaritmos naturales.
!
) | (
X
e
X P
x ì
ì
ì
÷
=
128
Distribución de Poisson
 En un departamento de reparación de maquinaria se
recibe un promedio de cinco llamadas de servicio
por hora. La probabilidad de que en una hora
aleatoriamente seleccionada se reciban
exactamente tres llamadas de servicio es:
 Ejemplo 46
1404 . 0
6
00674 . 0 125
! 3
5
) 0 . 5 | 3 (
5 3
= = = = =
÷
x e
X P ì
129
Problemas
 Se ha determinado que el número de camiones de
carga que arriban cada hora a una bodega sigue la
siguiente distribución de probabilidad







 Calcule
a) Número esperado de arribos X por hora
b) La varianza
c) La desviación estándar

Número de
camiones (x)
0 1 2 3 4 5 6
Probabilidad 0.05 0.10 0.15 0.25 0.30 0.10 0.05
130
Problemas
Demanda
posible X
Probabilidad
P(X)

Valor ponderado
X[P(X)]
Demanda
cuadrada (x
2
)
Cuadrado
ponderado x
2
P(X)
0
1
2
3
4
5
6
0.05
0.10
0.15
0.25
0.30
0.10
0.05
1.0
0
0.10
0.30
0.75
1.20
0.50
0.30
E(X)=3.15
0
1
4
9
16
25
36
0
0.10
0.60
2.25
4.80
2.50
1.80
E(x
2
)=12.05
a) (X)=3.15 camiones
b) V(X)=E(X
2
)-[E(X)]
2
=12.05-3.15
2
=12.05-9.9225=2.1275
c) σ=raíz cuadrada de V(X)=1.46 camiones
131
Problemas distribución binomial
 A causa de las condiciones económicas imperantes,
una empresa informa que 30% de sus cuentas por
cobrar a otras empresas comerciales están
sobrevencidas. Si un contador toma una muestra
aleatoria de cinco de esas cuentas, determine la
probabilidad de cada uno de los siguientes eventos:
a) Ninguna de las cuentas está sobrevencida
b) Exactamente dos cuentas están sobre vencidas
c) Tres o más están sobrevencidas

132
Problemas distribución binomial
00243 . 0 1 00243 . 0 1 ) 70 . 0 ( ) 30 . 0 (
! 0 ! 5
! 5
) 5 (
02835 . 0 70 . 0 0081 . 0 5 ) 70 . 0 ( ) 30 . 0 (
! 1 ! 4
! 5
) 4 (
1323 . 0 49 . 0 027 . 0 10 ) 70 . 0 ( ) 30 . 0 (
! 2 ! 3
! 5
) 3 (
16308 . 0 00243 . 0 02835 . 0 1323 . 0 ) 5 ( ) 4 ( ) 3 ( ) 30 . 0 , 5 | 3 ( )
3087 . 0 343 . 0 09 . 0 10 ) 70 . 0 ( ) 30 . 0 (
! 3 ! 2
! 5
30 . 0 , 5 | 2 ( )
16807 . 0 16807 . 0 1 1 ) 70 . 0 ( ) 30 . 0 (
! 5 ! 0
! 5
) 30 . 0 , 5 | 0 ( )
0 5
1 4
2 3
3 2
5 0
= = = =
= = = =
= = = =
= + + = = + = + = = = = >
= = = = = =
= = = = = =
x x x dondeP
x x x dondeP
x x X dondeP
x P x P x P p n x P C
x x p n x P B
x x p n x P A
133
Problemas distribución
hipergeométrica
 Un gerente selecciona aleatoriamente a n=3
individuos de un grupo de 10 empleados para
la formación de un equipo asignado a un
proyecto. Suponiendo que cuatro de los
empleados fueron asignados anteriormente a
un proyecto similar, determine la probabilidad
de que exactamente dos de los tres
empleados hayan tenido experiencia previa
en proyectos de este tipo
134
Solución hipergeométrica
30 . 0
120
6 6
! 7 ! 3
! 10
! 2 ! 2
! 4
! 5 ! 1
! 6
3
10
2
4
1
6
3
10
2
4
2 3
4 10
) 3 , 4 , 10 | 2 (
= = =
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
÷
÷
= = = = =
x
n T N X P
135
Problemas Poisson
 Un promedio de cinco personas por hora realizan
transacciones en una ventanilla de servicios
especiales de un banco comercial, ¿cuál es la
probabilidad de que entre 10 y 12 personas realicen
transacciones en la ventanilla de servicios
especiales durante una hora en particular?
00343 . 0
! 12
5
) 5 | 12 (
00824 . 0
! 11
5
) 5 | 11 (
01813 . 0
! 10
5
) 5 | 10 (
0298 . 0 00343 . 0 00824 . 0 01813 . 0 ) 12 ( ) 11 ( ) 10 (
) 0 . 5 | 12 10 (
5 12
5 11
5 10
= = = =
= = = =
= = = =
= + + = = + = + =
= = s >
÷
÷
÷
e
X P
e
X P
e
X P
X P X P X P
X X P
ì
ì
ì
ì
136
Trabajo de investigación 6
 Un vendedor ha descubierto que la probabilidad de
realizar varias ventas por día, dada la posibilidad de
visitar a 10 prospectos de venta, es la que se
representa en la tabla. Calcule el número esperado
de ventas por día, la varianza y la desviación
estándar
Número de
ventas (x)
1 2 3 4 5 6 7 8

Probabilidad 0.03|0.16| 0.3| 0.35| 0.19| 0.2| 0.05|0.07
137
Trabajo de investigación 6
 Supongamos que 30% de los empleados de una
gran empresa están a favor de la representación
sindical, y que se contacta una muestra aleatoria de
20 empleados en solicitud de una respuesta
anónima. ¿Cuál es la probabilidad de que cuatro
estén a favor de la representación?
 Diez de los 30 estudiantes de un grupo escolar están
insatisfechos con el texto que se emplea. Si una
muestra aleatoria de cuatro estudiantes es
interrogada sobre el libro de texto, determine la
probabilidad de que
a) Exactamente tres de los cuatro estén insatisfechos
b) Tres estudiantes o más se muestren insatisfechos con
el libro
138
Trabajo de investigación 6
 Un promedio de siete personas por hora hacen uso
de una caja bancaria automática durante el horario
pico de compras en una tienda departamental. ¿Cuál
es la probabilidad de que
a) Exactamente 4 personas usen la caja durante una
hora aleatoriamente seleccionada.
b) Menos de cinco personas usen la caja durante una
hora aleatoriamente seleccionada.
c) Ninguna persona la use durante un intervalo de 10
minutos.
139
Distribuciones de probabilidad para
variables aleatorias continuas
 A diferencia de una variable aleatoria
discreta, una variable aleatoria continua
puede adoptar cualquier valor fraccionario
dentro de un rango definido de valores. Dado
que existe un número infinito de medidas
fraccionarias posibles, no se pueden enlistar
todos los posibles valores con su
probabilidad correspondiente
140
Variables aleatorias continuas
 En la gráfica siguiente la probabilidad de que un
embarque aleatoriamente seleccionado tenga un
peso entre 6 000 y 8 000 es igual a la proporción del
área total bajo la curva
0
20
40
60
80
100
120
0 2000 4000 6000 8000 10000 12000 0
141
Distribución normal de probabilidad
 Se refiere a la curva normal, la cual es tanto
simétrica como mesocúrtica y es importante por tres
razones:
 Se sabe que las medidas obtenidas en muchos
procesos aleatorios siguen esta distribución
 Suelen servir para aproximar otras distribuciones de
probabilidad, como la binomial y de Poisson
 Como veremos en el capítulo siguiente, las
distribuciones de estadísticas como la media muestral
y la proporción muestral tienen distribución normal
cuando el tamaño de muestra es grande
142
Distribución normal de probabilidad
 Como sucede en todas las distribuciones
continuas de probabilidad, un valor de
probabilidad de una variable aleatoria
continua sólo puede determinarse para un
intervalo de valores, la curva de probabilidad
de una variable con distribución normal está
dada por
] 2 / ) [(
2
2 2
2
1
) (
o µ
to
÷ ÷
=
X
e x f
143
Distribución normal estándar
 Es la distribución normal de probabilidad con µ=0 y
σ=1. Un valor z reformula el valor de X original en
términos del número de unidades de la desviación
estándar por las cuales el valor original difiere de la
media de la distribución. Un valor negativo z, indicaría
que el valor de X original estaba por debajo del valor
de la media
o
µ ÷
=
X
z
144
Distribución normal de probabilidad
 Ejemplo 47
 Se sabe que el ciclo de vida de un componente
eléctrico sigue una distribución normal con una media
de µ=2000 y una desviación estándar de σ=200
horas, la probabilidad de que un componente
aleatoriamente seleccionado dure entre 2 000 y 2 400
horas se determina de la siguiente manera:
0
5
10
15
20
25
30
35
40
45
1200 1400 1600 1800 2000 2200 2400 2600 2800
5 apendice al acuerdo de , 4772 . 0 ) 2400 2000 (
0 . 2
200
2000 2400
= s s
+ =
÷
=
÷
=
X p
X
z
o
µ
-3 -2 -1 0 1 2 3
145
Distribución normal de probabilidad
 Ejemplo 48
 Con respecto al problema anterior, supongamos que
nos interesa la probabilidad de que un componente
aleatoriamente seleccionado dure más de 2 200 horas
0
5
10
15
20
25
30
35
40
45
1200 1400 1600 1800 2000 2200 2400 2600 2800
0.1587 0.3413 - .5000 0 2200) P(X
5 apéndice el con acuerdo de , 3413 . 0 ) 1 0 (
0 . 1
200
2000 2200
= = >
= s s
+ =
÷
=
÷
=
Z p
X
z
o
µ
-3 -2 -1 0 1 2 3
146
Puntos percentiles para variables con
distribución normal
 Un punto percentil en una curva normal
estándar nos sirve para hacer el proceso
inverso, es decir, encontrar el valor de X
 Ejemplo 49
 En una curva normal estándar, el 90º punto
percentil se refiere al 50º punto de la izquierda de
la curva + el 40º punto del lado derecho, así que
con el apéndice sacamos el valor más cercano a
0.4000 y es 0.3997, por lo que el valor asociado
a Z = +1.28, el signo es positivo porque el 90º
punto percentil es mayor que la media

147
Puntos percentiles para variables con
distribución normal
 Para encontrar el valor de X, despejando la
fórmula tenemos que X=µ+zσ
 Ejemplo 50
 Para el ejemplo anterior tenemos que
X = 2 000 + (1.28)(200) = 2 256 hrs.
 Ejemplo 51
 Si sacamos el 10º percentil tenemos que
X = 2 000 + (-1.28)(200) = 1 744 horas.

148
Aproximación normal de
probabilidades binomiales
 Cuando el número de observaciones o ensayos «n» es
relativamente grande, la distribución de probabilidad normal
puede servir para aproximar probabilidades binomiales. Una
regla conveniente es que tal aproximación resulta aceptable
cuando n≥30 y tanto np como nq≥5
 Cuando la distribución de probabilidad normal se usa como
base para aproximar un valor de probabilidad binomial, la media
y desviación estándar se basan en el valor esperado y en la
varianza del número de éxitos de la distribución binomial
npq est Desv
np media
=
=
o
µ
. .
149
Aproximación normal de
probabilidades binomiales
 Para llevar a cabo una probabilidad binomial
usando curvas normales, se debe considerar
algo que se conoce como corrección por
continuidad. Esta corrección se lleva a cabo
usando los siguientes parámetros
 Reste 0.5 de X cuando se requiera P(X≥X
i
)
 Reste 0.5 de X cuando se requiera P(X<X
i
)
 Sume 0.5 de X cuando se requiera P(X≤X
i
)
 Sume 0.5 de X cuando se requiera P(X>X
i
)
150
Aproximación normal de
probabilidades binomiales
 Ejemplo 52
 En relación con un grupo extenso de prospectos de
venta se ha observado que el 20% de contactados
personalmente por un representante de ventas
realizarán una compra. Si un representante de ventas
contacta a 30 prospectos, podemos determinar la
probabilidad de que 10 o más realicen una compra, en
referencia a las probabilidades binomiales
 Si sacamos la solución ocupando lo que se vio en las
diapositivas 120-124 tenemos
 P(X ≥
10|n=30,p=0.20)=0.0355+0.0161+0.0064+
0.0022+0.0007+0.0002+…=0.0611
151
Aproximación normal de
probabilidades binomiales
 Continuación ejemplo 52
 Hagamos ahora lo mismo, pero ocupando la curva
normal
 ¿Es n≥30?, si n = 30
 ¿Es np≥5?, si, np = 30(0.20) = 6
 ¿Es nq ≥5?, si, nq = 30(0.80) = 24
 Para la corrección por continuidad tenemos que tomar
a X ≥10, por lo que se debe restar 0.5 y queda de la
siguiente forma
0548 . 0 4452 . 0 5000 . 0 ) 19 . 2 , 0 . 6 | 5 . 9 (
4452 . 0 60 . 1
19 . 2
0 . 6 5 . 9
19 . 2 8 . 4 80 . 20 . 30
0 . 6 20 . 30
= ÷ = = = >
= + ~
÷
=
÷
=
~ = = =
= = =
o µ
o
µ
o
µ
X P
x
z
x x npq
x np
152
Aproximación normal de
probabilidades de Poisson
 Cuando la media λ de una distribución de Poisson
es relativamente grande, la distribución normal de
probabilidad puede servir para aproximar
probabilidades de Poisson. Una regla conveniente
es que esta aproximación es aceptable si λ≥10.0
ì o
ì µ
=
=
. .est Desv
media
153
Aproximación normal de
probabilidades Poisson
 Ejemplo 53
 El número promedio de llamadas recibidas en
un departamento de reparación de maquinaria
por turno de 8 horas es de 10.0. ¿Cuál es la
probabilidad de que en el turno se reciban
más de 15 llamadas?
 Si sacamos la solución ocupando lo que se
vio en las diapositivas 127-129 tenemos:
 P(X>15|λ=10.0)=P(X=16)+P(X=17)+…
 =0.0217+0.0128+0.0071+0.0037…=0.0488
154
Aproximación normal de
probabilidades Poisson
 Continuación ejemplo 53
 Hagamos ahora lo mismo, pero ocupando la curva
normal, ya que λ≥10
0409 . 0 4591 . 0 5000 . 0 ) 0 . 10 | 15 (
4591 . 0 74 . 1
16 . 3
0 . 10 5 . 15
16 . 3 10
10
= ÷ = = >
= + ~
÷
=
÷
=
~ = =
= =
ì
o
µ
ì o
ì µ
X P
x
z
155
Problemas
 El proceso de empaque de una compañía productora
de cereales para el desayuno ha sido ajustado para
que cada empaque contenga un promedio de µ=13.0
onzas de cereal. Por supuesto que no todos los
paquetes contienen 13.0 oz a causa de fuentes
aleatorias de variabilidad. La desviación estándar del
peso neto real es σ=0.1 oz y se sabe que la
distribución de pesos sigue la distribución normal de
probabilidad. Determine la probabilidad de que un
paquete aleatoriamente elegido contenga entre 13 y
13.2 oz de cereal.
156
Problemas
5 apéndice el con acuerdo de , 4772 . 0 ) 2 0 (
0 . 2
1 . 0
0 . 13 2 . 13
= s s
+ =
÷
=
÷
=
Z p
X
z
o
µ
Respecto al problema anterior, ¿cuál es la probabilidad de que el peso del
cereal exceda 13.25 onzas?

0062 . 0 4938 . 0 5000 . 0 ) 5 . 2 (
5 . 2
1 . 0
0 . 13 25 . 13
= ÷ = >
+ =
÷
=
÷
=
Z p
X
z
o
µ
157
Problemas binomiales y de Poisson
 Se sabe que 70% de las personas que acuden a un
importante centro comercial realizan al menos una
compra. En una muestra de n = 50 individuos, ¿cuál
es la probabilidad de que al menos 40 personas
realicen una o más compras cada una?
0823 . 0 4177 . 0 5000 . 0 ) 24 . 3 , 0 . 35 | 5 . 39 (
4177 . 0 39 . 1
24 . 3
0 . 35 5 . 39
24 . 3 5 . 10 30 . 70 . 50
0 . 35 70 . 50
= ÷ = = = >
= + ~
÷
=
÷
=
~ = = =
= = =
o µ
o
µ
o
µ
X P
x
z
x x npq
x np
158
Problemas binomiales y de Poisson
 Se sabe que las llamadas de servicio llegan
aleatoriamente y en calidad de proceso estacionario
a un promedio de 5 por hora. ¿Cuál es la
probabilidad de que en un turno de 8 horas se
reciban al menos 50 llamadas de servicio?
 Puesto que λ=5x8=40 y excede a 10, entonces
podemos usar la distribución normal de probabilidad,
para aproximar el valor de probabilidad de Poisson
0485 . 0 4515 . 0 5000 . 0 ) 0 . 40 | 5 . 50 (
4515 . 0 66 . 1
32 . 6
40 5 . 50
32 . 6 40
40
= ÷ = = >
= + ~
÷
=
÷
=
~ = =
= =
ì
o
µ
ì o
ì µ
X P
x
z
159
Trabajo de investigación 7
 Las calificaciones reportadas en una prueba
de aprovechamiento de vigencia nacional
para graduados de preparatoria tiene una
media de µ = 80 con la desviación estándar σ
= 10. La distribución de calificaciones es
aproximadamente normal. ¿Cuál es la
probabilidad de que la calificación de un
individuo aleatoriamente elegido se
encuentre
a) entre 80 y 95
b) entre 70 y 90
160
Trabajo de investigación 7
 La media de una prueba de aprovechamiento
de vigencia nacional es µ = 80 con σ = 10.
Las calificaciones siguen una distribución
normal. ¿Qué calificación se encuentra en el
a) 50º punto percentil
b) 30º punto percentil
c) 90º punto percentil?
161
Trabajo de investigación 7
 En relación con los varios miles de artículos
almacenados por una empresa de pedidos
por correo, existe una probabilidad global de
0.10 de que un artículo en particular
(incluidos tamaño y color específicos, etc.),
no esté en existencia. Si un embarque
comprende pedidos de 200 artículos
diferentes, ¿cuál es la probabilidad de que 20
o más artículos no estén en existencia?
162
Trabajo de investigación 7
 Durante el periodo pico de 8 a 10 p.m. de
una estación de servicio automovilístico llega
un promedio de un auto cada 5 minutos.
¿Cuál es la probabilidad de que más de 25
autos arriben a la estación en demanda de
servicio entre las 4 y 5 p.m.?
163
Distribuciones de muestreo e
intervalos de confianza para la media
 Un parámetro es un valor de resumen para una
población o proceso
 Una estadística muestral es un valor de resumen
para una muestra
 Para emplear una estadística muestral como
estimador de un parámetro, debe ser aleatoria de
una población
 Distribución de muestreo. Se refiere a la
distribución de los diferentes valores que una
estadística muestral podría adoptar en muchas
muestras del mismo tamaño
164
Distribuciones de muestreo e
intervalos de confianza para la media
 Un estimador puntual es el valor numérico de una
estadística muestral empleado para estimar el valor
de un parámetro, una de sus características más
importantes de un estimador es que sea insesgado
 Un estimador insesgado es una estadística
muestral cuyo valor esperado es igual al parámetro
por estimar
 Ambos métodos de muestreo garantizan que la
muestra sea insesgada, aunque no eliminan el error
de muestreo
 Así entonces, por lo general disponemos de una
muestra aleatoria, por lo que se debe reconocer que
el valor de la estadística muestral variará de una
muestra a otra a causa de la variabilidad del
muestreo aleatorio o error de muestreo
165
Distribuciones de muestreo e
intervalos de confianza para la media
 Ejemplo 54 (error de muestreo)
Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5
14.95
14.96
14.95
15.03
14.99
15.07
15.08
14.94
15.09
14.98
15.05
14.99
14.71
14.94
14.88
14.98
14.96
15.20
15.31
15.21

X
Med
S

14.97
14.96
0.039

15.02
15.03
0.067

15.03
15.02
0.052

14.88
14.91
0.119

15.17
15.08
0.149
166
Distribución de muestreo de la media
 La distribución de muestreo de la media se describe
determinando la media de dicha distribución, la cual es el valor
esperado E(X) y la desviación estándar de la distribución de las
medias muestrales, designada como σ
x

 Cuando los parámetros de la población o proceso son
conocidos, el valor esperado, error estándar y la fórmula del
error estándar de la media con el factor de corrección por finitud
incluido de la distribución de muestreo de la media es:
corrección de factor el con estándar Error
1
estándar Error
esperado Valor ) (
÷
÷
=
=
=
N
n N
n
n
X E
x
x
o
o
o
o
µ
167
Distribución de muestreo de la media
 Ejemplo 55
 Supongamos que la media de una población muy
grande µ = 50.0 y que la desviación estándar de las
medidas es σ = 12.0. Determinamos la distribución de
muestreo de las medias muestrales para un tamaño
de muestra de n = 36 en términos del valor esperado y
el error estándar de la distribución. Si la población
fuera de 100, obtenga el error estándar
60 . 1 ) 80 . 0 ( 2
1 100
36 100
2.0
1
estándar Error 2.0
36
12

esperado Valor 0 . 50 ) (
= =
÷
÷
=
÷
÷
=
= = =
= =
N
n N
n
n
X E
x
x
o
o
o
o
µ
168
Distribución de muestreo de la media
 El efecto de este factor de corrección es
siempre reducir el valor que de otra forma se
calcularía. Por regla general, la corrección es
insignificante y puede omitirse cuando
n<0.05N, esto es, cuando el tamaño de la
muestra sea inferior al 5% del tamaño de la
población
169
Teorema del límite central
 Si la población o proceso del cual se toma
una muestra tiene una distribución normal,
también la distribución de muestreo de la
media tendrá distribución normal, sin importar
el tamaño de la muestra. No obstante, ¿qué
ocurre cuando una población no tiene
distribución normal? por increíble que
parezca, el teorema del límite central permite
la aplicación de la distribución normal a estas
distribuciones de muestreo
170
Teorema del límite central
 Cuando el tamaño de la muestra es mayor o
igual a 30 resuelve muchas de las
situaciones poblacionales adversas
171
Determinación de probabilidades para
la media muestral
 Dado que conocemos la media y desviación estándar
de la población se puede hacer uso de la fórmula de
distribución normal estándar, sólo que en la fórmula
se hace uso del error estándar de la media, porque
éste es la desviación estándar de la variable X
o
µ ÷
=
X
z
X
172
Ejemplo 56
 Un auditor toma una muestra aleatoria de tamaño
n= 36 de una población de 1000 cuentas, el valor
medio de las cuentas por cobrar para la población es
µ= $260.00, con la desviación estándar de la
población σ=$45.00. ¿Cuál es la probabilidad de que
la media muestral sea inferior a $250.00?
0918 . 0 4082 . 0 5000 . 0 ) 0 33 . 1 ( 500 . 0 ) 33 . 1 (
33 . 1
5 . 7
260 250
50 . 7
6
00 . 45
36
00 . 45
00 . 260 ) (
= ÷ = s s ÷ ÷ = <
÷ =
÷
=
÷
=
= = = =
= =
z P Z p
X
z
n
X E
x
x
o
µ
o
o
µ
Ejemplo 57
 El departamento de control de calidad de una
empresa de refrescos lleva un registro de la cantidad
del liquido con que se llena su botella gigante. La
cantidad de refresco en cada botella es crítica, pero
varia un poco de botella a botella. La empresa no
quiere que las botellas se llenen con menor cantidad
porque esto ocasionaría problema respecto a la
exactitud de lo que se especifica en la etiqueta. Por
otro lado, las botellas tampoco deben contener
exceso de refresco porque la compañía estaría
regalando su producto, con lo que se reducirían las
ganancias
Ejemplo 57 Continuación
 De acuerdo con los registros la cantidad de refresco
en las botellas sigue una distribución normal. La
cantidad media por botella es 31.2 onzas y la
desviación estándar poblacional es .4 onzas. Hoy a
las 8 de la mañana el técnico de control tomo una
muestra aleatoria de 16 botellas de la línea de
llenado. La cantidad media de refresco en estas
botellas fue de 31.38 onzas. ¿Es este resultado poco
probable?, ¿Es probable que el proceso esté
llenando con demasiado refresco las botellas?, dicho
de otra manera ¿El error muestral de 0.18 onzas es
poco probable?
Ejemplo 57 Continuación
3.5% 0.0359
.4641 - .5000 31.38) P(x tablas las De
80 . 1
16
4 .
20 . 31 38 . 31
=
= >
=
÷
=
÷
=
÷ ÷ ÷ ÷
n
Z
X
o
µ
Ejemplo 58
 Una asociación de gasolineras estima que en una
gasolinera se venden en promedio 20000 galones
diarios, la forma de la distribución no se conoce. En
una muestra que se tomo ayer de 70 gasolineras, la
media fue de 19480 y la desviación estándar de 4250
galones ¿es razonable la aseveración de que la
media poblacional sea de 20000 galones?, ¿Cuál es
la probabilidad de tomar una muestra con el
estadístico dado la población propuesta?, ¿Qué
suposiciones hay que hacer?
Ejemplo 58 Continuación
 Como la muestra es suficientemente grande
se puede sustituir la desviación estándar
poblacional con la desviación estándar
muestral
15.39% 0.1539
.3461 - .5000 ) 9480 1 P(x tablas las De
02 . 1
70
4250
20000 19480
=
= <
÷ =
÷
=
÷
=
÷ ÷ ÷ ÷
n
s
Z
X
µ
Trabajo de Investigación 8
 El salario promedio por hora de los plomeros
de una determinada región es de 28 dólares
¿Cuál es la probabilidad de tomar una
muestra de 50 plomeros y encontrar un
salario medio por hora de 28.50 o más?. La
desviación estándar de la muestra es 2
dólares por hora

Trabajo de Investigación 8
 En estados unidos la edad promedio en la
que los hombres se casan por primera vez es
24.8 años. No se conoce ni la forma ni la
desviación estándar de la población ¿Cuál es
la probabilidad de encontrar una muestra de
60 hombres que la edad promedio a la que
se casaron sea de 25.1 años o más?.
Supóngase que la desviación estándar
muestral es de 2.5 años
Trabajo de Investigación 8
 En un estudio reciente realizado por una asociación
de taxistas se encontró que la tarifa media entre dos
puntos de una ciudad es de 18 dólares y la
desviación estándar de 3.50. Si se toma una muestra
de 15 tarifas ¿Cuál es la probabilidad de que la
media muestral este entre 17 y 20 dolares?
 Una empresa fabricante de camiones asegura que el
peso medio de sus camiones cuando están
totalmente cargados es 6000 libras y que la
desviación estándar es 150 libras. Supongase que la
población sigue una distribución normal. Se
seleccionan aleatoriamente 40 camiones y se pesan.
¿Entre qué limites se encontrará el 95% de los
pesos?
181
Intervalos de confianza para la media
con el uso de la distribución normal
 Los intervalos de confianza para la media se
elaboran por lo general con el estimador insesgado X
en el punto medio del intervalo. Cuando está
garantizado el uso de la distribución normal de
probabilidad, el intervalo de confianza para la media
se determina mediante
X
X
zs
Z x
±
±
X
mediante desconoce, se población la de la cuando O o
o
182
Intervalos de confianza para la media
con el uso de la distribución normal
 Los intervalos de confianza de uso más
frecuente son los intervalos de confianza de
90, 95 y 99%. Los valores de z requeridos
junto con estos intervalos se muestran en la
siguiente tabla:
Z (número de unidades de desviación
estándar respecto de la media)
Proporción de área en el
intervalo
1.645
1.96
2.58
0.90
0.95
0.99
183
Ejemplo 59
 Durante una semana dada, una muestra aleatoria de
30 empleados por hora seleccionada de un gran
número de empleados de una empresa
manufacturera tiene un salario medio muestral de X
= $180, con una desviación estándar muestral de
s = $14.00. Estimamos el salario medio de todos los
empleados por hora de la empresa con una
estimación por intervalo tal como para que podamos
tener una confianza del 95% de que el intervalo
incluye el valor de la media de la población de la
siguiente manera:
Ejemplo 59 continuación
] 02 . 185 , 98 . 174 [ )
30
14
( 96 . 1 180
X
mediante desconoce, se población la de la cuando O
= ±
±
±
X
X
zs
Z x
o
o
Proceso de Toma de Decisiones
¿Es Normal la
Población?
¿Es n igual o mayor
que 30?
¿Se conoce la
desviación estándar
poblacional?
Utilizar una prueba
no paramétrica
Utilizar una
distribución z
Utilizar una
distribución t
Utilizar una
distribución z
Si
Si Si
No
No No
Trabajo de investigación 9
 De una población normal se toma una
muestra de 81 observaciones. La media de la
muestra tomada es 40 y la desviación
estándar muestral es 5. Determine un
intervalo de confianza de 95% para la media
poblacional
 De una población normal se toma una
muestra de 49 observaciones. La media
muestral es 55 y la desviación estándar
muestral es 10. Determine un intervalo de
confianza de 99% para la media poblacional
Tamaño de la Muestra apropiado
 El tamaño necesario de la muestra depende
de tres factores
 El nivel de confianza deseado
 El margen de error que el investigador este
dispuesto a tolerar
 La variabilidad de la población que se estudia
Nivel de confianza
 Los niveles de confianza más comúnmente
usados son del 95% y 99%, pero se puede
usar cualquier nivel entre 0 y 100%
 Nivel de confianza para 95% z=1.96
 Nivel de confianza para 99% z=2.58
 Entre mayor sea el nivel de la z mayor será el
tamaño de la muestra
Error permitido
 El máximo error permitido se designa por E,
es la cantidad que se suma o se resta a la
media muestral para determinar los extremos
de los intervalos de confianza.
 Cantidad de error que las personas que
realizan el estudio están dispuestas a tolerar,
si el error permitido es pequeño se necesitara
una muestra grande y viceversa si es grande
Desviación Estándar Poblacional
Si la población esta muy dispersa se
requerirá una muestra muy grande.
Por otro lado si la población esta
concentrada el tamaño de la muestra
será muy pequeño, será necesario
usar una desviación estándar
poblacional y existen tres sugerencias
para poder obtenerla
Uso de un estudio comparable
 Se ocupa cuando existe una estimación de la
dispersión, que se obtuvo en otro estudio
Uso de un método basado en el
intervalo
 Se sabe que aproximadamente toda la curva
normal se encuentra a 3 desviaciones
estándar si observamos la derecha y la
izquierda tendríamos que un porcentaje
bastante grande de la curva es el de 6
desviaciones estándar así que tomamos el
número menor de nuestra muestra y el
número mayor para obtener el rango y lo
dividimos entre 6, eso nos dará una
aproximación a la desviación estándar
poblacional
Estudio piloto
 Se utiliza con mayor frecuencia, se toma una
muestra de entre 30 y 100 y se aplica la
encuesta para identificar la desviación
estándar muestral y ocuparla en la fórmula
correspondiente.
Tamaño de la muestra para estimar la
media poblacional
permitido error máximo E
población la de estándar desviación la de estimación s
muestra la de tamaño al
e correspond que estándar normal valor el es z
muestra la de tamaño el es n
2
|
.
|

\
|
=
E
zs
n
Ejemplo 60
 Un estudiante de administración pública
quiere determinar el ingreso medio mensual
de los miembros del consejo ciudadano de
una ciudad grande. El error al estimar la
media debe ser inferior a 100 dólares con un
nivel de confianza del 95%. El estudiante
encontró un informe de la Secretaría del
Trabajo en el que se estimó que la
desviación estándar era de 1000. ¿De que
tamaño debe ser la muestra?
Ejemplo 60
ciones especifica las satisfacer
para 666 de muestra una necesita se que lo Por
64 . 665
100
1000 58 . 2
99% a confianza de
nivel el aumentara se que de caso el Para
ciones especifica las satisfacer
para 384 de muestra una necesita se que lo Por
16 . 384
100
1000 96 . 1
2 2
2 2
=
|
.
|

\
|
=
|
.
|

\
|
=
=
|
.
|

\
|
=
|
.
|

\
|
=
x
E
zs
n
x
E
zs
n
Hipótesis
 Enunciado acerca de una población
elaborado con el propósito de ponerla a
prueba
Prueba de Hipótesis
 Procedimiento basado en la evidencia
muestral y la teoría de probabilidad; se
emplea para determinar si la hipótesis es una
afirmación razonable
Paso 1 para probar una hipótesis
 Establecer las Hipótesis nula H
0
y la
Alternativa H
1
 La hipótesis nula es la hipótesis a ser probada
 La hipótesis alternativa es el complemento de
la nula, es una afirmación que se acepta si los
datos muestrales proporcionan evidencia
suficiente de que la hipótesis nula es falsa
Paso 2 para probar una hipótesis
 Seleccionar el nivel de significancia, el cual
es la probabilidad de rechazar la hipótesis
nula cuando es verdadera
 No hay un nivel de significancia que se
aplique a todas las pruebas, dependerá
sobre todo de lo que se esta evaluando, sin
embargo se ha estilado que para proyectos
de investigación un nivel del 5% es correcto,
para aseguramiento de calidad 1% y para
encuestas políticas el 10%
Paso 2 Continuación
Hipótesis Nula Se Acepta Ho Se Rechaza Ho
Ho es verdadera Decisión
Correcta
Error de tipo 1
Ho es Falsa Error de Tipo 2 Decisión correcta
Investigador
Paso 2 Ejemplo 61
 Una muestra de 50 tarjetas de circuito
impreso revelo que 4 de estas fallaron, si el
cliente tolera solo el 6% de falla y la compra
es de 1000 tarjetas de circuito, al identificar
que 4 de ellas fallaron tendríamos que el 8%
de nuestra muestra fallo, por lo que
rechazamos el embarque, supongamos que
de las 1000 solo esas 4 fallaron, entonces se
cae en un error de tipo 1, lo contrario sería
error de tipo 2
Paso 3 Calcular el valor estadístico de
la prueba
 Valor determinado a partir de la información
muestral, que se utiliza para determinar si se
rechaza la hipótesis nula
Paso 3 Calcular el valor estadístico de
la prueba
¿Es Normal la
Población?
¿Es n igual o mayor
que 30?
¿Se conoce la
desviación estándar
poblacional?
Utilizar una prueba
no paramétrica
Utilizar una
distribución z
Utilizar una
distribución t
Utilizar una
distribución z
Si
Si Si
No
No No
Paso 4 Formular la regla de decisión
 Una regla de decisión establece las
condiciones específicas en las que se
rechaza la hipótesis nula y las condiciones en
las que no se rechaza la hipótesis nula
 Valor Crítico
 Punto de división entre la región en la que se
rechaza la hipótesis nula y la región en la que
no se rechaza la hipótesis nula
Paso 5 Tomar una decisión
 Se refiere a calcular el estadístico de prueba,
compararlo con el valor crítico y tomar la
decisión de rechazar o no la hipótesis nula
 Identificar la probabilidad de que el evento
suceda
Pruebas de significancia de una o dos
colas
 Se ocupa una prueba de significancia de una
cola cuando la hipótesis nula es menor o
igual o mayor o igual
 Se ocupa una prueba de significancia de dos
colas cuando la hipótesis nula es igual u
ocupa el signo igual
Valor P
 Es la probabilidad de observar un valor muestral tan
extremo, o más extremo, que el valor observado,
dado que la hipótesis nula es verdadera
 Si el valor P es menor que
 0.10 se tiene alguna evidencia de que Ho no es
verdadera
 0.05 se tiene una fuerte evidencia de que Ho no es
verdadera
 0.01 se tiene una muy fuerte evidencia de que Ho no
es verdadera
 0.001 se tiene una evidencia extremadamente fuerte
de que Ho no es verdadera
Problemas
 Se dan las siguientes hipótesis
 Ho: µ=200
 H1: µ≠200
 En una muestra de 50 observaciones se encuentra
que µ
x
=203.5 ¿puede rechazarse la hipótesis nula al
nivel de significancia de 0.01?
 Establezca la regla de decisión
 Calcule el valor del estadístico de Prueba
 ¿Cuál es la decisión respecto a la hipótesis nula?
 ¿Cuál es la probabilidad de que la hipótesis nula se
rechace debido a situaciones del azar?

Problemas
 Como el nivel de significancia es de 0.01
 Z=2.58, como la hipótesis nula es con el
signo igual se tiene una curva con dos colas,
por consiguiente la regla de decisión es
rechazar la hipótesis nula y aceptar la
hipótesis alternativa si el valor de z cae en la
región menor a -2.58 y mayor a 2.58, se
acepta la hipótesis nula si cae dentro de este
intervalo
Problemas
55 . 1
50
16
200 5 . 203
=
÷
=
÷
=
n
X
Z
o
µ
 Puesto que 1.55 no cae en la región de rechazo, se
acepta la hipótesis nula
 Para obtener la Probabilidad sería P(z>1.55)=0.500-
0.4394=0.0606
 Debido a que son dos colas se multiplica por dos así
que la probabilidad es 0.1212 por lo que Ho no se
rechaza por cuestiones de probabilidad
Trabajo de investigación 10
 Una cadena de tiendas de descuento expide su
propia tarjeta de crédito, el gerente del departamento
de tarjetas de crédito desea averiguar si el saldo
insoluto medio mensual es mayor que 400 dólares, el
nivel de significancia se deja en 0.05. En una revisión
aleatoria de 172 saldos, se encontró que la media
muestral es de 407 y la desviación estándar es de
38. ¿Debería concluir el funcionario de crédito que la
media poblacional es mayor que 400 o es razonable
suponer que la diferencia de 7 dólares se debe al
azar?.