Pasos Estadistica

1 Estadística I
2 BIBLIOGRAFÍA
TEXTO BASE
“ESTADÍSTICA APLICADA A LA EMPRESA Y A LA ECONOMÍA” por Allen Webster Editorial Mac
Graw Hill
TEXTOS COMPLEMENTARIOS
“ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA” por William J. Stevenson, Editorial Harla.
“ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & David S. Rubin, Sexta edición,
editorial Prentice Hall
2 ESTADÍSTICA
[1] La estadística comprende la rama descriptiva, la teoría de la probabilidad y el muestreo
DATOS ESTADÍSTICOS
[2]LOS MÉTODOS ESTADÍSTICOS comprenden el análisis e interpretación de números, ventas

mensuales, calificaciones de exámenes, número de partes defectuosas, porcentaje de respuestas
correctas a un cuestionario, años de servicio, tiempo de terminación, etc. Tales números se conocen
como DATOS. Por lo general para interpretarlos correctamente, en primer lugar es necesario organizar
y resumir los números.
DATOS E INFORMACIÓN OBTENIDA DE ELLOS
Los datos no procesados pueden carecer de significado, grandes cantidades de número tienden
a confundir en lugar de aclarar, nos abrumamos con detalles mayores. El Procesamiento de datos
disminuye la cantidad de detalles.
DATOS ESTADÍSTICOS
Los datos estadísticos se obtienen mediante un proceso que comprende la observación o
medición de conceptos, como ingresos anuales de una comunidad, calificaciones de exámenes, etc.
Tales conceptos reciben el nombre de VARIABLES, ya que producen valores que tienden a mostrar
cierto grado de variabilidad, el efectuarse mediciones sucesivas.
TIPOS DE DATOS
Casi siempre, seleccionar el procedimiento que se habrá de utilizar para analizar o describir
datos estadísticos depende de que tipo sean. Son de 4 tipos: CONTINUOS, DISCRETOS, NOMINALES
y JERARQUIZADOS.
Las variables que pueden asumir virtualmente cualquier valor en determinado intervalo de
valores se conocen como continuas. Características tales como altura, peso, etc., quedan dentro de
esta categoría. Los datos que se toman acerca de estas características y otras semejantes se
denominan continuos, aún cuando, en términos prácticos, los instrumentos de medición presentan
ciertas limitaciones de tipo físico que restringen el grado de precisión. Como ejemplos de datos
continuos tenemos: la cantidad de café que se vende por día, la gasolina que se expende por hora.
Una variable discreta es la que puede asumir sólo ciertos valores, por lo regular, enteros. Los
datos discretos surgen al contar el número de conceptos que poseen cierta característica, ejemplos de
datos discretos son el número de clientes por día, los accidentes de trabajo, etc.
Tanto los datos discretos como los continuos se conocen como datos cuantitativos ya que son
inherentemente numéricos. Es decir ciertos valores numéricos se relacionan de manera natural con las
variables que se miden. Por otra parte, los dos tipos restantes de datos nominales y jerarquizados
comprenden variables que no son inherentemente numéricas. A estas se les llama cualitativas, y se
deben convertir a valores numéricos antes de que se trabaje con ellas.
Las variables nominales comprenden categorías, como el sexo (masculino o femenino), el color
de ojos (azul, castaño, negro, verde), campo de estudios (medicina, derecho, administración, biología,
ingeniería), calificaciones (excelente, bueno, regular, malo)etc. Ninguna de las características anteriores
es numérica por naturaleza. Sin embargo, cuando se aplican, ya sea a una población o a una muestra,
es posible asignar cada individuo a una categoría (por ejemplo, el campo de estudios es administración
de empresas), y contar luego el número que queda en cada una de ellas (por ejemplo, 15 estudiantes).
Otro tipo de variable cuantitativa es la que comúnmente se refiere a las evaluaciones subjetivas
cuando los conceptos se jerarquizan según la preferencia o logro. Por ejemplo, en concursos de cocina,
belleza, florería y caninos, los lugares se jerarquizan en primero, segundo, tercero, etc. De igual
manera, a las posiciones de los equipos se les asignan los números 1,2,3,.. Por otra parte, los signos +
y – se pueden utilizar para designar mejoramiento o deficiencia (por ejemplo, el desarrollo de cierto
conocimiento después de tomar un curso de él). Si bien es posible considerar la variable subyacente en
cada uno de estos casos como continua, no obstante, empleamos arbitrariamente a los enteros a,2,3,...
(es decir, rangos) ya sea por conveniencia o por la falta de un método más científico.
Es interesante observar que muchas poblaciones pueden proporcionar los cuatro tipos de datos.
Por ejemplo, una carga de cierta mercancía se puede clasificar en una de dos categorías (dicotómicas):
aceptable o no aceptable. O bien, mercancía se puede jerarquizar de acuerdo con algún plan, como
buena, superior o excelente (tres o más categorías). Ambas clasificaciones producen datos discretos. Si
lo importante, por ejemplo tratándose de carne, es la cantidad de grasa por kilogramo, el peso
promedio de la mitad de una res, o la proporción entre grasa y carne, entonces los datos serán
continuos. Otro ejemplo de cómo los datos pueden asumir diferentes características se presenta en la
siguiente tabla:
LA MISMA POBLACIÓN PUEDE DAR ORIGEN A DIFERENTES TIPOS DE DATOS
TIPOS DE DATOS
|POBLACIÓN |CONTINUOS |DISCRETOS |NOMINALES |JERARQUIZADOS
POR RANGOS |
|Clase de tercer |Edades, pesos |No, en el grupo |Niños/ niñas |3er grado |
|grado | | | | |
|Automóviles |Kph, hpl |No, de defectos por|Colores |Más sucio |
| | |auto | | |
|Ventas de bienes |Valor en $ |No, de ofertas |sobrevaluado |Más claro |
|raíces | | | | |
Una colección de datos se conoce como conjunto de datos, y una sola observación es un punto
de dato.
¿Cómo podemos ordenar los datos?
RECOLECCIÓN DE DATOS
Hay que seleccionar las observaciones de manera que todos los grupos relevantes estén
representados en los datos. Los datos pueden prevenir de observaciones reales o de registros que se
mantienen para otros propósitos. Los datos pueden ayudar a los responsables de tomar decisiones a
hacer suposiciones bien pensadas acerca de las causas y por lo tanto de los efectos probables de
ciertas características en situaciones dadas. También el conocimiento de tendencias adquirido de la
experiencia previa puede permitir a los ciudadanos que les interesa estar al tanto de posibles resultados
y actuar en consecuencia.
Cuando los datos son ordenados de manera compacta y útil los responsables de tomar
decisiones pueden obtener información confiable sobre el ambiente y usarla para tomar decisiones
inteligentes.
[3]PRUEBA PARA DATOS
1. ¿De donde vienen los datos?. ¿La fuente es parcial?, es decir,¿ es posible que haya un interés en
proporcionar datos que conduzcan a una cierta conclusión más que a otras?
2. ¿Los datos comprueban o contradicen otras evidencias que se poseen?
3. ¿Hace falta alguna evidencia cuya ausencia pueda ocasionar que se llegue a una conclusión
diferente?
4. ¿Cuántas observaciones se tienen?¿ representan a todos los grupos que se desea estudiar?
5. ¿La conclusión es lógica?¿ Se ha legado a conclusiones que nuestros datos no confirman?
DIFERENCIA ENTRE MUESTRA Y POBLACIÓN
Una población es un todo y una muestra es una fracción o segmento de ese todo. Las muestras
las estudiamos con el fin de ser capaces de describir poblaciones. El estudio de las muestras es más
sencillo que el estudio de la población completa, más barato, menos tiempo.
Una población es un conjunto de todos los elementos del asunto que estamos estudiando,
acerca de los cuales intentamos sacar conclusiones.
PATRON SIGNIFICATIVO DE DATOS
Existen muchas formas de organizar los datos. Podemos colectarlos y mantenerlos en orden.
Una forma común de organizar los datos es dividirlos en categorías o clases parecidas y luego contar el
número de observaciones que quedan dentro de cada categoría.
DISTRIBUCIONES DE FRECUENCIAS
[4]Una distribución de frecuencia es un método de clasificación de datos en clases o intervalos,

de manera tal que se pueda establecer el número o porcentaje (es decir, la frecuencia) de cada clase.
Esto proporciona una forma de observar un conjunto de números sin que se tenga que considerar cada
número, y puede ser extremadamente útil al manejar grandes cantidades de datos. El número o
porcentaje en una clase se denomina frecuencia de clase.
El procedimiento para elaborar realmente una distribución de frecuencias para un conjunto de
datos dado, depende del tipo de datos particulares (esto es, continuos, discretos, nominales,
jerarquizados). Se supone que la producción de fruta (en bushels por árbol) se mide en una escala
continua
ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CONTINUOS

1. Halle el rango (diferencia entre el mayor y el menor de los datos)
2. Seleccione el numero de intervalos de clase. No debe ser menor de 15 ni menor de 5. Los intervalos
de clase tienen por lo general el mismo ancho, de modo que fijado el número de clases el intervalo se
obtiene por simple operación aritmética : intervalo = rango ( (número de clases).
3. Forme los intervalos de clase.
4. Fije los límites reales de cada clase, teniendo siempre presente que los intervalos de clase son
mutuamente excluyentes y que por lo tanto no debe haber ambiguedades en los límites.
5. Determine las frecuencias de clase contando el número de observaciones que cae dentro de cada
intervalo de clase.
EJEMPLO
El instructor de preparación física tiene a su cargo un grupo de 108 alumnos, los siguientes son
las estaturas de los mismos
|141 |151 |144 |138 |138 |152 |146 |144 |151 |153 |
|131 |152 |145 |139 |148 |146 |139 |154 |145 |143 |
|132 |153 |146 |140 |158 |149 |145 |137 |144 |152 |
|136 |154 |147 |159 |154 |145 |147 |145 |139 |143 |
|137 |155 |146 |157 |147 |139 |153 |157 |154 |142 |
|138 |157 |149 |155 |146 |148 |149 |144 |143 |152 |
|139 |158 |131 |149 |145 |147 |143 |148 |143 |142 |
|140 |159 |132 |158 |151 |159 |146 |151 |150 |142 |
|141 |160 |137 |148 |145 |144 |152 |144 |143 |142 |
|142 |162 |137 |154 |125 |153 |145 |152 |158 | |
|143 |150 |137 |140 |150 |146 |149 |144 |143 | |
[5]Utilizando los datos del cuadro anterior tenemos:
Rango 162 – 125 = 37
Seleccionamos 8 como número de clases (mayor que 5 y menor que 15). Para la anchura del
intervalo de clase tenemos . i = 37 ( 8 = 4,6(i = 5; si consideramos que 8(5=40, quiere decir que hay un
exceso de 3 sobre el rango verdadero, entonces lo distribuimos quitando 1 al límite inferior( 125 – 1 =
124) y aumentando 2 al límite superior( 162+2=164).
Formamos los intervalos de clase de la siguiente manera : el primero ( 124, 125, 126, 127, 128; total 5
amplitud, el segundo de 129 a 133 y así sucesivamente hasta el octavo que será 159-163.
Encontramos los límites reales, o sea la mediana o punto medio entre el límite superior de una clase y
el inferior de la siguiente. Limites reales: 123.5, 128.5,133.5,...,163.5; luego observamos si hay
ambigüedad o no en los límites.
Contamos las frecuencias que caen en cada intervalo de clase y elaboramos primero la tabla de
conteo y luego el cuadro correspondiente a la distribución
TABLA DE CONTEO
CLASE MARCAS CONTEO
123.5 – 128.5 ( 1
128.5 – 133.5 (((( 4
133.5 – 138.5 ((((((((( 9
138.5 – 143.5 (((((((((((((((((((((((( 24
143.5 – 148.5 ((((((((((((((((((((((((((((( 29
148.5 – 153.5 (((((((((((((((((((((( 22
153.5 – 158.5 (((((((((((((( 14
158.5 – 163.5 ((((( 5
TOTAL 108
DISTRIBUCIÓN DE FRECUENCIAS DATOS CONTÍNUOS
CLASE FRECUENCIA PORCENTAJE DE ALUMNOS
123.5 – 128.5 1 1/108 =0.00925 ( 0.93%
128.5 – 133.5 4 4/108 =0.03703 ( 3.703%
133.5 – 138.5 9 9/108 =0.08333 ( 8.333%
138.5 – 143.5 24 24/108 =0.22222 (22.222%
143.5 – 148.5 29 29/108 =0.26851 (26.851%
148.5 – 153.5 22 22/108 =0.20370 (20.370%
153.5 – 158.5 14 14/108 =0.12962 (12.962%
158.5 – 163.5 5 5/108 = 0.04629 (4.629%
TOTAL 108 1.00 ( 100%
FRECUENCIAS RELATIVAS
Las frecuencias relativas o porcentajes, para una distribución de frecuencias se calculan
dividiendo cada frecuencia para el número total de objetos clasificados. En el ejemplo anterior están en
la tercera columna(Porcentaje de alumnos)
[6]ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS DISCRETOS

Al elaborar una distribución de frecuencias de datos continuos se pierde cierta información
debido a que los valores individuales pierden su identidad cuando se agrupan en clases. Esto puede o
no suceder con datos discretos, dependiendo de la naturaleza de los mismos, y de los objetivos del
analista. Considérese los datos siguientes acerca del número de accidentes que ocurren diariamente
(durante 50 días) en un enorme estacionamiento
|6 |9 |2 |7 |0 |8 |2 |5 |4 |2 |
|5 |4 |4 |4 |4 |2 |5 |6 |3 |7 |
|3 |8 |8 |4 |4 |4 |7 |7 |6 |5 |
|4 |7 |5 |3 |7 |1 |3 |8 |0 |6 |
|5 |1 |2 |3 |6 |0 |5 |6 |6 |3 |
Se puede elaborar una distribución de frecuencias con clases 0-1,2-3,4-5,6-7,8-9. El resultado es una
distribución igual a la que se utiliza para datos continuos.
DISTRIBUCIÓN DE FRECUENCIAS DATOS DISCRETOS

CLASE NÚMERO DE DÍAS PORCENTAJE DE DÍAS
0-1 5 1/50 =0.10 ( 10%
2-3 11 11/50 =0.22 ( 22%
4-5 16 16/50 =0.32 ( 32%
6-7 13 13/50 =0.26 ( 26%
8-9 5 5/50 =0.10 ( 10%
TOTAL 50 1.00 ( 100%
ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS ACUMULADA

Una distribución de frecuencias acumuladas está diseñada para indicar el número o porcentaje
de elementos que son menores que cierto valor específico o iguales a éste. Se pueden convertir
cualquier distribución de frecuencias fácilmente en acumuladas, mediante sumas sucesivas de
frecuencias de clase. La distribución “menor que” permite ver de inmediato cuántos valores de los datos
son menores que algún valor determinado. La distribución “mayor que” muestra el número y/o el
porcentaje de elementos en el conjunto de datos que es mayor que cierto valor clave.
De modo en la tabla se puede observar que el 64% de los valores no excedió de 5, y que el 90%
no pasó de 7.
DISTRIBUCIÓN DE FRECUENCIAS ACUMULADA

Clase Frec Frc. Ac. < Fec. Acum.> Frec. Rel. Frec. Porc< Frec.AC.>
0-1 5 5 45 0.10 0.10 0.90
2-3 11 16 34 0.22 0.32 0.68
4-5 16 32 18 0.32 0.64 0.36
6-7 13 45 05 0.26 0.90 0.10
8-9 5 50 0 0.10 1.00 0.00
Total 50 1.00
DISTRIBUCIONES DE FRECUENCIAS PARA DATOS NOMINALES Y JERARQUIZADOS
Quizá las distribuciones de frecuencias más fáciles que sean las que se utilizan para datos
nominales y jerarquizados. Esta simplicidad radica en el hecho en que las clases se ponen de
manifiesto con más facilidad, de modo que los cálculos son mínimos. En la siguiente distribución en la
que se analizan las ventas de gaseosas, observamos que las categorías son los diversas sabores de
las gaseosas, la última categoría, varios, son aquellos sabores que se venden poco como: fresa,
tamarindo y toronja se agrupan en una sola categoría para simplificar la comprensión de los datos:
VENTA DE GASEOSAS EN UN DÍA

FRECUENCIA
|Sabor |Ventas Reales |Ventas Relativas |
|Cola |600 |60% |
|Limón |200 |20% |
|Naranja |100 |10% |
|Uva |50 |5% |
|Fresa |40 |4% |
|Otros |10 |1% |
La representación de datos jerarquizados es bastante semejante. Consideremos los datos del

promedio de calificaciones que presentan a continuación en un formato un tanto diferente al de las
tablas de frecuencias anteriores, sólo para demostrar otra forma de elaborarlas.
CALIFICACCIONES DEL CURSO
| |Mala |Regular |Promedio |Buena |Excelente |Totales |

|NUMERO |2 |4 |20 |10 |4 |40 |
|PORCENTAJE |5% |10% |50% |25% |10% |100% |
DIAGRAMAS Y GRÁFICAS
Las distribuciones de frecuencias constituyen un mundo ideal para representar los aspectos
esenciales de un conjunto de datos en términos entendibles y concisos, aún así los dibujos pueden ser
más efectivos para desplegar grandes conjuntos de datos
Los diagramas y gráficas más sencillos en su construcción están diseñados para datos
nominales u ordinales. Como los datos constituyen categorías, las clases son obvias y es fácil
describirlas en una gráfica.
[7]Diagrama pastel
Es una forma efectiva de desplegar los porcentajes en que se dividen los datos. Se usan mucho
en los presupuestos y la información económica. Se utilizan considerando que el círculo completo tiene
un área que equivale al 100%; un sector representa un tanto por ciento equivalente a la razón entre el
ángulo que forman los radios que limitan al sector y 360º que son el total de los grados de la
circunferencia.
[8]Ejemplos:
[pic]
La compañía Brite Paint pidió a varias personas que indicaran sus colores favoritos. La
tabulación de los resultados que están en la siguiente tabla muestra que 12 personas indicaron que el
rojo era su color favorito, 8 escogieron el verde, 8 escogieron el azul y 4 el amarillo 8 (datos nominales).
Esta tabulación representa una distribución de frecuencias porque enumera varias categorías (colores)
junto con el número de veces (frecuencia) que se seleccionaron cada una. A menos que exista algún
orden predeterminado, las categorías se enumeran en orden de magnitud: la categoría con la frecuencia
mayor se enumera primero, y así sucesivamente
El número total de personas se divide según el número de personas que eligieron cada color, las
frecuencias relativas que resultan son: 12/32=0.375; 8/32= 0.25; 8/32 0 0.25; 4/32 = 0.125. como el
37.5% de 360º [(0.375)(360)]= 135º. Las restantes longitudes de arco se calculan de forma similar, se
redondean los porcentajes
Diagrama de Barras
Con escala nominal u ordinal. Cada barra representa la frecuencia de una categoría. La altura de
la barra es proporcional al número de elementos de cada categoría. En general las barras se ponen en
posición vertical con la base en el eje horizontal de la gráfica. Las barras se separan ya ello se debe que
se utilice con tanta frecuencia para datos nominales y ordinales, la separación pone de manifiesto que
se están dibujando frecuencias de categorías distintas.
[9]Diagrama de Pareto
Es un diagrama que se usa para identificar y jerarquizar problemas. Se usa con frecuencia en
control de calidad. Consiste en barras que describen las componentes de una línea de producción o de
montaje. La altura de cada barra representa el número de ocurrencias de cada problema, de manera
que el diagrama muestra la gravedad del problema de calidad para cada variable medida
Ejemplo:
El siguiente gráfico representa los problemas más importantes de control de calidad de asientos
especiales para camiones. El diagrama de Pareto puede incluir también una segunda escala, encima de
las barras de las categorías, que muestran los porcentajes acumulados de las variables medidas.
Histograma y Polígonos de Frecuencia
HISTOGRAMA.- Con escala de intervalos o de razón. Se dibujan las categorías o clases a lo

largo del eje horizontal de la gráfica y los valores numéricos de cada clase se representan por barras
verticales. Un histograma se parece a un diagrama de barras sólo que no hay espacio entre las barras.
Esta es la razón por la que el histograma se usa con frecuencia para datos con escala de intervalos o
de razón: las barras adyacentes indican que se está resumiendo un intervalo numérico que muestra las
frecuencias de clases elegidas arbitrariamente.
Ejemplo:
DISTRIBUCIÓN DE FRECUENCIAS DATOS CONTÍNUOS

CLASE PUNTO MEDIO FRECUENCIA PORC. DE ALUMNOS
123.5 – 128.5 126 1 0.93%
128.5 – 133.5 131 4 3.703%
133.5 – 138.5 136 9 8.333%
138.5 – 143.5 141 24 22.222%
143.5 – 148.5 146 29 26.851%
148.5 – 153.5 151 22 20.370%
153.5 – 158.5 156 14 12.962%
158.5 – 163.5 161 5 4.629%
TOTAL 108 100%
El siguiente gráfico representa el ejemplo desarrollado de las estaturas de los alumnos analizadas
por el preparador físico
POLÍGONOS DE FRECUENCIA.- se marcan las frecuencias sobre el eje vertical y los valores de la
variable que se está midiendo en el eje horizontal. Se representa la frecuencia de cada clase dibujando
un
punto medio de la clase dibujando un punto medio de la clase y se conectan los puntos sucesivos con
líneas rectas para formar el polígono. En los extremos de la escala horizontal se agregan 2 nuevas
clases con frecuencia cero. Esto permite que el polígono llegue al eje horizontal en los extremos de la
distribución.
Diagrama de Tallo y Hoja
Es una alternativa de mostrar datos. Es similar al histograma, aunque se muestran los datos
reales en lugar de barras
Ejemplo:
Kyle Chang, el dueño de la tintorería The Wash, quiere saber el número de órdenes de trabajo
que se procesan al día. Se elige una muestra aleatoria de días de estudio. A continuación los datos,
Kyle quiere usar estos datos para entender el patrón que sigue su carga de clientes.
CLIENTES POR DÍA DE LA TINTORERIA The Wash Tub

|65 |23 |26 |45 |12 |45 |56 |35 |26 |
|de examen de admisión |Aumento |9 |7 |7 |6 |4 |2 |2 |
Calculamos la media de esta muestra de 7 estudiantes de la manera siguiente:

Media de la muestra ( x = (x . = 9+7+7+6+4+4+2 = 39 = 5.6 puntos de estudiante
n 7 7
Cálculo de la Media para datos agrupados.

En una distribución de frecuencias consta de datos agrupados en clases, a diferencia del
ejemplo del examen de admisión, no sabemos el valor individual de cada observación. Para encontrar la
media aritmética de datos agrupados primero calculamos el punto medio de cada clase, después
multiplicamos cada punto medio por la frecuencia de las observaciones de dicha clase, sumamos los
resultados y dividimos esta suma entre el número total de observaciones de la muestra. La fórmula es la
siguiente:
Media de datos agrupados ( x = ((f ( x)
n
en la cual
x = media de la muestra
( = símbolo que significa “la suma de”[12]
f = frecuencia (número de observaciones) de cada clase.
X = punto medio de cada clase de la muestra.
n = número de observaciones de la muestra.
Ejemplo:
En la siguiente distribución de frecuencias del saldo promedio mensual de la cuenta de cheques
de 600 clientes de una sucursal bancaria.
|Saldos promedio |Clase(dólares) |Frecuencia |
|mensuales de 600 |0 – 49.99 |78 |
|cuentas de |50.00 – 99.99 |123 |
|cheques |100.00 – 149.00 |187 |
| |150.00 – 199.99 |82 |
| |200.00 – 249.99 |51 |
| |250.00 – 299.99 |47 |
| |300.00 – 349.99 |13 |
| |350.00 – 399.99 |9 |
| |400.00 – 449.99 |6 |
| |450.00 – 499.99 | 4 .|
| | |600 |
A partir de la información de la tabla podemos calcular fácilmente una estimación del valor de la
media de estos datos agrupados. Es una estimación debido a que no utilizamos el total de las 600
puntos dados de la muestra.
|Cálculo |Clase(dólares) |Puntos Medios (X) | |Frecuencia | |Frecuencia

|
|mensuales de 600 |0 – 49.99 |25.00 |( |78 |= |1 950 |
|cuentas de |50.00 – 99.99 |75.00 |( |123 |= |9 225 |
|cheques |100.00 – 149.00 |125.00 |( |187 |= |23 375 |
| |150.00 – 199.99 |175.00 |( |82 |= |14 350 |
| |200.00 – 249.99 |225.00 |( |51 |= |11 475 |
| |250.00 – 299.99 |275.00 |( |47 |= |12 925 |
| |300.00 – 349.99 |325.00 |( |13 |= |4 225 |
| |350.00 – 399.99 |375.00 |( |9 |= |3 375 |
| |400.00 – 449.99 |425.00 |( |6 |= |2 550 |
| |450.00 – 499.99 |475.00 |( | 4 . |= |1 900 |
| | | | |(f = n = 600 | |((f(x) =83 350 |
x = ((f ( x) = 85 350 = 142.25( Media de la muestra ( dólares )

n 600
En nuestra muestra de 600 clientes, el saldo mensual es de 142.25 dólares.
La Media Pesada
La media pesada (Ponderada) nos permite calcular el promedio que toma en cuenta la
importancia de cada valor con respecto al total. En la siguiente distribución una compañía utiliza tres
niveles de trabajo, no calificado, semicalificado y calificado, para la producción de 2 de sus productos
finales. La compañía desea saber el promedio del costo de trabajo por hora par cada uno de los
productos.
| | | |Horas de trabajo |invertido |

| | | |Por unidad |producida |
|Entrada de trabajo |Nivel de trabajo |Salario por hora (x) |Producto 1 |Producto
2 |
|por proceso de |No calificado |$ 5.00 |1 |4 |
|manufactura |Semicalificado |7.00 |2 |3 |
| |Calificado |9.00 |5 |3 |
Cálculo de la Media Pesada
Los promedios pesados dan el valor correcto para los costos promedio por hora de trabajo para los
dos productos, ya que toman en cuenta las diferentes cantidades de cada nivel de trabajo que se utiliza
en la elaboración de los productos. Usando símbolos, la fórmula para calcular el promedio pesado es:
Xw = ((w ( x)
(w
en donde:
Xw = símbolo para la media pesada[13]
W = peso asignado a cada observación ( 1/8, 2/8 y 5/8) para le producto 1, 4/10, 3/10 y 3/10 para el
producto 2 del ejemplo
((w ( x) = la suma de los productos del peso de cada elemento por el elemento correspondiente
( w = suma de todos los pesos
Si aplicamos la ecuación tenemos:
Xw = ((w ( x) = ( 1/8 ( $5) + ( 2/8 ( $7) + ( 5/8 ( $9) = $ 8 = $8.00/ hora

(w 1/8 + 2/8 + 5/8 1
13La Media geométrica
En ocasiones trabajamos con cantidades que cambian en un cierto periodo, necesitamos

conocer una tasa promedio de cambio, como la tasa de crecimiento promedio en un período de varios
años. En tales casos, la media aritmética simple resulta inapropiada, pues nos da resultados
equivocados. Lo que necesitamos es la media geométrica, conocida sencillamente como M.G.
Por ejemplo considere el crecimiento de una cuenta de ahorros. Suponga que depositamos $100
inicialmente y dejamos que acumule interés a diferentes tasas durante 5 años, como lo expresa la
siguiente distribución:
| |Año |Tasa de |Factor de |Ahorros al |

|Crecimiento de | |Interés |crecimiento |final de año |
|depósito de $100 |1 |7% |1.07 |$107.00 |
|en una cuenta |2 |8 |1.08 |115.56 |
|de ahorros |3 |10 |1.10 |127.12 |
| |4 |12 |1.12 |142.37 |
| |5 |18 |1.18 |168.00 |
Cálculo de la Media geométrica
Para encontrar el factor de crecimiento promedio correcto podemos multiplicar los factores de
crecimiento de los 5 años y luego tomar la raíz quinta del producto (es decir encontrar un número que al
multiplicarse cuatro veces por sí mismo dé como resultado el producto con el que empezamos). El
resultado es el factor de crecimiento como media geométrica, que es el promedio adecuado que
debemos utilizar. La fórmula para encontrar la media geométrica de una serie de números es:
Aplicando al problema tenemos:
La Mediana
La mediana es solo un valor calculado a partir del conjunto de datos que mide la observación
central de estos
[14]Cálculo de la Mediana a partir de datos no agrupados
El procedimiento para obtener la mediana es como sigue:
1. Ordenar o clasificar valores.

2. Contar para saber si existe un número de valores par o impar.
3. En caso de que se tenga un número impar de valores, la mediana es el valor intermedio. En cambio
para un número par de valores, la mediana es el promedio de los dos valores intermedios.
[15]Cálculo de la Mediana a partir de datos agrupados

Los especialistas utilizan la siguiente ecuación para determinar la mediana de un conjunto de
datos agrupados:
Mediana de la muestra ( m = ( (n+1)/2 – ( f + 1) ( w + Lw.
( fm (
en la que :
m =mediana de la muestra
n = número total de elementos de la distribución
F = suma de todas las frecuencias de clase hasta, pero sin incluir, la clase mediana
fm =frecuencia de la clase mediana
w = ancho del intervalo de clase
Lw. = límite inferior del intervalo de clase mediano
Ejemplo
En el ejemplo de los saldos mensuales promedio de las cuentas de 600 clientes, no podemos
calcular la mediana del saldo de cuentas, determinando cuál de los diez intervalos de clase contiene a
la mediana, debemos calcular en que intervalo estará al acumular las frecuencias, la hallamos en
600(2=300 y aplicamos la fórmula.
| |Clase en |Frec. |Frec. |Frec. |Frec. Rel. | |

| |dólares | |Acum |Relat. |Acum | |
|Saldos |0.00 –49.99 |78 |78 |13% |13% | |
|Mensuales |50.00 – 99.99 |123 |201 |20.5 |33.5 | |
|Promedio de |100.00 – 149.99 |187 |388 |31.16 |64.66 |(clase mediana |
| |200.00 – 249.99 |51 |521 |8.5 |86.83 | |
| |250.00 – 299.99 |47 |568 |7.83 |94.66 | |
| |300.00 – 349.99 |13 |581 |2.16 |96.83 | |
| |350.00 – 399.99 |9 |590 |1.5 |98.33 | |
| |400.00 – 449.99 |6 |596 |1 |99.33 | |
| |450.00 – 499.99 | 4 .|600 |.66 |100.00 | |
| | |600 | | | | |
| | | | | | | |
Utilizando la ecuación tenemos:

m=?
n = 600
F = 201
fm =187
w = $50
Lw. = 100
m = ( (601)/2 – ( 202) ( $50 + $100

( 187 (
m = ( 98.5 ( $50 + $100
( 187 (
= (0.527)($50) + $100
= $ 126.35 (Mediana de la muestra estimada
La Moda
La moda es una medida de tendencia central diferente de la media, pero un tanto parecida a la
mediana. La moda es aquel valor que más se repite en el conjunto de datos
Cálculo de la Moda a partir de datos no agrupados
El azar puede desempeñar un papel importante en la organización de los datos, en ocasiones el azar
hace que un valor se repita lo suficiente para ser el valor más frecuente del conjunto de datos.
Ejemplo
VIAJES ORGANIZADOS EN ORDEN ASCENDENTE
|Viajes por |0 |2 |5 |7 |15 |( |
|Entrega por un |0 |2 |5 |7 |15 |((moda |
|día en un |1 |4 |6 |8 |15 |( |
|Período de |1 |4 |6 |12 |19 | |
|20 días | | | | | | |
En el ejemplo, presentamos el número de viajes de entrega por día que hace una planta
revolvedora de concreto. El valor modal es 15, ya que se presenta más a menudo que cualquier otro
valor (tres veces). La moda nos dice que 15 es el número más frecuente de viajes, pero no nos dice que
la mayor cantidad de viajes está por debajo de 10.
[16]Cálculo de la Moda a partir de datos agrupados
Cuando los datos ya se encuentran agrupados en una distribución de frecuencias, podemos

suponer que la moda está localizada en la clase que contiene el mayor número de elementos, es decir,
en la clase que tiene la mayor frecuencia. Se utiliza la siguiente ecuación para determinar la moda de
un conjunto de datos agrupados:
Moda de la muestra ( Mo = LMo + ( d1 ( w.
( d1 + d2 (
en la que :
LMo = límite inferior de la clase modal
d1 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente
debajo de ella.
d2 = frecuencia de la clase modal menos la frecuencia de la clase que se encuentra inmediatamente por
encima de ella.
w = ancho del intervalo de clase
Ejemplo
En el ejemplo de los saldos mensuales promedio de las cuentas de 600 clientes, la moda del
saldo de las cuentas de cheques entonces LMo = $100; d1 =187 – 123 = 64 ; d2 = 187 – 82 = 105 y
w=$50
| |Clase en |Frec. |Frec. |Frec. |Frec. Rel. | |

| |dólares | |Acum |Relat. |Acum | |
|Saldos |0.00 –49.99 |78 |78 |13% |13% | |
|Mensuales |50.00 – 99.99 |123 |201 |20.5 |33.5 | |
|Promedio de |100.00 – 149.99 |187 |388 |31.16 |64.66 |(clase modal |
| |200.00 – 249.99 |51 |521 |8.5 |86.83 | |
| |250.00 – 299.99 |47 |568 |7.83 |94.66 | |
| |300.00 – 349.99 |13 |581 |2.16 |96.83 | |
| |350.00 – 399.99 |9 |590 |1.5 |98.33 | |
| |400.00 – 449.99 |6 |596 |1 |99.33 | |
| |450.00 – 499.99 | 4 .|600 |.66 |100.00 | |
| | |600 | | | | |
| | | | | | | |
Utilizando la ecuación tenemos:
Moda de la muestra ( Mo = LMo + ( d1 ( w.

( d1 + d2 (
m = $100 + ( 64 ( $50 .
( 64 + 105 (
= $100 + (0.38)($50)
= $ 119.00 (Moda
[17]Todo promedio encubre y allana los valores extremos – al mismo tiempo que es influido por ellos
La Media, la Mediana y la Moda
[18]De lo que hemos aprendido sobre los promedios, hay algo que cada vez ha ido apareciendo
más claramente. Los valores medios (y sobretodo la media aritmética tantas veces utilizada) necesitan
de una segunda medida si queremos valorarlos correctamente en su significado y fuerza de afirmación.
El modo más fácil de completar la información es indicar cuan lejos se hallan los extremos de
ella. Ya que la estadística conoce “ la amplitud del intervalo”, ha ideado una medida mejor que junto
con la media haga posible tener una buena idea de la distribución de los valores alrededor de la misma.
Es la llamada Desviación típica, la medida de la dispersión.
[19]DISPERSIÓN: MEDIDAS DE DESVIACIÓN PROMEDIO
Es conveniente considerar cuatro variables de dispersión: la amplitud de variación, la desviación

media, la varianza y la desviación estándar. Todas estas medidas, excepto la amplitud de variación,
toman a la media como punto de referencia
Amplitud de variación
La amplitud de variación de un grupo de números es generalmente la medida más sencilla de

calcular y comprender. Se puede expresar estableciendo la diferencia entre los números mayor y menor
de un grupo, o bien, identificando ambos números
Ejemplo
A continuación se dan algunos ejemplos;
AMPLITUD DE VARIACIÓN
Números Diferencia Del más bajo al más alto

|1 |5 |7 |
|1 |-2 |2 |
|2 |-1 |1 |
|3 |0 |0 |
|4 |1 |1 |
|5 | 2 .| 2 |
| | |. |
| |0 |6 |
[21]
Las descripciones más comprensivas de la dispersión son aquellas que tratan con la desviación
promedio con respecto a alguna medida de tendencia central. Dos de tales medidas son importantes
para nuestro estudio: la variancia y la desviación estándar. Ambas medidas nos dan una distancia
promedio de cualquier observación del conjunto de datos con respecto a la media de la distribución.
Varianza de la población
Cada población tiene una varianza, que se simboliza con (2 (sigma cuadrada). Para calcular la
varianza de la población usamos la siguiente fórmula
(2 = ( ( x - ()2 = ( x2 - (2 =
N N
En la que:
(2 = varianza de la población
x = elemento u observación
( = media de la población
N = número total de elementos de la población
( = suma de todos los valores (x - ()2, o todos los valores de x2
Desviación Estándar de la población
La desviación estándar de la población o (, es simplemente la raíz cuadrada de la varianza de la

población
Cálculo de la Varianza y la desviación estándar a partir de datos no agrupados
Ejemplo
Si tenemos una muestra de un compuesto producido en un día y probamos cada frasco para
determina la pureza del compuesto obtendríamos los datos que están en la tabla siguiente:
PORCENTAJE DE IMPUREZA OBSERVADO

|Resultados de |0.04 |0.14 |0.17 |0.19 |0.22 |
|la prueba de pureza |0.06 |0.14 |0.17 |0.21 |0.24 |
|De compuestos |0.12 |0.15 |0.18 |0.21 |0.25 |
| |Observación | |Media | |Desviación |Desviación |Observación |

| | | | | | |al cuadrado |al cuadrado |
| |(x) | |( | |(x - () |(x - ()2 |x2 |
|Determinación | 0.04 |- |0.166 |= |- 0.126 |0.016 |
| | |medio |f | | | |
|Determinación |700 - 799 |750 |4 | 3000 |- 500 |1000000 |
|de la varianza |800 - 899 |850 |7 | 5950 |- 400 |1120000 |
|y de la |900 – 999 |950 |8 | 7600 |- 300 |720000 |
|desviación |1000 - 1099 |1050 |10 |10500 |- 200 |400000 |
|estándar de las |1100 - 1199 |1150 |12 |13800 |- 100 |120000 |
|ventas en 100 |1200 - 1299 |1250 |17 |21250 |0 |0 |
|restaurantes |1300 - 1399 |1350 |13 |17550 |100 |130000 |
|de comida |1400 - 1499 |1450 |10 |14500 |200 |400000 |
|rápida |1500 - 1599 |1550 |9 |13950 |300 |810000 |
|situados en el |1600 – 1699 |1650 |7 |11550 |400 |1120000 |
| |1700 - 1799 |1750 |2 | 3500 |500 |500000 |
|Distrito Ori. |1800 - 1899 |1850 | 1 . | 1850 |600 | 3600000 |
|de Cumberland | | |100 |125000 | | 6680000 |
X = ( (f ( x) = 125000 = 1250( media (2 = (f ( x - ()2 = 6680000 = 6680000( varianza

N 100 N 100
Desviación Estándar de la muestra
Para calcular la desviación estándar de una muestra, utilizamos las mismas fórmulas que en la
población pero cambiamos ( por x y N con n-1:
s2 = ( ( x - x)2 = ( x2 - nx2 =
n-1 n-1 n-1
s2 = varianza de la muestra
x = valor de cada una de las n observaciones

( = media de la muestra
n-1 = número de observaciones de la muestra menos 1
x = media de la muestra
se debe usar n-1 como denominador porque al tomar muchas muestras de una población dada, si
encontramos la varianza de la muestra(s2) para cada muestra y promediamos los resultados, entonces
este promedio no tiende a tomar el valor de la varianza de la población, (2, a menos que lo usemos.
Ejemplo
En la siguiente tabla se muestran los donativos anuales de Blue Cross-Blue Shield al Hospital de
Cumberland:
| |Observación | |Media | |Desviación |Desviación |Observación |

| | | | | | |al cuadrado |al cuadrado |
| |(x) | |x | |(x - x) |(x - x)2 |x2 |
|Determinación |863 |- |1351 |= |- 488 |238144 |744769 |
|de la varianza |903 |- |1351 |= |- 448 |200704 |815409 |
|y de la |957 |- |1351 |= |- 394 |155236 |915849 |
|desviación |1041 |- |1351 |= |- 310 |96100 |1083681 |
|estándar del |1138 |- |1351 |= |- 213 |45369 |1295044 |
|donativos |1204 |- |1351 |= |- 147 |21609 |1449616 |
|anuales de |1354 |- |1351 |= |3 |9 |1833204 |
|Blue Cross- |1624 |- |1351 |= |273 |74529 |2637376 |
|Blue Shield |1698 |- |1351 |= |347 |120409 |2883204 |
|al Hospital |1745 |- |1351 |= |394 |155236 |3045025 |
|de Cumberland |1802 |- |1351 |= |451 |203401 |3247204 |
| |1883 |- |1351 |= |532 |283024 |3545689 |
| | | | | | |((x-x)2(1593770 |(x2(23496182 |
| | | | | | | | |
s2 = ( ( x - x)2 = 1593770 = 144888(Varianza de la muestra

n-1 11
PROBABILIDADES
EXPERIMENTO.- Es el proceso de efectuar una observación. (lanzar un dado una o varias veces y
reunir los datos sobre los resultados posibles)
ESPACIO MUESTRAL.- Es un conjunto que corresponde a todos los resultados posibles de un
experimento listados de modo completo y mutuamente excluyente (cualquier experimento puede
originar varios resultados posibles, el conjunto de todos ellos se llama Espacio Muestral).
EVENTO.- Es cualquier subconjunto de un espacio muestral.
PROBABILIDAD
De la definición elemental de probabilidad tenemos que si n es el número de ensayos de un
e4xperimento, como por ejemplo el número de lanzamientos de una moneda parece que entonces se
podría definir la probabilidad de un evento E, mediante:
P(E) = l i m número de veces que sucede E
n(( n
Pero el problema es establecer si converge siempre este límite por esto necesitamos una
definición formal de Probabilidad:
EJEMPLO[pic]
Supóngase que un experimento tiene asociado un espacio muestral S. Una probabilidad es una
función de valor numérica que asigna un número P(A) a cada evento A de tal manera que son válidos
las siguientes axiomas:
1) P(A)(0
2) P(S) = 1
3) Si A1, A2,..., es una sucesión de eventos mutuamente excluyentes, es decir Ai, Aj = ( para toda i(j,
entonces, (
P( ( Ai ) 0 ( P( Ai )
i=1
De acuerdo a lo anterior A y B son eventos mutuamente excluyentes
P(A(B) = P(A) + P(B)
Si lanzamos un dado normal cada uno de las caras tiene la misma probabilidad de ocurrir o sea
que son equiprobables. Se asigna 1/6 a cada uno de esos 6 elementos de S.
P(E) = 1/6 i = 1.2.3..6 E2 será un 2 E4 será un 4 E6 será un 6
P(A) = P(E2)+P(E4)+P(E6) = 1/6+1/6+1/6= ½
Los términos al AZAR y ALEATORIO se interpretan como una imposición de probabilidades iguales al
número finito de puntos en el espacio muestral.
Con frecuencia, las probabilidades que se asignan a los eventos se basan en evidencia
experimental o en estudios de observación, que producen datos de frecuencia relativa para los
eventos de interés. Los datos sólo dan aproximaciones a las verdaderas probabilidades pero
bastantes buenas.
EJEMPLO
[pic]
REGLAS DE CONTEO ÚTILES EN PROBABIILIDADES
Si consideramos
P(A) = número de resultados favorables a A
Número total de resultados equiprobables
Esta definición funcionará con espacio muestral finito con resultados equiprobables.
1 REGLA DE LA SUMA
Para calcular la probabilidad de que ocurra cualquier suceso A o B, se usa la regla de la

suma. Para ello debe determinarse si los sucesos son mutuamente excluyentes o no
SUCESOS QUE NO SON MUTUAMENTE EXCLUYENTES, P(A(B)=P(A)+P(B)-P(A(B) SUCESOS
MUTUAMENTE EXCLUYENTES, P(A(B)=P(A)+P(B)
SUCESOS INDEPENDIENTES.- Si la ocurrencia de uno no afecta en ninguna forma a las
posibilidades de que el segundo ocurra ( P(A(B)=P(A)(P(B)
SUCESOS DEPENDIENTES.- Si la ocurrencia de uno altera las posibilidades de que el
segundo ocurra ( P(A(B)=P(A)(P(B/A)
2 PROBABILIDAD CONDICIONAL E INDEPENDENCIA

Fácilmente pueden surgir dificultades cuando se pide la probabilidad de un evento sin
especificar el espacio muestral o también este se puede reducir mediante información adicional
disponible entre los elementos en cuestión. Esta información adicional se llama información
condicional.
1 Definición.- Si P(B) no es igual a cero, entonces la probabilidad condicional de A en relación

con B, es decir, la probabilidad de A dada B, es
P(A/B) = P(A(B)
P(B)
EJEMPLO
Los registros de policía muestran que en cierta ciudad la probabilidad es 0.35 de que se capture a
un ladrón y 0.14 de que se capture y condene el ladrón. ¿Cuál es la probabilidad de que un
ladrón, si es capturado, será condenado?
A = evento un ladrón sea condenado
B = evento que un ladrón sea capturado
P(B)= 0.35
P(A(B) = 0.14
P(A/B) = P(A(B) = 0.14 = 0.40
P(B) 0.35
EVENTOS INDEPENDIENTES
El evento A es independiente de el evento B si la probabilidad del evento A no se ve afectada
por la incidencia o no incidencia de A
Si los eventos A y B no son independientes, se dice que son dependientes
EJEMPLO
Se tiene una urna con 7 bolas rojas y 3 negras. Si se extraen 2 bolas una a continuación
de otra, ¿cuál es la probabilidad de que sea roja la primera y roja la segunda?
a)Hay reposición
P(R1(R2), debe ocurrir los dos eventos
P(R1yR2)= P(R1)P(R2) = 7/10(7/10 = 49/100
Son independientes porque hay reposición
b) no hay reposición
P(R1yR2)= P(R1)P(R2 / R1)=7/10(6/9 = 42/90
Son dependientes, entonces la posibilidad de que ocurra R2 dado que ocurrirá R1 es 6/9
3 REGLA DE MULTIPLICACIÓN
Si la primera tarea de un experimento da como resultado n1 resultados posibles y, para cada

uno de ellos, la segunda tarea da como resultado n2 resultados posibles, entonces se tienen n1 y n2,
resultados posibles para las dos tareas juntas.
La regla de multiplicación se amplía a más tareas sucesivas.
Nos ayudamos del diagrama del árbol
Si se tienen que calcular la probabilidad de que ambos sucesos A y B ocurran, se usa la regla de
la multiplicación, para usarse esta regla debe determinarse si son dependientes o independientes
P(A(B)=P(A)(P(B/A) ( EVENTOS DEPENDIENTES
P(A(B)=P(A)(P(B) (EVENTOS INDEPENDIENTES
EJEMPLO
a)¿Cuál es la probabilidad de obtener 2 águilas en dos lanzamientos al aire de una moneda
equilibrada ? ½ ( ½ = ¼
b)P( C )= 0.65, P (D) = 0.40 y P(C(D)= 0.24, ¿Son inde4ependientees los eventos C y D?
P(C )(P(D) = 0.65( 0.40 = 0.26 y no 0.24, los dos eventos son dependientes
EJEMPLO
Supóngase que una empresa ha de decidir donde construir dos plantas nuevas, una en el lado
oriente y otra en el poniente
[pic]
n1 n2, = 4(2=8
Calcular la probabilidad de que sea seleccionada la ciudad E .
{E sale seleccionada} = {AE} ({BE}({CE}({DE}=P{AE}+P{BE}+P{CE}+P{DE} = 1//8+1/8+1/8+1/8=
½ = 0.5
No es importante el orden y solo interesa el número de subconjuntos de determinado tamaño
que se pueden seleccionar de un conjunto dado
EJEMPLO
Supóngase 3 empleados deben seleccionarse de entre los 10 para ir a la misma planta. ¿De
cuántos modos se puede hacer la selección?
ARREGLOS ORDENADOS O PERMUTACIONES
El número de arreglos ordenados o permutaciones , de 5 objetos seleccionados entre n
objetos distintos, si (r(n) está dado por
Prn = n(n-1) ...(n – r + 1) = n! .
(n – r )!
EJEMPLO
De entre 10 empleados se deben seleccionar tres para viajar a 3 plantas A,B,C fuera de la
ciudad. Cada empleado irá a una planta. Como las plantas están en distintas ciudades, es importante
el orden de asignación de los empleados de las plantas. ¿De cuántos modos se puede hacer la
selección?
Es importante el orden.
P310 = 10! = 720
3!
2 COMBINACIONES
El número de subconjuntos distintos o combinaciones, de tamaño r que se pueden seleccionar

de n objetos distintos, si (r(n) es;
No es importante el orden y solo interesa el número de subconjuntos de determinado tamaño

que se pueden seleccionar de un conjunto dado
EJEMPLO
Supóngase 3 empleados deben seleccionarse de entre los 10 para ir a la misma planta. ¿De
cuántos modos se puede hacer la selección?
[pic]
4 TEOREMA DE BAYES
DEFINICIÓN.- Sean A1,A2...,Ak sucesos mutuamente excluyentes que ocupan todo el espacio
muestral (. Si cada uno de estos sucesos tiene probabilidad no nula y uno de ellos debe ocurrir,
entonces para cada suceso B en el espacio muestral ( .
P(A1/B) = P(A1) P(B/ A1) .
P(A1) P(B/ A1) + P(A2) P(B/ A2) + . . . . . . . . + P(AK) P(B/ AK)
P(A2/B) = P(A2) P(B/ A2) .
Y finalmente
P(Ak/B) = P(Ak) P(B/ Ak) .
Para i = 1,2,. . . . , o bien k
EJEMPLOS
a) Un[22][23] fabricante está considerando comprar un lote del 10 000 piezas de un proveedor.
El fabricante estima la proporción de piezas defectuosas en el lote en la forma siguiente:
|Proporción de piezas |Probabilidad |
|defectuosas |P(x) |
|(1 = 0.10 |P((1 )= 0.210 |
|(2 = 0.15 |P((2 )= 0.30 |
|(3 = 0.25 |P((3 )= 0.50 |
Esto significa que el fabricante no está seguro acerca de la proporción de piezas

defectuosas en el lote; sin embargo, basándose en experiencias anteriores, cree que hay una
probabilidad de 0,20 de que el lote tenga 10% de piezas defectuosas, una probabilidad de0,30
de que tenga 15% y finalmente, de 0,50 de que tenga 25% de piezas defectuosas.
a) ¿Cuál es la probabilidad de que elige una pieza al azar en el lote.
b) Dado que la pieza resulta defectuosa, ¿cuál es la probabilidad de que el lote tenga 25% de
piezas defectuosas?
P((3 / D) = P(((3 ( D) = 0.1250 = 0.6579

P(D) 0.1900
b) Todas las noches el señor Herrera llega tarde a su casa. La señora Herrera, que es una buena
esposa, le deja encendida la luz de la entrada a la casa. La probabilidad de que el señor Herrera
llegue borracho es 0,60. Si llega borracho, hay una probabilidad de 0,90 de que olvide apagar la luz
en tanto que ésta solo de 0.05 si llega sobrio.
a) ¿Cuál es la probabilidad de que el señor Herrera apague la luz en una noche cualquiera?
b) Dado que el señor Herrera apagó la luz una cierta noche, ¿cuál es la probabilidad de que haya
llegado borracho?
RESPUESTA: a)0.44 b)6/44
1 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD
Las variables aleatorias discretas sólo pueden tomar un número de valores finito. Cuando una
variable puede tomar un conjunto discreto de valores. Las variables aleatorias suelen clasificarse de
acuerdo con el número de valores que pueden asumir.
Una distribución de probabilidades es una correspondencia que asigna probabilidades a sus
valores.
La tabla del ejemplo que sigue sirve para ilustrar lo que significa la Distribución de
Probabilidad de una variable aleatoria
Se construye una tabla donde se muestra las probabilidades de obtener la suma de dos los
puntos obtenidos en el lanzamiento de dos dados.
|x |P(x) |xP(x) |x2 |x2P(x) |

|2 |1/36 |2/36 |4 |4/36 |
|3 |2/36 |6/36 |9 |18/36 |
|4 |3/36 |12/36 |16 |48/36 |
|5 |4/36 |20/36 |25 |100/36 |
|6 |5/36 |30/36 |36 |180/36 |
|7 |6/36 |42/36 |49 |294/36 |
|8 |5/36 |40/36 |64 |320/36 |
|9 |4/36 |36/36 |81 |324/36 |
|10 |3/36 |30/36 |100 |300/36 |
|11 |2/36 |22/36 |121 |242/36 |
|12 |1/36 |12/36 |144 |144/36 |
| |1 |((x)=7 | |((x2)=54.83 |
ESPERANZA MATEMÁTICA
El valor esperado de una variable discreta X que tiene una función p(x) de probabilidad está
dada p[24]o[25]r
E(X)=( xP(x)
(La suma es con respecto a todos los valores de x para los cuales P(x)>0.)
A veces se emplea la notación
E(X) =(
VARIANCIA
La variancia de una variable aleatoria X cuyo valor esperado es ( es
V(X) = E [(X - ()2] o V(X) = E(X2) – [E(X)]2
A veces se usa la notación
E [(X - ()2] = (2
DESVIACIÓN ESTÁNDAR.
De una variable aleatoria X es la raíz de la variancia, y está definida mediante
( = ((2 = (E[(X - ()2 ] o ( = ((2 = (E(X2) – [E(X)]2
HISTOGRAMA DE FRECUENCIA RELATIVA (para la tabla anterior)

6/36 ( (
5/36 ( ( (
4/36 ( ( (
3/36 ( ( (
2/36 ( ( (
1/36 ( ( (
0 2 3 4 5 6 7 8 9 10 11 12
1 DISTRIBUCIÓN BINOMIAL
Se acostumbra a decir que el número de aciertos en n ensayos es una variable aleatoria que
tiene la distribución de probabilidad Binomial o simplemente la distribución Binomial.. la distribución
Binomial recibe el nombre en virtud de que para x = 0,1,2,.,.,.,y n, los valores de las
probabilidades son los término sucesivos de la expansión Binomial de [(1 - p) + p]n.
DEFINICIÓN.- Si n es el número de intentos o ensayos, p es la probabilidad de un acierto en cada
ensayo y todos los ensayos son independientes, entonces la probabilidad de lograr x aciertos en n
ensayos es:
Una variable aleatoria X tiene una distribución Binomial si existen las cinco condiciones
siguientes:
1) El experimento consiste en un número fijo de n intentos idénticos .
2) Cada intento sólo puede tener un resultado de dos posibles, que se llaman “éxito” y ”fracaso”
3) La probabilidad p de “éxito” es constante de intento a intento
4) Los intentos son independientes
5) Se define a X como el número de éxitos en n intentos
n y p son los parámetros de la distribución Binomial
EJEMPLO
Si la probabilidad de que una pareja de divorciados se vuelva a casar dentro de 3 años es
0.40 determine las probabilidades de que de 10 parejas de divorciados.
a. cuando mucho tres se volverán a casar dentro de tres años;
b. cuando menos tres se volverán a casar dentro de tres años;
c. de dos a cinco se volverán a casar dentro de tres años;
d. cuando menos dos se volverán a casar dentro de tres años.
a) n = 10 , p = 0.40 y x = 0,1,2 y 3 ( 0.006 + 0.040 + 0.121 + 0.215 = 0.382
b) n = 10 , p = 0.40 y x = 7,8,9 y 10 ( 0.042 + 0.011 + 0.002 + 0.000 = 0.055
c) n = 10 , p = 0.40 y x = 2,3,4 y 5 ( 0.121 + 0.215 + 0.251 + 0.201 = 0.788
d) n = 10 , p = 0.40 y x = 0 y 1 son 0.006 y 0.040. por tanto , la probabilidad de que cuando
menos dos de 10 parejas de divorciados se vuelvan a casar dentro de tres años es ( 1-
(0.06+0.040) = 0.954
2 DISTRIBUCIÓN DE POISSON
Cuando n es grande y p es chica, las probabilidades binomiales a menudo se aproximan por medio
de la fórmula:
Es una forma especial de la distribución de Poisson: la utilizaremos sólo cuando n sea cuando
menos 100 y n p sea menor que 10
EJEMPLO
Los registros muestran que la probabilidad es 0.00005 de que a un automóvil se lee reviente
un neumático al cruzar cierto túnel. Emplee la aproximación de Poisson a la distribución Binomial
para determinar las probabilidades de que entre 10 000 automóviles que cruzan este túnel.
a) cuando menos a dos se les reviente un neumático;
b) cuando mucho a dos se les reviente una llanta
f(0) = (0.5)0(e –0.5 =0.607 f(1) = (0.5)x(0.607 =0.304f(2) = (0.5)x(0.607 = 0.076
0! 1! 2!
a) 1 –(0.607 + 0.304) = 0.089
b) 0.607 + 0.304 +0.076= 0.987
DISTRIBUCIÓN DE POISSON ( parámetro ()
La distribución de Poisson tiene, muchas aplicaciones importantes que no tienen relación
directa con la distribución Binomial. En este caso n p se sustituye por el parámetro ( (letra lambda
griega minúscula)y se calcula la probabilidad de lograr x “aciertos” por medio de la fórmula
Donde ( se interpreta como el número esperado, o promedio, de aciertos. Esta fórmula se aplica
a muchas situaciones donde se puede esperar un número fijo de “aciertos” por unidad de tiempo
EJEMPLO
1).- El[26] número de llamadas telefónicas que entran a una central de edificio de oficinas es de
4 por minuto, en promedio
a) Calcular la probabilidad de que no lleguen llamadas en un determinado período de un
minuto
b) Calcular la probabilidad de que por lo menos lleguen 2 llamadas en un período de un
minuto
c) Calcular la probabilidad de que por lo menos lleguen 2 llamadas en un período de dos
minutos
a).- ( = 4 P(x = 0) = P(0)

b)P (x ( 2) = 1 –p(x = 1) = 1 –f(1) = 1 - 0.092 = 0.0908
c) ( = 2(4) = 8 P(x ( 2) = 1 – f(1) = 1 – 0.003 = 0.997
2).- El número de lesiones menores que se puede esperar presente un entrenador de fútbol durante el
curso de un juego es una variable aleatoria que tiene la distribución de Poisson con ( = 4.4. Calcule la
probabilidad de que durante el curso de un juego ese haya cuando menos 3 lesiones menores.
Respuesta:0.020
-----------------------
[1] por “William J. Stevens”,
[2] “ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA” por William J. Stevenson, Editorial Harla.
[3] “ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & David S. Rubin, Sexta edición,
editorial Prentice
[4] “ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA” por William J. Stevens, Editorial Harla.
[5] “Curso práctico de estadística” por Lincoyan Portus Govinden. Editorial McGrawHill
[6] “ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA” por William J. Stevens, Editorial Harla.
[7] “ El libro de la Estadística Moderna” por Helmut Swoboda, ediciones Omega, S.A. Casanova. 220-
Barcelona
[8] “ESTADÍSTICA PARA NEGOCIOS” John E. Hanke / Arthur G. Reitsch McGrawHill
[9] “ESTADÍSTICA PARA NEGOCIOS” John E. Hanke / Arthur G. Reitsch McGrawHill
[10] “Estadística para Administradores” por Richard Levin/David Rubin, ; Prentice Hall
[11] Percentil: Con respecto a una escala de cien, valor que indica el porcentaje de una distribución que
es igual o menor que dicho valor.
[12] El símbolo (, en el ámbito de las matemáticas, se le conoce como sumatoria. En este caso significa
la suma de todos los productos de f por x
[13] El símbolo Xw se lee x testada sub w. La letra w se conoce como subíndices y sirve par recordar
que no se trata de una media pesada, de acuerdo con la importancia relativa de los valores de x.
13 “ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & S. Rubin. Prentice Hall
[14] “ Estadística para Administración y economía” por William J. Stevenson, editorial Harla
[15]“ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & S. Rubin. Prentice Hall
[16]“ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & S. Rubin. Prentice Hall
[17] “EL LIBRO DE LA ESTADÍSTICA MODERNA” por Helmut Swoboda, editorial. Ediciones Omega
[18] “EL LIBRO DE LA ESTADÍSTICA MODERNA” por Helmut Swoboda, editorial. Ediciones Omega
[19] “ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & S. Rubin. Prentice Hall
[20] “ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA”, por William J. Stevenson, Harla
[21]
Estadística General aplicada por Fadil H. Zuwaulyf
[22] “Probabilidad y Estadística para Ingeniería” pag 72 por Scheaffer McClave

[23] “Estadística” por Jhon E Freund /Richard Manning Smith
[24] Pag. 104 Ejercicio 3.53 “Probabilidad y Estadística para Ingeniería” por Scheaffer McClave
-----------------------
[pic]
En ocasiones, la barras se colocan juntas para comparar dos variables para dos períodos distintos. Este
diagrama de barras indica la forma en que contestaron 1997 adultos a las preguntas relativas a la
reglamentación gubernamental de las líneas aéreas. A veces, por razones de espacio, las barras se
encuentran en posición horizontal.
Ejemplo:
COLORES FAVORITOS
Color Frecuencia Frec.Rel Grados
Rojo 12 0.375 135º
Verde 8 0.25 90º
Azul 8 0.25 90º
Amarillo 4 0.125 45º
32 1.000 360º
M.G, = n producto de todos los valores de x
M.G, = n 1.679965 = n 1.1093( factor de

crecimiento
--
M.G, = n 1.07 ( 1.08 ( 1.10 ( 1.12 ( 1.18
( = (2 = ( ( x - ()2 = ( x2 - (2 =
N N
--
( = (2 = 0.034 = 0.058%
--
s = s2 = ( f( x - ()2 = (f x2 - (2 =
N N
--
( = (2 = 66800 = 258.5 ( desviación estándar

--
s = s2 = ( ( x - x)2 = ( x2 - nx2 =
n-1 n-1 n-1
--
s = s2 = 144888 = 380.64(desviación estándar de la muestra

--
10
= 10! = 10.9.8 = 120
3 3!(10 – 3 )! 3.2
n
= n .
r r!(n – r )!
10
= 10! = 10.9.8 = 120
3 3!(10 – 3 )! 3.2
A1 P(B/A1) B
P(A1)(P(B/A1)
P(A1) A2 B
P(B/A2) P(A2)(P(B/A2)
P(A2)
P(Ak)
Ak A
P(B/Ak) P(Ak)(P(B/Ak)
(1 P(D/(1) = 0.10 D
P((1 ( D)= 0.20(0.10 = 0.0200
P((1)=0.20
(2 D
P((2) = 0.30 P(D/(2) = 0.15 P((2 ( D)= 0.30 ( 0.15 =0.0450
P((3) = 0.50
(3 D
P(D/(3) =0.25 P((3 ( D)=0.50 (0.25=0.1250
P(D) = 0.1900
n
f(x) = px(1 - p)n-x para x = 0,1,2,...,o n
x
10
f(2) = (0.40)2(0.60)8 =0.121
2
10
f(1) = (0.40)1(0.60)9 =0.010
1
10
f(0) = (0.40)0(0.60)10 =0.006
0
10
f(9) = (0.40)9(0.60)1 =0.006
9
10
f(8) = (0.40)8(0.60)2 =0.006
8
10
f(7) = (0.40)7(0.60)3 =0.006
7
10
f(6) = (0.40)6(0.60)4 =0.006
6
10
f(5) = (0.40)5(0.60)5 =0.201
5
10
f(4) = (0.40)4(0.60)6 =0.251
4
10
f(3) = (0.40)3(0.60)7=0.215
3
(x) = (x(e -( para x = 0,1,2,...,o n

x!
P(0) = 40(e -4= 0.0183

0!
f(1) = 81(e -8= 0.003

1!
f(1) = 41(e -4= 0.092

1!

Pasos Estadistica

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Pasos Estadistica

Uploaded by

Copyright:

Available Formats

1 Estadística I

[1] La estadística comprende la rama descriptiva, la teoría de la probabilidad y el muestreo

[2]LOS MÉTODOS ESTADÍSTICOS comprenden el análisis e interpretación de números, ventas

[3]PRUEBA PARA DATOS

DIFERENCIA ENTRE MUESTRA Y POBLACIÓN

PATRON SIGNIFICATIVO DE DATOS

[4]Una distribución de frecuencia es un método de clasificación de datos en clases o intervalos,

ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS CONTINUOS

[5]Utilizando los datos del cuadro anterior tenemos:

Rango 162 – 125 = 37

[6]ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS DISCRETOS

DISTRIBUCIÓN DE FRECUENCIAS DATOS DISCRETOS

ELABORACIÓN DE UNA DISTRIBUCIÓN DE FRECUENCIAS ACUMULADA

DISTRIBUCIÓN DE FRECUENCIAS ACUMULADA

VENTA DE GASEOSAS EN UN DÍA

La representación de datos jerarquizados es bastante semejante. Consideremos los datos del

CALIFICACCIONES DEL CURSO

| |Mala |Regular |Promedio |Buena |Excelente |Totales |

Histograma y Polígonos de Frecuencia

HISTOGRAMA.- Con escala de intervalos o de razón. Se dibujan las categorías o clases a lo

DISTRIBUCIÓN DE FRECUENCIAS DATOS CONTÍNUOS

Diagrama de Tallo y Hoja

CLIENTES POR DÍA DE LA TINTORERIA The Wash Tub

Calculamos la media de esta muestra de 7 estudiantes de la manera siguiente:

Cálculo de la Media para datos agrupados.

|Cálculo |Clase(dólares) |Puntos Medios (X) | |Frecuencia | |Frecuencia

x = ((f ( x) = 85 350 = 142.25( Media de la muestra ( dólares )

En nuestra muestra de 600 clientes, el saldo mensual es de 142.25 dólares.

| | | |Horas de trabajo |invertido |

Cálculo de la Media Pesada

Xw = ((w ( x) = ( 1/8 ( $5) + ( 2/8 ( $7) + ( 5/8 ( $9) = $ 8 = $8.00/ hora

13La Media geométrica

En ocasiones trabajamos con cantidades que cambian en un cierto periodo, necesitamos

| |Año |Tasa de |Factor de |Ahorros al |

Cálculo de la Media geométrica

Aplicando al problema tenemos:

[14]Cálculo de la Mediana a partir de datos no agrupados

El procedimiento para obtener la mediana es como sigue:

1. Ordenar o clasificar valores.

[15]Cálculo de la Mediana a partir de datos agrupados

| |Clase en |Frec. |Frec. |Frec. |Frec. Rel. | |

Utilizando la ecuación tenemos:

m = ( (601)/2 – ( 202) ( $50 + $100

Cálculo de la Moda a partir de datos no agrupados

[16]Cálculo de la Moda a partir de datos agrupados

Cuando los datos ya se encuentran agrupados en una distribución de frecuencias, podemos

| |Clase en |Frec. |Frec. |Frec. |Frec. Rel. | |

Utilizando la ecuación tenemos:

Moda de la muestra ( Mo = LMo + ( d1 ( w.

La Media, la Mediana y la Moda

[19]DISPERSIÓN: MEDIDAS DE DESVIACIÓN PROMEDIO

Es conveniente considerar cuatro variables de dispersión: la amplitud de variación, la desviación

La amplitud de variación de un grupo de números es generalmente la medida más sencilla de

Números Diferencia Del más bajo al más alto

Desviación Estándar de la población

La desviación estándar de la población o (, es simplemente la raíz cuadrada de la varianza de la

Cálculo de la Varianza y la desviación estándar a partir de datos no agrupados

PORCENTAJE DE IMPUREZA OBSERVADO

| |Observación | |Media | |Desviación |Desviación |Observación |

X = ( (f ( x) = 125000 = 1250( media (2 = (f ( x - ()2 = 6680000 = 6680000( varianza

Desviación Estándar de la muestra

x = valor de cada una de las n observaciones

| |Observación | |Media | |Desviación |Desviación |Observación |