Professional Documents
Culture Documents
2 BIBLIOGRAFÍA
TEXTO BASE
“ESTADÍSTICA APLICADA A LA EMPRESA Y A LA ECONOMÍA” por Allen Webster Editorial Mac
Graw Hill
TEXTOS COMPLEMENTARIOS
“ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA” por William J. Stevenson, Editorial Harla.
“ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & David S. Rubin, Sexta edición,
editorial Prentice Hall
2 ESTADÍSTICA
DATOS ESTADÍSTICOS
TIPOS DE DATOS
Casi siempre, seleccionar el procedimiento que se habrá de utilizar para analizar o describir
datos estadísticos depende de que tipo sean. Son de 4 tipos: CONTINUOS, DISCRETOS, NOMINALES
y JERARQUIZADOS.
Las variables que pueden asumir virtualmente cualquier valor en determinado intervalo de
valores se conocen como continuas. Características tales como altura, peso, etc., quedan dentro de
esta categoría. Los datos que se toman acerca de estas características y otras semejantes se
denominan continuos, aún cuando, en términos prácticos, los instrumentos de medición presentan
ciertas limitaciones de tipo físico que restringen el grado de precisión. Como ejemplos de datos
continuos tenemos: la cantidad de café que se vende por día, la gasolina que se expende por hora.
Una variable discreta es la que puede asumir sólo ciertos valores, por lo regular, enteros. Los
datos discretos surgen al contar el número de conceptos que poseen cierta característica, ejemplos de
datos discretos son el número de clientes por día, los accidentes de trabajo, etc.
Tanto los datos discretos como los continuos se conocen como datos cuantitativos ya que son
inherentemente numéricos. Es decir ciertos valores numéricos se relacionan de manera natural con las
variables que se miden. Por otra parte, los dos tipos restantes de datos nominales y jerarquizados
comprenden variables que no son inherentemente numéricas. A estas se les llama cualitativas, y se
deben convertir a valores numéricos antes de que se trabaje con ellas.
Las variables nominales comprenden categorías, como el sexo (masculino o femenino), el color
de ojos (azul, castaño, negro, verde), campo de estudios (medicina, derecho, administración, biología,
ingeniería), calificaciones (excelente, bueno, regular, malo)etc. Ninguna de las características anteriores
es numérica por naturaleza. Sin embargo, cuando se aplican, ya sea a una población o a una muestra,
es posible asignar cada individuo a una categoría (por ejemplo, el campo de estudios es administración
de empresas), y contar luego el número que queda en cada una de ellas (por ejemplo, 15 estudiantes).
Otro tipo de variable cuantitativa es la que comúnmente se refiere a las evaluaciones subjetivas
cuando los conceptos se jerarquizan según la preferencia o logro. Por ejemplo, en concursos de cocina,
belleza, florería y caninos, los lugares se jerarquizan en primero, segundo, tercero, etc. De igual
manera, a las posiciones de los equipos se les asignan los números 1,2,3,.. Por otra parte, los signos +
y – se pueden utilizar para designar mejoramiento o deficiencia (por ejemplo, el desarrollo de cierto
conocimiento después de tomar un curso de él). Si bien es posible considerar la variable subyacente en
cada uno de estos casos como continua, no obstante, empleamos arbitrariamente a los enteros a,2,3,...
(es decir, rangos) ya sea por conveniencia o por la falta de un método más científico.
Es interesante observar que muchas poblaciones pueden proporcionar los cuatro tipos de datos.
Por ejemplo, una carga de cierta mercancía se puede clasificar en una de dos categorías (dicotómicas):
aceptable o no aceptable. O bien, mercancía se puede jerarquizar de acuerdo con algún plan, como
buena, superior o excelente (tres o más categorías). Ambas clasificaciones producen datos discretos. Si
lo importante, por ejemplo tratándose de carne, es la cantidad de grasa por kilogramo, el peso
promedio de la mitad de una res, o la proporción entre grasa y carne, entonces los datos serán
continuos. Otro ejemplo de cómo los datos pueden asumir diferentes características se presenta en la
siguiente tabla:
LA MISMA POBLACIÓN PUEDE DAR ORIGEN A DIFERENTES TIPOS DE DATOS
TIPOS DE DATOS
|POBLACIÓN |CONTINUOS |DISCRETOS |NOMINALES |JERARQUIZADOS
POR RANGOS |
|Clase de tercer |Edades, pesos |No, en el grupo |Niños/ niñas |3er grado |
|grado | | | | |
|Automóviles |Kph, hpl |No, de defectos por|Colores |Más sucio |
| | |auto | | |
|Ventas de bienes |Valor en $ |No, de ofertas |sobrevaluado |Más claro |
|raíces | | | | |
Una colección de datos se conoce como conjunto de datos, y una sola observación es un punto
de dato.
¿Cómo podemos ordenar los datos?
RECOLECCIÓN DE DATOS
Hay que seleccionar las observaciones de manera que todos los grupos relevantes estén
representados en los datos. Los datos pueden prevenir de observaciones reales o de registros que se
mantienen para otros propósitos. Los datos pueden ayudar a los responsables de tomar decisiones a
hacer suposiciones bien pensadas acerca de las causas y por lo tanto de los efectos probables de
ciertas características en situaciones dadas. También el conocimiento de tendencias adquirido de la
experiencia previa puede permitir a los ciudadanos que les interesa estar al tanto de posibles resultados
y actuar en consecuencia.
Cuando los datos son ordenados de manera compacta y útil los responsables de tomar
decisiones pueden obtener información confiable sobre el ambiente y usarla para tomar decisiones
inteligentes.
1. ¿De donde vienen los datos?. ¿La fuente es parcial?, es decir,¿ es posible que haya un interés en
proporcionar datos que conduzcan a una cierta conclusión más que a otras?
2. ¿Los datos comprueban o contradicen otras evidencias que se poseen?
3. ¿Hace falta alguna evidencia cuya ausencia pueda ocasionar que se llegue a una conclusión
diferente?
4. ¿Cuántas observaciones se tienen?¿ representan a todos los grupos que se desea estudiar?
5. ¿La conclusión es lógica?¿ Se ha legado a conclusiones que nuestros datos no confirman?
Una población es un todo y una muestra es una fracción o segmento de ese todo. Las muestras
las estudiamos con el fin de ser capaces de describir poblaciones. El estudio de las muestras es más
sencillo que el estudio de la población completa, más barato, menos tiempo.
Una población es un conjunto de todos los elementos del asunto que estamos estudiando,
acerca de los cuales intentamos sacar conclusiones.
Existen muchas formas de organizar los datos. Podemos colectarlos y mantenerlos en orden.
Una forma común de organizar los datos es dividirlos en categorías o clases parecidas y luego contar el
número de observaciones que quedan dentro de cada categoría.
DISTRIBUCIONES DE FRECUENCIAS
Seleccionamos 8 como número de clases (mayor que 5 y menor que 15). Para la anchura del
intervalo de clase tenemos . i = 37 ( 8 = 4,6(i = 5; si consideramos que 8(5=40, quiere decir que hay un
exceso de 3 sobre el rango verdadero, entonces lo distribuimos quitando 1 al límite inferior( 125 – 1 =
124) y aumentando 2 al límite superior( 162+2=164).
Formamos los intervalos de clase de la siguiente manera : el primero ( 124, 125, 126, 127, 128; total 5
amplitud, el segundo de 129 a 133 y así sucesivamente hasta el octavo que será 159-163.
Encontramos los límites reales, o sea la mediana o punto medio entre el límite superior de una clase y
el inferior de la siguiente. Limites reales: 123.5, 128.5,133.5,...,163.5; luego observamos si hay
ambigüedad o no en los límites.
Contamos las frecuencias que caen en cada intervalo de clase y elaboramos primero la tabla de
conteo y luego el cuadro correspondiente a la distribución
TABLA DE CONTEO
CLASE MARCAS CONTEO
123.5 – 128.5 ( 1
128.5 – 133.5 (((( 4
133.5 – 138.5 ((((((((( 9
138.5 – 143.5 (((((((((((((((((((((((( 24
143.5 – 148.5 ((((((((((((((((((((((((((((( 29
148.5 – 153.5 (((((((((((((((((((((( 22
153.5 – 158.5 (((((((((((((( 14
158.5 – 163.5 ((((( 5
TOTAL 108
DISTRIBUCIÓN DE FRECUENCIAS DATOS CONTÍNUOS
CLASE FRECUENCIA PORCENTAJE DE ALUMNOS
123.5 – 128.5 1 1/108 =0.00925 ( 0.93%
128.5 – 133.5 4 4/108 =0.03703 ( 3.703%
133.5 – 138.5 9 9/108 =0.08333 ( 8.333%
138.5 – 143.5 24 24/108 =0.22222 (22.222%
143.5 – 148.5 29 29/108 =0.26851 (26.851%
148.5 – 153.5 22 22/108 =0.20370 (20.370%
153.5 – 158.5 14 14/108 =0.12962 (12.962%
158.5 – 163.5 5 5/108 = 0.04629 (4.629%
TOTAL 108 1.00 ( 100%
FRECUENCIAS RELATIVAS
Las frecuencias relativas o porcentajes, para una distribución de frecuencias se calculan
dividiendo cada frecuencia para el número total de objetos clasificados. En el ejemplo anterior están en
la tercera columna(Porcentaje de alumnos)
Se puede elaborar una distribución de frecuencias con clases 0-1,2-3,4-5,6-7,8-9. El resultado es una
distribución igual a la que se utiliza para datos continuos.
Quizá las distribuciones de frecuencias más fáciles que sean las que se utilizan para datos
nominales y jerarquizados. Esta simplicidad radica en el hecho en que las clases se ponen de
manifiesto con más facilidad, de modo que los cálculos son mínimos. En la siguiente distribución en la
que se analizan las ventas de gaseosas, observamos que las categorías son los diversas sabores de
las gaseosas, la última categoría, varios, son aquellos sabores que se venden poco como: fresa,
tamarindo y toronja se agrupan en una sola categoría para simplificar la comprensión de los datos:
DIAGRAMAS Y GRÁFICAS
Las distribuciones de frecuencias constituyen un mundo ideal para representar los aspectos
esenciales de un conjunto de datos en términos entendibles y concisos, aún así los dibujos pueden ser
más efectivos para desplegar grandes conjuntos de datos
Los diagramas y gráficas más sencillos en su construcción están diseñados para datos
nominales u ordinales. Como los datos constituyen categorías, las clases son obvias y es fácil
describirlas en una gráfica.
[7]Diagrama pastel
Es una forma efectiva de desplegar los porcentajes en que se dividen los datos. Se usan mucho
en los presupuestos y la información económica. Se utilizan considerando que el círculo completo tiene
un área que equivale al 100%; un sector representa un tanto por ciento equivalente a la razón entre el
ángulo que forman los radios que limitan al sector y 360º que son el total de los grados de la
circunferencia.
[8]Ejemplos:
[pic]
La compañía Brite Paint pidió a varias personas que indicaran sus colores favoritos. La
tabulación de los resultados que están en la siguiente tabla muestra que 12 personas indicaron que el
rojo era su color favorito, 8 escogieron el verde, 8 escogieron el azul y 4 el amarillo 8 (datos nominales).
Esta tabulación representa una distribución de frecuencias porque enumera varias categorías (colores)
junto con el número de veces (frecuencia) que se seleccionaron cada una. A menos que exista algún
orden predeterminado, las categorías se enumeran en orden de magnitud: la categoría con la frecuencia
mayor se enumera primero, y así sucesivamente
El número total de personas se divide según el número de personas que eligieron cada color, las
frecuencias relativas que resultan son: 12/32=0.375; 8/32= 0.25; 8/32 0 0.25; 4/32 = 0.125. como el
37.5% de 360º [(0.375)(360)]= 135º. Las restantes longitudes de arco se calculan de forma similar, se
redondean los porcentajes
Diagrama de Barras
Con escala nominal u ordinal. Cada barra representa la frecuencia de una categoría. La altura de
la barra es proporcional al número de elementos de cada categoría. En general las barras se ponen en
posición vertical con la base en el eje horizontal de la gráfica. Las barras se separan ya ello se debe que
se utilice con tanta frecuencia para datos nominales y ordinales, la separación pone de manifiesto que
se están dibujando frecuencias de categorías distintas.
[9]Diagrama de Pareto
Es un diagrama que se usa para identificar y jerarquizar problemas. Se usa con frecuencia en
control de calidad. Consiste en barras que describen las componentes de una línea de producción o de
montaje. La altura de cada barra representa el número de ocurrencias de cada problema, de manera
que el diagrama muestra la gravedad del problema de calidad para cada variable medida
Ejemplo:
El siguiente gráfico representa los problemas más importantes de control de calidad de asientos
especiales para camiones. El diagrama de Pareto puede incluir también una segunda escala, encima de
las barras de las categorías, que muestran los porcentajes acumulados de las variables medidas.
Ejemplo:
El siguiente gráfico representa el ejemplo desarrollado de las estaturas de los alumnos analizadas
por el preparador físico
POLÍGONOS DE FRECUENCIA.- se marcan las frecuencias sobre el eje vertical y los valores de la
variable que se está midiendo en el eje horizontal. Se representa la frecuencia de cada clase dibujando
un
punto medio de la clase dibujando un punto medio de la clase y se conectan los puntos sucesivos con
líneas rectas para formar el polígono. En los extremos de la escala horizontal se agregan 2 nuevas
clases con frecuencia cero. Esto permite que el polígono llegue al eje horizontal en los extremos de la
distribución.
Es una alternativa de mostrar datos. Es similar al histograma, aunque se muestran los datos
reales en lugar de barras
Ejemplo:
Kyle Chang, el dueño de la tintorería The Wash, quiere saber el número de órdenes de trabajo
que se procesan al día. Se elige una muestra aleatoria de días de estudio. A continuación los datos,
Kyle quiere usar estos datos para entender el patrón que sigue su carga de clientes.
Ejemplo:
En la siguiente distribución de frecuencias del saldo promedio mensual de la cuenta de cheques
de 600 clientes de una sucursal bancaria.
|Saldos promedio |Clase(dólares) |Frecuencia |
|mensuales de 600 |0 – 49.99 |78 |
|cuentas de |50.00 – 99.99 |123 |
|cheques |100.00 – 149.00 |187 |
| |150.00 – 199.99 |82 |
| |200.00 – 249.99 |51 |
| |250.00 – 299.99 |47 |
| |300.00 – 349.99 |13 |
| |350.00 – 399.99 |9 |
| |400.00 – 449.99 |6 |
| |450.00 – 499.99 | 4 .|
| | |600 |
A partir de la información de la tabla podemos calcular fácilmente una estimación del valor de la
media de estos datos agrupados. Es una estimación debido a que no utilizamos el total de las 600
puntos dados de la muestra.
La Media Pesada
La media pesada (Ponderada) nos permite calcular el promedio que toma en cuenta la
importancia de cada valor con respecto al total. En la siguiente distribución una compañía utiliza tres
niveles de trabajo, no calificado, semicalificado y calificado, para la producción de 2 de sus productos
finales. La compañía desea saber el promedio del costo de trabajo por hora par cada uno de los
productos.
Los promedios pesados dan el valor correcto para los costos promedio por hora de trabajo para los
dos productos, ya que toman en cuenta las diferentes cantidades de cada nivel de trabajo que se utiliza
en la elaboración de los productos. Usando símbolos, la fórmula para calcular el promedio pesado es:
Xw = ((w ( x)
(w
en donde:
Xw = símbolo para la media pesada[13]
W = peso asignado a cada observación ( 1/8, 2/8 y 5/8) para le producto 1, 4/10, 3/10 y 3/10 para el
producto 2 del ejemplo
((w ( x) = la suma de los productos del peso de cada elemento por el elemento correspondiente
( w = suma de todos los pesos
Si aplicamos la ecuación tenemos:
Por ejemplo considere el crecimiento de una cuenta de ahorros. Suponga que depositamos $100
inicialmente y dejamos que acumule interés a diferentes tasas durante 5 años, como lo expresa la
siguiente distribución:
Para encontrar el factor de crecimiento promedio correcto podemos multiplicar los factores de
crecimiento de los 5 años y luego tomar la raíz quinta del producto (es decir encontrar un número que al
multiplicarse cuatro veces por sí mismo dé como resultado el producto con el que empezamos). El
resultado es el factor de crecimiento como media geométrica, que es el promedio adecuado que
debemos utilizar. La fórmula para encontrar la media geométrica de una serie de números es:
La Mediana
La mediana es solo un valor calculado a partir del conjunto de datos que mide la observación
central de estos
Ejemplo
En el ejemplo de los saldos mensuales promedio de las cuentas de 600 clientes, no podemos
calcular la mediana del saldo de cuentas, determinando cuál de los diez intervalos de clase contiene a
la mediana, debemos calcular en que intervalo estará al acumular las frecuencias, la hallamos en
600(2=300 y aplicamos la fórmula.
La Moda
La moda es una medida de tendencia central diferente de la media, pero un tanto parecida a la
mediana. La moda es aquel valor que más se repite en el conjunto de datos
El azar puede desempeñar un papel importante en la organización de los datos, en ocasiones el azar
hace que un valor se repita lo suficiente para ser el valor más frecuente del conjunto de datos.
Ejemplo
VIAJES ORGANIZADOS EN ORDEN ASCENDENTE
|Viajes por |0 |2 |5 |7 |15 |( |
|Entrega por un |0 |2 |5 |7 |15 |((moda |
|día en un |1 |4 |6 |8 |15 |( |
|Período de |1 |4 |6 |12 |19 | |
|20 días | | | | | | |
En el ejemplo, presentamos el número de viajes de entrega por día que hace una planta
revolvedora de concreto. El valor modal es 15, ya que se presenta más a menudo que cualquier otro
valor (tres veces). La moda nos dice que 15 es el número más frecuente de viajes, pero no nos dice que
la mayor cantidad de viajes está por debajo de 10.
Ejemplo
En el ejemplo de los saldos mensuales promedio de las cuentas de 600 clientes, la moda del
saldo de las cuentas de cheques entonces LMo = $100; d1 =187 – 123 = 64 ; d2 = 187 – 82 = 105 y
w=$50
[18]De lo que hemos aprendido sobre los promedios, hay algo que cada vez ha ido apareciendo
más claramente. Los valores medios (y sobretodo la media aritmética tantas veces utilizada) necesitan
de una segunda medida si queremos valorarlos correctamente en su significado y fuerza de afirmación.
El modo más fácil de completar la información es indicar cuan lejos se hallan los extremos de
ella. Ya que la estadística conoce “ la amplitud del intervalo”, ha ideado una medida mejor que junto
con la media haga posible tener una buena idea de la distribución de los valores alrededor de la misma.
Es la llamada Desviación típica, la medida de la dispersión.
Amplitud de variación
Ejemplo
A continuación se dan algunos ejemplos;
AMPLITUD DE VARIACIÓN
[21]
Las descripciones más comprensivas de la dispersión son aquellas que tratan con la desviación
promedio con respecto a alguna medida de tendencia central. Dos de tales medidas son importantes
para nuestro estudio: la variancia y la desviación estándar. Ambas medidas nos dan una distancia
promedio de cualquier observación del conjunto de datos con respecto a la media de la distribución.
Varianza de la población
Cada población tiene una varianza, que se simboliza con (2 (sigma cuadrada). Para calcular la
varianza de la población usamos la siguiente fórmula
(2 = ( ( x - ()2 = ( x2 - (2 =
N N
En la que:
(2 = varianza de la población
x = elemento u observación
( = media de la población
N = número total de elementos de la población
( = suma de todos los valores (x - ()2, o todos los valores de x2
Ejemplo
Si tenemos una muestra de un compuesto producido en un día y probamos cada frasco para
determina la pureza del compuesto obtendríamos los datos que están en la tabla siguiente:
Para calcular la desviación estándar de una muestra, utilizamos las mismas fórmulas que en la
población pero cambiamos ( por x y N con n-1:
s2 = ( ( x - x)2 = ( x2 - nx2 =
n-1 n-1 n-1
s2 = varianza de la muestra
Ejemplo
En la siguiente tabla se muestran los donativos anuales de Blue Cross-Blue Shield al Hospital de
Cumberland:
PROBABILIDADES
EXPERIMENTO.- Es el proceso de efectuar una observación. (lanzar un dado una o varias veces y
reunir los datos sobre los resultados posibles)
ESPACIO MUESTRAL.- Es un conjunto que corresponde a todos los resultados posibles de un
experimento listados de modo completo y mutuamente excluyente (cualquier experimento puede
originar varios resultados posibles, el conjunto de todos ellos se llama Espacio Muestral).
EVENTO.- Es cualquier subconjunto de un espacio muestral.
PROBABILIDAD
De la definición elemental de probabilidad tenemos que si n es el número de ensayos de un
e4xperimento, como por ejemplo el número de lanzamientos de una moneda parece que entonces se
podría definir la probabilidad de un evento E, mediante:
P(E) = l i m número de veces que sucede E
n(( n
Pero el problema es establecer si converge siempre este límite por esto necesitamos una
definición formal de Probabilidad:
EJEMPLO[pic]
Supóngase que un experimento tiene asociado un espacio muestral S. Una probabilidad es una
función de valor numérica que asigna un número P(A) a cada evento A de tal manera que son válidos
las siguientes axiomas:
1) P(A)(0
2) P(S) = 1
3) Si A1, A2,..., es una sucesión de eventos mutuamente excluyentes, es decir Ai, Aj = ( para toda i(j,
entonces, (
P( ( Ai ) 0 ( P( Ai )
i=1
De acuerdo a lo anterior A y B son eventos mutuamente excluyentes
P(A(B) = P(A) + P(B)
Si lanzamos un dado normal cada uno de las caras tiene la misma probabilidad de ocurrir o sea
que son equiprobables. Se asigna 1/6 a cada uno de esos 6 elementos de S.
P(E) = 1/6 i = 1.2.3..6 E2 será un 2 E4 será un 4 E6 será un 6
P(A) = P(E2)+P(E4)+P(E6) = 1/6+1/6+1/6= ½
Los términos al AZAR y ALEATORIO se interpretan como una imposición de probabilidades iguales al
número finito de puntos en el espacio muestral.
Con frecuencia, las probabilidades que se asignan a los eventos se basan en evidencia
experimental o en estudios de observación, que producen datos de frecuencia relativa para los
eventos de interés. Los datos sólo dan aproximaciones a las verdaderas probabilidades pero
bastantes buenas.
EJEMPLO
[pic]
Si consideramos
P(A) = número de resultados favorables a A
Número total de resultados equiprobables
Esta definición funcionará con espacio muestral finito con resultados equiprobables.
1 REGLA DE LA SUMA
P(A/B) = P(A(B)
P(B)
EJEMPLO
Los registros de policía muestran que en cierta ciudad la probabilidad es 0.35 de que se capture a
un ladrón y 0.14 de que se capture y condene el ladrón. ¿Cuál es la probabilidad de que un
ladrón, si es capturado, será condenado?
A = evento un ladrón sea condenado
B = evento que un ladrón sea capturado
P(B)= 0.35
P(A(B) = 0.14
P(A/B) = P(A(B) = 0.14 = 0.40
P(B) 0.35
EVENTOS INDEPENDIENTES
El evento A es independiente de el evento B si la probabilidad del evento A no se ve afectada
por la incidencia o no incidencia de A
Si los eventos A y B no son independientes, se dice que son dependientes
EJEMPLO
Se tiene una urna con 7 bolas rojas y 3 negras. Si se extraen 2 bolas una a continuación
de otra, ¿cuál es la probabilidad de que sea roja la primera y roja la segunda?
a)Hay reposición
P(R1(R2), debe ocurrir los dos eventos
P(R1yR2)= P(R1)P(R2) = 7/10(7/10 = 49/100
Son independientes porque hay reposición
b) no hay reposición
P(R1yR2)= P(R1)P(R2 / R1)=7/10(6/9 = 42/90
Son dependientes, entonces la posibilidad de que ocurra R2 dado que ocurrirá R1 es 6/9
3 REGLA DE MULTIPLICACIÓN
2 COMBINACIONES
[pic]
4 TEOREMA DE BAYES
DEFINICIÓN.- Sean A1,A2...,Ak sucesos mutuamente excluyentes que ocupan todo el espacio
muestral (. Si cada uno de estos sucesos tiene probabilidad no nula y uno de ellos debe ocurrir,
entonces para cada suceso B en el espacio muestral ( .
P(A1/B) = P(A1) P(B/ A1) .
P(A1) P(B/ A1) + P(A2) P(B/ A2) + . . . . . . . . + P(AK) P(B/ AK)
P(A2/B) = P(A2) P(B/ A2) .
P(A1) P(B/ A1) + P(A2) P(B/ A2) + . . . . . . . . + P(AK) P(B/ AK)
Y finalmente
P(Ak/B) = P(Ak) P(B/ Ak) .
P(A1) P(B/ A1) + P(A2) P(B/ A2) + . . . . . . . . + P(AK) P(B/ AK)
Para i = 1,2,. . . . , o bien k
EJEMPLOS
a) Un[22][23] fabricante está considerando comprar un lote del 10 000 piezas de un proveedor.
El fabricante estima la proporción de piezas defectuosas en el lote en la forma siguiente:
|Proporción de piezas |Probabilidad |
|defectuosas |P(x) |
|(1 = 0.10 |P((1 )= 0.210 |
|(2 = 0.15 |P((2 )= 0.30 |
|(3 = 0.25 |P((3 )= 0.50 |
b) Todas las noches el señor Herrera llega tarde a su casa. La señora Herrera, que es una buena
esposa, le deja encendida la luz de la entrada a la casa. La probabilidad de que el señor Herrera
llegue borracho es 0,60. Si llega borracho, hay una probabilidad de 0,90 de que olvide apagar la luz
en tanto que ésta solo de 0.05 si llega sobrio.
a) ¿Cuál es la probabilidad de que el señor Herrera apague la luz en una noche cualquiera?
b) Dado que el señor Herrera apagó la luz una cierta noche, ¿cuál es la probabilidad de que haya
llegado borracho?
Las variables aleatorias discretas sólo pueden tomar un número de valores finito. Cuando una
variable puede tomar un conjunto discreto de valores. Las variables aleatorias suelen clasificarse de
acuerdo con el número de valores que pueden asumir.
Una distribución de probabilidades es una correspondencia que asigna probabilidades a sus
valores.
La tabla del ejemplo que sigue sirve para ilustrar lo que significa la Distribución de
Probabilidad de una variable aleatoria
Se construye una tabla donde se muestra las probabilidades de obtener la suma de dos los
puntos obtenidos en el lanzamiento de dos dados.
ESPERANZA MATEMÁTICA
El valor esperado de una variable discreta X que tiene una función p(x) de probabilidad está
dada p[24]o[25]r
E(X)=( xP(x)
(La suma es con respecto a todos los valores de x para los cuales P(x)>0.)
A veces se emplea la notación
E(X) =(
VARIANCIA
La variancia de una variable aleatoria X cuyo valor esperado es ( es
V(X) = E [(X - ()2] o V(X) = E(X2) – [E(X)]2
A veces se usa la notación
E [(X - ()2] = (2
DESVIACIÓN ESTÁNDAR.
De una variable aleatoria X es la raíz de la variancia, y está definida mediante
( = ((2 = (E[(X - ()2 ] o ( = ((2 = (E(X2) – [E(X)]2
1 DISTRIBUCIÓN BINOMIAL
Se acostumbra a decir que el número de aciertos en n ensayos es una variable aleatoria que
tiene la distribución de probabilidad Binomial o simplemente la distribución Binomial.. la distribución
Binomial recibe el nombre en virtud de que para x = 0,1,2,.,.,.,y n, los valores de las
probabilidades son los término sucesivos de la expansión Binomial de [(1 - p) + p]n.
DEFINICIÓN.- Si n es el número de intentos o ensayos, p es la probabilidad de un acierto en cada
ensayo y todos los ensayos son independientes, entonces la probabilidad de lograr x aciertos en n
ensayos es:
Una variable aleatoria X tiene una distribución Binomial si existen las cinco condiciones
siguientes:
1) El experimento consiste en un número fijo de n intentos idénticos .
2) Cada intento sólo puede tener un resultado de dos posibles, que se llaman “éxito” y ”fracaso”
3) La probabilidad p de “éxito” es constante de intento a intento
4) Los intentos son independientes
5) Se define a X como el número de éxitos en n intentos
n y p son los parámetros de la distribución Binomial
EJEMPLO
Si la probabilidad de que una pareja de divorciados se vuelva a casar dentro de 3 años es
0.40 determine las probabilidades de que de 10 parejas de divorciados.
a. cuando mucho tres se volverán a casar dentro de tres años;
b. cuando menos tres se volverán a casar dentro de tres años;
c. de dos a cinco se volverán a casar dentro de tres años;
d. cuando menos dos se volverán a casar dentro de tres años.
a) n = 10 , p = 0.40 y x = 0,1,2 y 3 ( 0.006 + 0.040 + 0.121 + 0.215 = 0.382
b) n = 10 , p = 0.40 y x = 7,8,9 y 10 ( 0.042 + 0.011 + 0.002 + 0.000 = 0.055
c) n = 10 , p = 0.40 y x = 2,3,4 y 5 ( 0.121 + 0.215 + 0.251 + 0.201 = 0.788
d) n = 10 , p = 0.40 y x = 0 y 1 son 0.006 y 0.040. por tanto , la probabilidad de que cuando
menos dos de 10 parejas de divorciados se vuelvan a casar dentro de tres años es ( 1-
(0.06+0.040) = 0.954
2 DISTRIBUCIÓN DE POISSON
Cuando n es grande y p es chica, las probabilidades binomiales a menudo se aproximan por medio
de la fórmula:
Es una forma especial de la distribución de Poisson: la utilizaremos sólo cuando n sea cuando
menos 100 y n p sea menor que 10
EJEMPLO
Los registros muestran que la probabilidad es 0.00005 de que a un automóvil se lee reviente
un neumático al cruzar cierto túnel. Emplee la aproximación de Poisson a la distribución Binomial
para determinar las probabilidades de que entre 10 000 automóviles que cruzan este túnel.
a) cuando menos a dos se les reviente un neumático;
b) cuando mucho a dos se les reviente una llanta
f(0) = (0.5)0(e –0.5 =0.607 f(1) = (0.5)x(0.607 =0.304f(2) = (0.5)x(0.607 = 0.076
0! 1! 2!
a) 1 –(0.607 + 0.304) = 0.089
b) 0.607 + 0.304 +0.076= 0.987
DISTRIBUCIÓN DE POISSON ( parámetro ()
La distribución de Poisson tiene, muchas aplicaciones importantes que no tienen relación
directa con la distribución Binomial. En este caso n p se sustituye por el parámetro ( (letra lambda
griega minúscula)y se calcula la probabilidad de lograr x “aciertos” por medio de la fórmula
Donde ( se interpreta como el número esperado, o promedio, de aciertos. Esta fórmula se aplica
a muchas situaciones donde se puede esperar un número fijo de “aciertos” por unidad de tiempo
EJEMPLO
1).- El[26] número de llamadas telefónicas que entran a una central de edificio de oficinas es de
4 por minuto, en promedio
a) Calcular la probabilidad de que no lleguen llamadas en un determinado período de un
minuto
b) Calcular la probabilidad de que por lo menos lleguen 2 llamadas en un período de un
minuto
c) Calcular la probabilidad de que por lo menos lleguen 2 llamadas en un período de dos
minutos
[3] “ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & David S. Rubin, Sexta edición,
editorial Prentice
[4] “ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA” por William J. Stevens, Editorial Harla.
[5] “Curso práctico de estadística” por Lincoyan Portus Govinden. Editorial McGrawHill
[6] “ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA” por William J. Stevens, Editorial Harla.
[7] “ El libro de la Estadística Moderna” por Helmut Swoboda, ediciones Omega, S.A. Casanova. 220-
Barcelona
[8] “ESTADÍSTICA PARA NEGOCIOS” John E. Hanke / Arthur G. Reitsch McGrawHill
[9] “ESTADÍSTICA PARA NEGOCIOS” John E. Hanke / Arthur G. Reitsch McGrawHill
[10] “Estadística para Administradores” por Richard Levin/David Rubin, ; Prentice Hall
[11] Percentil: Con respecto a una escala de cien, valor que indica el porcentaje de una distribución que
es igual o menor que dicho valor.
[12] El símbolo (, en el ámbito de las matemáticas, se le conoce como sumatoria. En este caso significa
la suma de todos los productos de f por x
[13] El símbolo Xw se lee x testada sub w. La letra w se conoce como subíndices y sirve par recordar
que no se trata de una media pesada, de acuerdo con la importancia relativa de los valores de x.
13 “ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & S. Rubin. Prentice Hall
[14] “ Estadística para Administración y economía” por William J. Stevenson, editorial Harla
[15]“ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & S. Rubin. Prentice Hall
[16]“ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & S. Rubin. Prentice Hall
[17] “EL LIBRO DE LA ESTADÍSTICA MODERNA” por Helmut Swoboda, editorial. Ediciones Omega
[18] “EL LIBRO DE LA ESTADÍSTICA MODERNA” por Helmut Swoboda, editorial. Ediciones Omega
[19] “ESTADÍSTICA PARA ADMINISTRADORES” por Richard I. Levin & S. Rubin. Prentice Hall
[20] “ESTADÍSTICA PARA ADMINISTRACIÓN Y ECONOMÍA”, por William J. Stevenson, Harla
[21]
Estadística General aplicada por Fadil H. Zuwaulyf
-----------------------
[pic]
En ocasiones, la barras se colocan juntas para comparar dos variables para dos períodos distintos. Este
diagrama de barras indica la forma en que contestaron 1997 adultos a las preguntas relativas a la
reglamentación gubernamental de las líneas aéreas. A veces, por razones de espacio, las barras se
encuentran en posición horizontal.
Ejemplo:
COLORES FAVORITOS
Color Frecuencia Frec.Rel Grados
Rojo 12 0.375 135º
Verde 8 0.25 90º
Azul 8 0.25 90º
Amarillo 4 0.125 45º
32 1.000 360º
( = (2 = ( ( x - ()2 = ( x2 - (2 =
N N
--
( = (2 = 0.034 = 0.058%
--
s = s2 = ( f( x - ()2 = (f x2 - (2 =
N N
--
s = s2 = ( ( x - x)2 = ( x2 - nx2 =
n-1 n-1 n-1
--
10
= 10! = 10.9.8 = 120
3 3!(10 – 3 )! 3.2
n
= n .
r r!(n – r )!
10
= 10! = 10.9.8 = 120
3 3!(10 – 3 )! 3.2
A1 P(B/A1) B
P(A1)(P(B/A1)
P(A1) A2 B
P(B/A2) P(A2)(P(B/A2)
P(A2)
P(Ak)
Ak A
P(B/Ak) P(Ak)(P(B/Ak)
(1 P(D/(1) = 0.10 D
P((1 ( D)= 0.20(0.10 = 0.0200
P((1)=0.20
(2 D
P((2) = 0.30 P(D/(2) = 0.15 P((2 ( D)= 0.30 ( 0.15 =0.0450
P((3) = 0.50
(3 D
P(D/(3) =0.25 P((3 ( D)=0.50 (0.25=0.1250
P(D) = 0.1900
n
f(x) = px(1 - p)n-x para x = 0,1,2,...,o n
x
10
f(2) = (0.40)2(0.60)8 =0.121
2
10
f(1) = (0.40)1(0.60)9 =0.010
1
10
f(0) = (0.40)0(0.60)10 =0.006
0
10
f(9) = (0.40)9(0.60)1 =0.006
9
10
f(8) = (0.40)8(0.60)2 =0.006
8
10
f(7) = (0.40)7(0.60)3 =0.006
7
10
f(6) = (0.40)6(0.60)4 =0.006
6
10
f(5) = (0.40)5(0.60)5 =0.201
5
10
f(4) = (0.40)4(0.60)6 =0.251
4
10
f(3) = (0.40)3(0.60)7=0.215
3