You are on page 1of 40

COLEGIO DE ESTUDIOS

CIENTÍFICOS y TECNOLÓGICOS
DEL ESTADO DE HIDALGO



















Probabilidad y Estadística




















AGOSTO 2012 ING. ANTONIO TORRES MARTÍNEZ
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 2 Ing. Antonio Torres Martínez












































































Programa de estudio

PROBABILIDAD
Teorías de conjuntos Técnicas de conteo Probabilidad para eventos
Operación con conjuntos
Diagrama de Venn
Teorema del binomio
Diagrama de árbol
Eventos complementarios
Conceptos básicos
Principio de la suma y la
multiplicación
Permutación
Combinación
Probabilidad condicional
Eventos independientes
Teorema de Bayes
Selecciones al azar, con
o sin reemplazo

ESTADÍSTICA
Muestreo
Frecuencias
Distribución de
frecuencias
Representación
gráfica e
interpretación
Media aritmética
Mediana
Moda
Media geométrica
Media armónica
Rango
Desviación media
Desviación típica
Varianza
Sesgo
Apuntamientos
Momentos

Coeficiente de
correlación
Rectas de
regresión
Error estándar
de estimación
Datos agrupados y no agrupados
GRAFICACIÓN
APLICACIONES
Representación gráfica y variacional de fenómenos naturales y sociales para la posible toma de decisiones.
Manejo de la
Información
Medidas de
Tendencia Central
Medidas de
Dispersión
Medidas de
Forma
Medidas de
Correlación
GRAFICACIÓN
APLICACIONES
Representación gráfica y variacional de fenómenos naturales y sociales para la posible toma de decisiones.
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 3 Ing. Antonio Torres Martínez
ESTADÍSTICA
Orígenes y Desarrollo.
La estadística tiene sus orígenes en tiempos muy remotos, al igual que otras
disciplinas. Durante la civilización egipcia, griega y romana, los datos se obtenían
principalmente con propósitos de aplicar impuestos y planificar el reclutamiento militar
y estaba estrechamente ligada a la administración del estado.

Desde los comienzos de la civilización han existido formas sencillas de estadísticas,
pues ya se utilizaban representaciones gráficas y otros símbolos en pieles, rocas,
palos de madera y paredes de cuevas para contar el número de personas, animales o
ciertas cosas.

Hacia el año 3000 a.C. los babilonios usaban ya pequeñas tablillas de arcilla para
recopilar datos en tablas sobre la producción agrícola y de los géneros vendidos o
cambiados mediante trueque. Los egipcios analizaban los datos de la población y la
renta del país mucho antes de construir las pirámides en el siglo XXXI a.C. Los libros
bíblicos de Números y Crónicas incluyen, en algunas partes, trabajos de estadística. El
primero contiene dos censos de la población de Israel y el segundo describe el
bienestar material de las diversas tribus judías. En China existían registros numéricos
similares con anterioridad al año 2000 a.C.

Los griegos clásicos realizaban censos cuya información se utilizaba hacia el año 594
A.C. para cobrar impuestos. El Imperio romano fue el primer gobierno que recopiló una
gran cantidad de datos sobre la población, superficie y renta de todos los territorios
bajo su control.

Durante la edad media sólo se realizaron algunos censos exhaustivos en Europa. Los
reyes carolingios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos
de las propiedades de la Iglesia en los años 758 y 762 respectivamente. Después de
la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó
un censo. La información obtenida con este censo, llevado a cabo en 1086, se recoge
en el Domesday Book. El registro de nacimientos y defunciones comenzó en Inglaterra
a principios del siglo XVI, y en 1662 apareció el primer estudio estadístico notable de
población, titulado Observations on the London Bills of Mortality (Comentarios sobre
las partidas de defunción en Londres). Un estudio similar sobre la tasa de mortalidad
en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el
astrónomo inglés Edmund Halley como base para la primera tabla de mortalidad.

Y a partir de 1790, la constitución de Estados Unidos estableció el levantamiento de
censos cada diez años.

Galton, biólogo y su discípulo Karl Pearson, biólogo y además matemático, fueron sus
dos grandes exponentes. Uno de los acontecimientos científicos más importantes del
presente siglo ha sido el gran desarrollo de la estadística y su incidencia como
herramienta básica para la investigación empírica de otras disciplinas.

En el siglo XIX, con la generalización del método científico para estudiar todos los
fenómenos de las ciencias naturales y sociales, los investigadores aceptaron la
necesidad de reducir la información a valores numéricos para evitar la ambigüedad de
las descripciones verbales.

En nuestros días, la estadística se ha convertido en un método efectivo para describir
con exactitud los valores de los datos económicos, políticos, sociales, psicológicos,
biológicos y físicos, y sirve como herramienta para relacionar y analizar dichos datos.

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 4 Ing. Antonio Torres Martínez
El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino
sobre todo el proceso de interpretación de esa información.

El desarrollo de la teoría de la probabilidad ha aumentado el alcance de las
aplicaciones de la estadística. Muchos conjuntos de datos se pueden aproximar, con
gran exactitud, utilizando determinadas distribuciones probabilísticas; los resultados de
éstas se pueden utilizar para analizar datos estadísticos. La probabilidad es útil para
comprobar la fiabilidad de las inferencias estadísticas y para predecir el tipo y la
cantidad de datos necesarios en un determinado estudio estadístico.

La estadística conceptualmente no puede considerarse como ciencia, ya que no
establece sus propias leyes, es en sí una rama de las matemáticas y toda su teoría se
desarrolla dentro de ellas. Se le puede considerar como una técnica científica que es
utilizada por otras áreas de estudio en su proceso de investigación.

No hay una teoría estadística para la economía, otra para la psicología, una más para
la administración de empresas. Se puede establecer que empleada como instrumento
de investigación y análisis por otras ciencias, tal es el caso de la biometría, la
econometría y la psicometría que aplican técnicas estadísticas en un campo
especializado.

Como una forma de trabajar con la estadística se establece dos áreas de tratamiento,
una denominada:

Estadística descriptiva que se encarga de las formas de organizar, resumir y
presentar datos, formula reglas y procedimientos para su presentación en una forma
más útil y significativa. Establece normas para la representación grafica de los
mismos. También son una base importante para el análisis en casi todas las
disciplinas académicas.






Tanto cualitativa como cuantitativamente.

Estadística inferencial nos permiten hacer posible la estimación de una característica
de la población, sobre la base del estudio de una muestra. Bernoulli, De Moivre y Karl
Gauss fueron los precursores del objeto de la estadística inferencial.










La inferencia constituye la base teórica del muestreo, permite conocer el todo con
cierta aproximación, a partir del estudio de una parte. La estadística inferencial no nos
da una certeza completa en sus resultados, sino que están sujetas a una probabilidad
de error. Una incorrecta selección de las unidades muéstrales puede acarrear la
imposibilidad de inferir correctamente las características de la población.

Fuentes de datos. Cuando se determina que la estadística proporciona herramientas
adecuadas para responder alguna pregunta, comienza la búsqueda de datos
adecuados que sirvan como la materia prima para la aplicación requerida de la
estadística. Los datos en general se encuentran disponibles en una o más de las
siguientes fuentes:

"La estadística descriptiva es la organización y resumen de datos"

Tiene por objetivo describir las características de un conjunto, pero sin la
necesidad de realizar el registro de datos a todos los elementos o unidades
del conjunto o población, sino a una parte de esta.
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 5 Ing. Antonio Torres Martínez
Fuentes primarias. Cuando los datos publicados son elaborados por la misma
institución que los emplea para llevar a cabo análisis.

Fuente secundaria. Son aquellos tomados de transcripciones o que se emplean como
referencia para tratar algún tema en específico. Generalmente se omiten detalles de
os originales y presentan errores.

Fuentes externas. Los reportes publicados en revistas especializadas: bancos,
financieras, deportivas, comerciales, de servicios, y muchas más, son una invaluable
fuente de información para llevar a cabo análisis que permitan tomar decisiones.

Fuentes nacionales. Comprenden datos tomados del acontecer económico, político,
social, educativo, deportivo, social de un país, ya sean públicas o privadas, empleados
para sí mismo.

Fuentes extranjeras. Las fuentes consideradas extranjeras, elaboran estadísticas de la
mayor parte de los países del mundo, algunas de ellas son:

a) Yearbook of National Accounts Statistical (ONU). Proporciona información
sobre productos nacionales, financiamiento y composición del producto
nacional, comercio interior y exterior.
b) World Energy Supplies (ONU). Proporciona información sobre producción,
importación, exportación y consumo de energía, combustibles sólidos, petróleo
y sus derivados.
c) Basic Facts and Figures. (UNESCO). Contiene información sobre estadísticas
de educación en la mayor parte de los países del mundo.
d) Comisión Económica para América Latina. (CEPAL). Presenta un resumen con
diversas estadísticas sobre los países latinoamericanos.

Fuentes públicas. En cualquier país, el principal productor de estadísticas es el sector
público, casi todas las dependencias del gobierno elaborar y utilizan datos estadísticos
con fines administrativos y de operación, para desarrollar las funciones que les han
sido asignadas y publican información en forma regular.

En México, por ley, es la Dirección General de Estadística, dependiente de la
Secretaría de Economía, el organismo encargado de la formación y publicación de las
estadísticas de carácter federal.

La Secretaria de Trabajo y Previsión Social, la Secretaría de Hacienda y Crédito
Público, la Nacional Financiera, S.A., el Banco de México, la Secretaría de Salud, el
Seguro Social, la Secretaría de Recursos Hidráulicos, la de Ganadería, la Comisión
Nacional Bancaria, la Comisión de Salarios Mínimos, instituciones que proporcionan
información referente a las actividades del ramo y que están disponibles en sus
diferentes publicaciones.

Fuentes privadas. Este tipo de información es elaborada y publicada por organismos
no gubernamentales, tales como las Cámaras de comercio e industriales, revistas
especializadas o por organismos de investigación privadas.

Registros conservados por rutina. En los depósitos de información se pueden
encontrar datos que ayudarán a contestar preguntas acerca de temas tales como las
características de los empleados, la demografía y satisfacción de los clientes, la
competencia, la confiabilidad de los vendedores, las especificaciones de los productos
y una enorme cantidad de elementos por analizar.

Encuestas. Éstas pueden proporcionar los datos necesarios para responder
cuestionamientos que permitan conocer las preferencias o quejas de los usuarios de
productos o servicios. Asimismo, el grado de satisfacción y requerimientos de sectores
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 6 Ing. Antonio Torres Martínez
específicos de población. Generalmente se emplea como muestra representativa del
sentir de los sectores sociales, políticos, culturales y económicos.

Experimentos. Consiste en intentar estrategias con grupos de empleados diferentes.
La evaluación subsecuente de las respuestas a las diferentes estrategias podría
permitir al gerente decidir cuál es la más efectiva.

Conceptos básicos.
Datos Estadísticos. Han sido usados durante siglo por los gobiernos organizados
como forma de ayudar a la toma de decisiones en la administración del estado. Los
datos estadísticos son concisos, específicos y capaces de ser analizados
objetivamente por diferentes procedimientos. En función de sus características los
datos se clasifican en cuantitativos y cualitativos; siendo los cuantitativos la base
fundamental de estudio de la estadística. El uso de la computadora ha hecho posible
que los gobiernos, las empresas y otras organizaciones almacenen y procesen
grandes cantidades de datos.

Se obtienen mediante un proceso que incluye la observación de conceptos, como
calificaciones de exámenes, ingresos anuales de una ciudad, temperatura diaria
durante todo el año de una comunidad, velocidad de circulación de los vehículos por
una autopista. En conceptos reciben el nombre de variables, ya que producen una
serie de valores que tienden a mostrar cierto grado de variabilidad, al realizarse un
conjunto de mediciones de manera sucesiva.

Los datos de características cuantitativas: son aquellos que se pueden expresar
numéricamente y se obtienen a través de mediciones y conteos. Un dato cuantitativo
se puede encontrar en cualquier disciplina; sicología, contabilidad, economía,
publicidad.

Datos de características cualitativas. Los datos de características cualitativas son
aquellos que no se pueden expresar numéricamente. Estos datos se deben convertir a
valores numéricos antes de que se trabaje con ellos.

Datos nominales. Comprenden categorías, como el sexo, carrera de estudio, material
de los pisos, calificaciones, etc. Las características mencionadas no son numéricas
por su naturaleza, pero cuando se aplican, ya sea en una población o una muestra, es
posible asignar a cada elemento una categoría y contar él número que corresponde a
cada elemento. De esta manera estas características se convierten en numéricas.

Una variable es un símbolo, tal como X, Y, H, x ó B, que pueden tomar un conjunto
prefijado de valores, llamado dominio de esa variable. Si la variable puede tomar un
solo valor, se llama constante.

Los datos de características cuantitativas y cualitativas se clasifican a su vez en:

Variables continuas. Es cuando los datos estadísticos se generan a través de un
proceso de medición se dice que estos son datos continuos; son aquellas que aceptan
valores en cualquier punto fraccionario de un determinado intervalo, o sea, que
aceptan fraccionamiento en un determinado intervalo.

Ejemplos:
a) Los pesos de 100 alumnos del CECyTEH, pueden estar entre los valores:
67,495 kg., 70,153 kg., 73,585 kg., 81,670 kg. y 90,500 kg.

b) El registro de las alturas en metros de 50 alumnas del CECyTEH Plantel
Tizayuca son:

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 7 Ing. Antonio Torres Martínez
Alumna 1 1,55 Alumna 2 1,59 Alumna 3 1,59 Alumna 4 1,58 Alumna 5 1,55
Alumna 6 1,58 Alumna 7 1,50 Alumna 8 1,55 Alumna 9 1,49 Alumna 10 1,50
Alumna 11 1,58 Alumna 12 1,59 Alumna 13 1,66 Alumna 14 1,64 Alumna 15 1,66
Alumna 16 1,75 Alumna 17 1,64 Alumna 18 1,51 Alumna 19 1,52 Alumna 20 1,55
Alumna 21 1,55 Alumna 22 1,58 Alumna 23 1,59 Alumna 24 1,75 Alumna 25 1,67
Alumna 26 1,59 Alumna 27 1,67 Alumna 28 1,55 Alumna 29 1,80 Alumna 30 1,59
Alumna 31 1,80 Alumna 32 1,63 Alumna 33 1,48 Alumna 34 1,55 Alumna 35 1,63
Alumna 36 1,51 Alumna 37 1,66 Alumna 38 1,58 Alumna 39 1,75 Alumna 40 1,59
Alumna 41 1,63 Alumna 42 1,60 Alumna 43 1,57 Alumna 44 1,59 Alumna 45 1,77
Alumna 46 1,55 Alumna 47 1,59 Alumna 48 1,67 Alumna 49 1,67 Alumna 50 1,58

c) Las temperaturas promedio registradas en la ciudad de Tizayuca, Hgo., entre
las 12 y 13 horas del mes de junio del 2010 en grados Celsius, fueron:

Día 1 23,7 Día 2 24,2 Día 3 20,6 Día 4 20,6 Día 5 22,9
Día 6 23,5 Día 7 21,8 Día 8 19,0 Día 9 19,6 Día 10 20,1
Día 11 18,7 Día 12 22,4 Día 13 23,5 Día 14 25,4 Día 15 27,8
Día 16 30,1 Día 17 28,7 Día 18 27,9 Día 19 27,8 Día 20 28,0
Día 21 27,6 Día 22 28,5 Día 23 23.7 Día 24 25,5 Día 25 23,5
Día 26 27,8 Día 27 25,7 Día 28 26,2 Día 29 28,6 Día 30 22,8

Ejercicios:
1) Toma y registra en una tabla las alturas compañeros de grupo.

2) Anota en una tabla todas las calificaciones, por parcial, que has obtenido
durante tu estancia en el CECyTEH.

3) Selecciona al azar 20 envases de cualquier refresco en lata sin consumir,
registra en una tabla, el tamaño de sus dimensiones y calcula el área de su
base, altura y volumen.

4) Explica:
a) El tipo de variables que empleaste para registrar los resultados de las
actividades anteriores.
b) ¿Qué significa que un dato sea valor continuo?

5) Elabora una forma de registrar las edades (años y meses) de tus compañeros
de todas las especialidades del CECyTEH Plantel “Emiliano Zapata” Tizayuca
que cursan el quinto semestre.

Variables discretas. Se generan a través de un proceso de conteo. Son aquellas que
no aceptan valores en puntos fraccionarios dentro de un determinado intervalo, o sea,
son aquellas que no aceptan fraccionamiento dentro de un determinado intervalo.

Ejemplos:
a) La cantidad de hijos que tienen diez familias

Familia 1 4 Familia 2 2 Familia 3 5 Familia 4 2 Familia 5 2
Familia 6 1 Familia 7 1 Familia 8 4 Familia 9 0 Familia 10 1


COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 8 Ing. Antonio Torres Martínez


b) Los números enteros.







c) La producción de tornillos del modelo 5404 de ¾ de pulgada de largo y  de Ø,
del mes de mayo del 2009.






Ejercicios:

a) Propón 5 ejemplos de actividades productivas en donde se empleen números
discretos.

b) Grafica el comportamiento de una empresa refresquera, considerando 4 tipos
diferentes de refrescos, en función de sus ventas de los tres últimos meses.






































1 0 2 6 5 4 3 -1 -6 -5 -4 -3 -2
7000 6000 8000 12000 11000 10000 9000 5000
0
0 1000 2000 3000 4000
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 9 Ing. Antonio Torres Martínez

MEDIDAS DE TENDENCIA CENTRAL

Un promedio es un valor, que es típico o representativo de un conjunto de datos que
tienden a situarse en el centro del conjunto de datos ordenados, según su magnitud,
los promedios se conocen también como “medidas de centralización”, las más
comunes son:

 Media aritmética o media
 Media Armónica
 Media Geométrica
 Mediana
 Moda

La media aritmética, o simplemente media, de un conjunto de n datos x
1
, x
2
, x
3
,…, x
n
,
se denota por ̅ “x barra” y se define por:

̅

donde n es el total de los datos de una muestra.

La media es sin duda la medida de mayor uso para representar el medio o el centro de
un conjunto de datos. Algunas de las propiedades de la media son las siguientes:

 Puede siempre ser calculada para cualquier conjunto de datos numéricos.
 Cualquier conjunto de datos numéricos tienen una y sólo una media.
 Puede ser empleada para un análisis estadístico posterior, como por ejemplo,
las medidas de varios conjuntos de datos pueden ser combinadas para obtener
la media de todos los datos.
 Es una medida confiable en el sentido de que las medias de varias muestras
de una población generalmente no difieren mucho.
 La medida es sensible a valores extremos.

Ejemplos:

a) La media aritmética de los números 8, 6, 9, 4, 5, 3, 10, 7 y 2 es:

̅

b) Las calificaciones de un estudiante del CECyTEH Plantel “Emiliano Zapata”
Tizayuca en seis pruebas, en una escala de 10 a 100, son: 84, 91, 72, 68, 87 y
78. Hallar su media aritmética.


̅

c) Diez medidas del diámetro (Ø), en pulgadas, de un cilindro fueron registradas
como 3.88, 4.09, 3.93, 3.97, 4.02, 3.95, 4.03, 3.92, 3.98 y 4.00. Hallar el
promedio de sus Ø.

̅

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 10 Ing. Antonio Torres Martínez

Ejercicios:
1) Los salarios anuales de 15 obreros especializados, en miles de pesos, fueron:

Obrero 1 96 Obrero 2 90 Obrero 3 85 Obrero 4 79 Obrero 5 70
Obrero 6 84 Obrero 7 95 Obrero 8 99 Obrero 9 100 Obrero 10 83
Obrero 11 93 Obrero 12 98 Obrero 13 78 Obrero 14 88 Obrero 15 89

Determinar el salario promedio de los quince empleados.

2) Los tiempos de reacción de un individuo a determinados estímulos fueron:
0.53, 0.46, 0.50, 0.49, 0.52, 0.53, 0.44 y 0.55 segundos, respectivamente.
Determinar el tiempo medio de reacción del individuo a los estímulos.

3) La longevidad de la familia Gómez se describe en la tabla. Calcular la media de
los años de vida mostrados.


Familia Gómez
69 86 74
78 83 87
65 57 1


Si los datos x
1
, x
2
, x
3
, …, x
n
se repiten f
1
, f
2
, f
3
, …, f
n
veces, respectivamente, la media
aritmética es:

Cálculo de la media aritmética para datos agrupados:


̅

Donde ∑

Cuando los datos se presentan en una distribución de frecuencias, todos los valores
que caen dentro de un intervalo de clases dado se pueden considerar iguales a la
“marca de clase”, el cual es el punto medio del intervalo:

.

La fórmula anterior es válida para “datos agrupados”, los cuales se establecen
cuando se tienen muchos datos, los que se agrupan dentro de un intervalo que
abarque a varios de ellos.


Ejemplos:

a) Sí los números 5, 8, 6 y 2 se presentan con frecuencias 3, 2, 4 y 1
respectivamente, la media aritmética es:


̅

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 11 Ing. Antonio Torres Martínez
b)
Edades del Personal de un Supermercado
México 2000
Edad
Número de
Trabajadores
Marca de Clase
(x
i
)
x
i
· f
i

18 -21 10 19.5 195.0
22 – 25 9 23.5 211.5
26 – 29 19 27.5 522.5
30 – 33 12 31.5 378.0
34 – 37 9 35.5 319.5
38 – 41 4 39.5 158.0
42 – 45 7 43.5 304.5
n = 70 ∑

2089.0
Fuente: Nómina del departamento de Recursos Humanos


El promedio o media aritmética es la sumatoria del producto de las frecuencias con las
marcas de clase:

̅

c) La siguiente tabla muestra la distribución de los Øs de las cabezas de
remaches fabricadas por la factoría “El Buen Tornillo”. Calcular el Ø promedio.

Diámetro
inches
Frecuencia
f
Marca de clase
M.C.(x)

f x
0.7247 – 0.7249 2 0.7248 1.4496
0.7250 – 0.7252 6 0.7251 4.3506
0.7253 – 0.7255 8 0.7254 5.8032
0.7256 – 0.7258 15 0.7257 10.8855
0.7259 – 0.7261 42 0.7260 30.4920
0.7262 – 0.7264 68 0.7263 49.3884
0.7265 – 0.7267 49 0.7266 35.6034
0.7268 – 0.7270 25 0.7269 18.1725
0.7271 – 0.7273 18 0.7272 13.0896
0.7274 – 0.7276 12 0.7275 8.7300
0.7277 – 0.7279 4 0.7278 2.9112
0.7280 – 0.7282 1 0.7281 0.7281
∑ 250 181.6071

̅

d) Una serie de números está formada por seis 6, siete 7, ocho 8, nueve 9 y diez
10. ¿Cuál es su media aritmética?

̅

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 12 Ing. Antonio Torres Martínez
Ejercicios:
1) Hallar la media aritmética para los datos que se dan enseguida:

x 462 480 498 516 534 552 570 588 606 624
f 98 75 56 42 30 21 15 11 6 2

2) La siguiente tabla muestra la distribución de frecuencias de las calificaciones
del examen final de álgebra del CECyTEH Plantel “Emiliano Zapata”
Tizayuca. Hallar su media aritmética.


Calificación
Número de
estudiantes
90 – 100 9
80 – 89 32
70 – 79 43
60 – 69 21
50 – 59 1
40 – 49 3
30 – 39 1
∑ f 110

3) Hallar la ̅ (media aritmética) de los pesos de 40 estudiantes de la UAEH.

Pesos
(libras)
Estudiantes
f
118 – 126 3
127 – 135 5
136 -144 9
145 – 153 12
154 – 162 5
163 – 171 4
172 – 180 2
∑ f 40

4) Empleando la siguiente tabla, calcular el salario promedio de 68 empleados:

Salarios f
250.00 - 259.99 8
260.00 – 269.99 10
270.00 – 279.99 16
280.00 – 289.99 15
290.00 – 299.99 10
300.00 – 309.99 5
310.00 – 319.99 3
320.00 – 329.99 0
330.00 – 339.99 1
∑ f 68

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 13 Ing. Antonio Torres Martínez
Media Armónica

La media armónica “H” de una serie de N datos x
1
, x
2
, x
3
, …, x
n
es la recíproca de la
media aritmética de los recíprocos de los datos.

En la práctica es más fácil recordar:

Ejemplos:
a) Obtener la media armónica “H” de los números 2, 4 y 8.

(

)

(

)

b) Hallar la “H” de los números 3, 5, 6, 6, 7, 10 y 12.

(

)

(

)

Para datos agrupados, tenemos:

c) La tabla muestra la distribución de las cargas máximas en toneladas que
soportan los cables producidos en la compañía Aceros Máximos S. A., obtener
la “H”

Máxima carga
(ton)
Frecuencia x
9.3 – 9.7 2 9.5
9.8 – 10.2 5 10.0
10.3 – 10.7 12 10.5
10.8 – 11.2 17 11.0
11.3 – 11.7 14 11.5
11.8 – 12.2 6 12.0
12.3 – 12.7 3 12.5
12.8 – 13.2 1 13.0
∑f 60

(

)

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 14 Ing. Antonio Torres Martínez
Ejercicios:
1) Obtener la “H” de los números 11, 15, 21 y 23

2) Obtener la media armónica “H”, de los números racionales

3) Hallar la “H” para los datos agrupados de la siguiente tabla:

x f
462 98
480 75
498 56
516 42
534 30
552 21
570 15
588 11
606 6
624 2
∑ f 356

4) Determinar la “H” de los salarios de 65 empleados mostrados en la tabla:

Salarios
Número de
empleados
250.00 - 259.99 8
260.00 – 269.99 10
270.00 – 279.99 16
280.00 – 289.99 14
290.00 – 299.99 10
300.00 – 309.99 5
310.00 – 319.99 2
∑ f 65

5) Calcular la “H” de los pesos de 40 estudiantes y compara el resultado con el
obtenido en la media aritmética.

Pesos
(libras)
Estudiantes
f
118 – 126 3
127 – 135 5
136 -144 9
145 – 153 12
154 – 162 5
163 – 171 4
172 – 180 2
∑ f 40

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 15 Ing. Antonio Torres Martínez

Media Geométrica

La media geométrica “G” de una serie de números x
1
, x
2
, x
3
, …, x
n,
es raíz enésima
del producto de los números.

Ejemplos:
a) Calcular la “G” de los números 4, 6. 8, 16 y 32

b) Obtener la “G” de los números 25.5, 32.4, 44.8 y 53.2

Para datos agrupados:

Media Geométrica Ponderada

Los x
1
, x
2
, x
3
, …, x
n
se presentan con frecuencia f
1
, f
2
, f
3
, …, f
n ,
donde f
1
+ f
2
+ f
3
,+ …, f
k
= N (frecuencia total)


Ejemplos:
a) Determinar la “G” de los números 3, 5, 6, 6, 7, 10 y 12

O bien mediante:

Otro método

[]

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 16 Ing. Antonio Torres Martínez
La media geométrica “G” de un conjunto de datos distintos positivos es menor que la
media aritmética ̅

̅

̅

b) La tabla muestra la distribución de las cargas máximas en toneladas que
soportan los cables producidos en la compañía Aceros Máximos S. A., obtener
la “G”

Máxima carga
(ton)
Frecuencia x
9.3 – 9.7 2 9.5
9.8 – 10.2 5 10.0
10.3 – 10.7 12 10.5
10.8 – 11.2 17 11.0
11.3 – 11.7 14 11.5
11.8 – 12.2 6 12.0
12.3 – 12.7 3 12.5
12.8 – 13.2 1 13.0
∑f 60






[
]


⁄ [ ]

⁄ []

Ejercicios
1) Demostrar que la ̅ del ejercicio de cargas máximas.

2) Calcular la “G” de los números 15, 18, 21, 27, 34 y 40, comprobando el
resultado, mediante la aplicación de los diversos métodos expuestos.

3) Calcular la “G” de los pesos de 40 estudiantes y compara el resultado con el
obtenido en la media aritmética.

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 17 Ing. Antonio Torres Martínez
Pesos
(libras)
Estudiantes
f
118 – 126 3
127 – 135 5
136 -144 9
145 – 153 12
154 – 162 5
163 – 171 4
172 – 180 2
∑ f 40

Media cuadrática

La media cuadrática “MQ” de un conjunto de números x
1
, x
2
, x
3
, …, x
n
se suele
denotar por:


̅

Y se define como:



̅



Este tipo de promedios se emplea frecuentemente en aplicaciones físicas.

Ejemplos
a) La “MQ” del conjunto 1, 3, 4, 5, y 7 es:




b) Hallar la “MQ” de los números 3, 5, 6, 6, 7, 10 y 12





Ejercicios
1) Calcular la “MQ” de los números

2) Hallar la “MQ” de los 10 primeros números primos.


Mediana

La mediana de un conjunto de números ordenados en magnitud es el valor central o la
media de los dos valores centrales.
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 18 Ing. Antonio Torres Martínez
Ejemplos
a) En el conjunto de los números 3, 4, 4, 5, 6, 8, 8, 8 y 10 la mediana es el 6
debido a:

3 4 4 5 6 8 8 8 10









b) En el conjunto de números 5, 5, 7, 9, 11, 12, 15, y 18 la mediana es:









Por lo tanto, la mediana es:

Para datos agrupados, la mediana obtenida por interpolación está dada por:

(

)

Donde:

(∑)

Geométricamente la mediana es el valor de (abscisa) que corresponde a la recta
vertical que divide un histograma en dos partes de igual área. Ese valor de suele
denotarse por ̃.

c) Calcular la ̃ de los pesos de 40 estudiantes de acuerdo con la tabla.


Pesos
(libras)

Estudiantes
f

x
LRI
Frontera
inferior
LRS
Frontera
superior
118 – 126 3 122
127 – 135 5 131
136 -144 9 140
145 – 153 12 144 144.5 153.9
154 – 162 5 158
163 – 171 4 167
172 – 180 2 176
∑ f 40


Como la suma de las frecuencias de las tres y cuatro primeras clases son:

3 + 5 + 9 = 17 y 3 + 5 + 9 +12 =29

respectivamente, es claro que la medina cae en la cuarta clase, que es, por tanto, la
clase de la mediana. Entonces:
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 19 Ing. Antonio Torres Martínez

(∑)

Luego aplicando la formula, tenemos:



(

) (

)



A continuación se elabora el Histograma de la medina obtenida:





























Asimismo trazamos el Polígono de frecuencias.






3
12
5
9
5
4
2
2
14
12
4
6
8
10
HISTOGRAMA
F
r
e
c
u
e
n
c
i
a


122 131 176 167 158 149 140
Peso (libras)
146.75
14
12
8
10
POLIGONO DE FRECUENCIAS
F
r
e
c
u
e
n
c
i
a


COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 20 Ing. Antonio Torres Martínez



















Es muy frecuente presentar el Histograma y Polígono de Frecuencias, conjuntamente,
como se muestra a continuación































MODA

La moda ̂ de una serie de números, es aquel número que se presenta con la mayor
frecuencia, es decir es el valor más común. La moda puede no existir, e incluso si
existe no ser única.

Ejemplos
HISTOGRAMA Y POLIGONO DE FRECUENCIAS
F
r
e
c
u
e
n
c
i
a


Peso (libras)
122 131 176 167 158 149 140
3
12
5
9
5
4
2
2
14
12
4
6
8
10
146.75
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 21 Ing. Antonio Torres Martínez
a) El sistema 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12 tiene como moda el número 9
debido a ser el número de mayor frecuencia o más común.
b) El sistema 3, 5, 8, 10, 12, 15, 16 no tiene moda, ya que todos tienen como
frecuencia 1, por lo tanto ninguno se considera como de mayor frecuencia.

c) El sistema 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, es bimodal ya que el 4 y 7 se repiten con
la misma frecuencia.

En el caso de datos agrupados donde se ha construido una curva de frecuencias para
ajustar datos, la moda será el valor ó valores de x correspondiente al máximo ó
máximos de valores.

De una distribución de frecuencias o histograma, la moda puede obtenerse mediante
la aplicación de la expresión:

(

)

Ejemplos:
a) Hallar la ̂ de los pesos de 40 estudiantes del CECyTEH Plantel “Emiliano
Zapata” Tizayuca.


Pesos
(libras)

Estudiantes
f

x
LRI
Frontera
inferior
LRS
Frontera
superior
118 – 126 3 122
127 – 135 5 131
136 -144 9 140
145 – 153 12 144 144.5 153.9
154 – 162 5 158
163 – 171 4 167
172 – 180 2 176
∑ f 40

De la tabla se observar que la clase modal es el intervalo 145 – 153, por lo que:

Por lo tanto:

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 22 Ing. Antonio Torres Martínez
(

)

(

)







































Ejercicios:
Determinar la mediana y moda de las siguientes serie de números:

a)
2 3 4 3 $3 6
2 5 1 5 7 4
1 5 6 5 5 1
3 5 4 3 7 4
5 5 1 5 4 7

b)
2 3 4 5 4 4
4 3 6 2 6 8
7 2 6 7 6 6
5 4 6 5 4 8
6 6 6 2 6 5


HISTOGRAMA
F
r
e
c
u
e
n
c
i
a


Peso (libras)
122 131 176 167 158 149 140
3
12
5
9
5
4
2
2
14
12
4
6
8
10
147.2
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 23 Ing. Antonio Torres Martínez
c)
3 3 7 4 1 4
4 3 7 8 3 1
5 2 7 6 7 2
7 4 1 7 8 6
1 4 5 4 3 1

d) Determinar la mediana y moda de la tabla de frecuencias que muestra la
duración de 400 tubos de acero comprobados en la compañía “CPM Tubo
Company”

Duración
Hrs.
No.
Tubos
fr fra x
Límites reales
F
i
F
s

300 - 399 14
400 - 499 46
500 - 599 58
600 - 699 76
700 - 799 68
800 - 899 62
900 - 999 48
1000 - 1099 22
1100 - 1199 6
400

e) De acuerdo con la siguiente tabla de frecuencias calcula la media y mediana y
moda.

Intervalo
de clase
frecuencia
Frecuencia
relativa
Frecuencia
relativa
acumulada
Marca de
clase
Frontera
inferior
Frontera
superior
60 – 62 5
63 – 65 18
66 – 68 42
69 – 71 27
72 - 74 8
100

f) Traza el histograma y polígono de frecuencia de los ejercicios d) y e)


RELACIÓN EMPÍRICA ENTRE MEDIA, MEDIANA Y MODA

Para curvas de frecuencias unimodales que sean moderadamente sesgadas
(asimétricas) se tiene la relación empírica:



̅ ̅

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 24 Ing. Antonio Torres Martínez
En las figuras siguientes se muestran las posiciones relativas de la media, mediana y
moda para todas las curvas de frecuencia que están sesgadas a la derecha o
izquierda respectivamente. Para curvas simétricas la media, mediana y moda
coinciden.

















Ejemplo: Utilizar la formula empírica para hallar el salario de 65 empleados de la
empresa “P y R Company”, de acuerdo con la tabla de frecuencia que se muestra:

Salarios

f

f r

f r a

x

x f

f i

f s
250.00 - 259.99 8 0.12 0.12 254.995, 2039.960 249.995 259.995
260.00 – 269.99 10 0.15 0.27 264.995 2649.950 259.995 269.995
270.00 – 279.99 16 0.25 0.52 274.995 4399.920 269.995 279.995
280.00 – 289.99 14 0.22 0.74 284.995 3989.930 279.995 289.995
290.00 – 299.99 10 0.15 0.89 294.995 2949.950 289.995 299.995
300.00 – 309.99 5 0.08 0.97 304.995 1524.975 299.995 309.995
310.00 – 319.99 2 0.03 1.00 314.995 629.990 309.995 319.995
∑ f 65 1.00 18184.675

Media
̅

Mediana

̃

(

)

̃

(

)


̃ (

) (

)

(

)

̃

Moda

Sesgada hacia la derecha
Sesgada hacia la izquierda
moda
mediana
media
mediana
media
moda
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 25 Ing. Antonio Torres Martínez
(

)

(

)



Toda vez obtenidos los valores de la media, mediana, aplicamos la relación empírica
entre ellas, para obtener el salario modal.













Comparado contra el valor obtenido por formula se observa que no existe una gran
diferencia 280.36 – 278.24 = 2.12, valor que se puede considerar razonable, si es que
se aplicara este concepto.

Si lo comparamos contra el valor medio mediano obtendremos de diferencia:

280.36 – 279.76 = 0.6

280.36 – 279.96 = 0.4

Por lo anterior tenemos elementos estadísticos para decidir cuál valor salarial
podemos aplicar.

Ejercicios:
1) Determinar la media, mediana y moda de la tabla de frecuencias que muestra
la duración de 400 tubos de acero comprobados en la compañía “CPM Tubo
Company” y aplica la relación empírica entre ellas, desarrollando el análisis
correspondiente. (toma la tabla del ejercicio d, página 23 de éstos apuntes.)

2) Obtén la media Aritmética, Geométrica y Armónica del ejercicio 1 y comprueba
la relación:

̅

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión vienen a abundar más en el estudio estadístico, al
proporcionar los medios de averiguar el grado en que dichos datos se separan o
varían, esto con respecto al valor central, el cual es obtenido por medio de las
, es decir que nos dicen el grado de variación o de medidas de tendencia central
dispersión de los datos de la muestra, y configuran toda una disciplina que es
conocida por el nombre de Teoría de la dispersión.

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 26 Ing. Antonio Torres Martínez
Tanto las unas como las otras, son medidas que se toman para tener la posibilidad de
establecer comparaciones de diferentes muestras, para las cuales son conocidas ya
medidas que se tienen como típicas en su clase.

Por ejemplo: Si se conoce el valor promedio de los aprobados en las universidades
mexicanas, y al estudiar una muestra de los resultados de los exámenes de alguna
Universidad en particular, se encuentra un promedio mayor, o menor, del ya
establecido; se podrá juzgar el rendimiento de dicha institución.

Las Medidas de dispersión son parámetros estadísticos que miden cómo de
diseminados se encuentran los datos de una distribución. Los más utilizados se
refieren al grado de lejanía de los datos respecto a la media y son:

 El rango (recorrido, amplitud u oscilación)
 La desviación media
 El rango semi-intercuartil
 El rango percentil 10-90
 La desviación típica
 La varianza
 Coeficiente de variación

Características de dispersión

Las características de dispersión son estadísticos que nos proporcionan una medida
del mayor o menor agrupamiento de los datos respecto a los valores de tendencia
central. Todas ellas son valores mayores o iguales a cero, indicando un valor cero la
ausencia de dispersión.

Cuando se quiere conocer la dispersión de una variable, lo que intenta es obtener una
medida, que indique el mayor o menor grado en que están dispersos los datos. Intenta
dar una idea de cuán esparcidos se encuentran éstos.

Rango, Recorrido equivale a la medida de dispersión más sencilla para un conjunto
de observaciones, que no es más que la diferencia entre el mayor y el menor de los
datos.

Aunque útil en muestras pequeñas (el recorrido se utiliza frecuentemente en el control
de procesos industriales, donde es habitual tomar periódicamente muestras de
tamaño 5), el recorrido presenta el inconveniente de que ignora gran parte de la
información existente en la muestra. El problema se presenta cuando hay
demasiados datos o cuando alguno de ellos es muy extremo aunque en general es
un parámetro pobre por lo tanto es mejor utilizar la varianza o su raíz cuadrada, la
desviación típica.

Una de tales medidas puede ser la diferencia entre el valor mayor y el menor de la
distribución de frecuencias, que recibe el nombre de recorrido (o rango). En su cálculo
sólo intervienen dos valores (el máximo y el mínimo) por lo que es escasamente
representativa de la dispersión del conjunto de datos.

• El rango para la distribución del “número de calzado” es igual a 11 (46 – 35).

La medida de dispersión más utilizada es la desviación típica (s), que es la raíz
cuadrada de la suma de los cuadrados de la diferencia entre cada valor y la media
dividida dicha suma por el número de valores; su cuadrado recibe el nombre de
varianza y viene dada, por tanto, por la siguiente expresión:


COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 27 Ing. Antonio Torres Martínez

MEDIDAS DE VARIABILIDAD

El rango y el rango semiintercuartil

A continuación presentamos dos series, A y B, de diez puntuaciones.

A: 35, 38, 38, 38, 39, 40, 41, 43, 44 y 44
B: 18, 20, 27, 38, 38, 41, 48, 54, 55 y 61.

Proponemos al lector que calcule el valor de la moda, la mediana y la media de cada
una de las dos muestras.

La resolución de este pequeño ejercicio deja clara la necesidad de establecer otro tipo
de medidas distintas de las de tendencia central para describir una distribución, ya que
la muestra A y la muestra B tienen las mismas medias, medianas y modas y,
evidentemente, son dos distribuciones distintas. Pero distintas ¿en qué?. Distintas en
cuanto a su variabilidad o dispersión, en cuanto al grado en que sus datos se
parecen o se diferencian entre sí: mientras que las valoraciones en la muestra A
varían entre 35 y 44, en la muestra B lo hacen entre 18 y 61. Por tanto las
puntuaciones de esta última se encuentran mucho más dispersas que las de la
muestra A.

La forma más sencilla de calcular la variabilidad de un conjunto de datos es hallar la
diferencia entre el valor más grande y el valor más pequeño. A este índice se le llama
rango de la variable o amplitud total o recorrido. Las valoraciones de la muestra A
del problema anterior tienen un rango de 44 - 35 = 9, mientras que el de la muestra B
es de 61 - 18 = 43. Este índice ya nos apunta la diferencia entre las dos distribuciones.
Su principal ventaja, la hemos comentado anteriormente, es su facilidad de cálculo y
su principal inconveniente es que sólo es sensible a los valores extremos y no se ve
afectado en absoluto por los valores centrales. Veamos un ejemplo con tres grupos de
puntuaciones:

A: 3, 7, 8, 9, 10, 11, 12, 13 rango = 10
B: 7, 7, 8, 9, 10, 11, 12, 13 rango = 6
C: 7, 10, 10, 10, 10, 10, 10, 13 rango = 6

Las puntuaciones de A y B se parecen en cuanto a dispersión mucho más de lo que se
parecen las de B y C, aunque su amplitud total sea la misma. Otro inconveniente del
rango es que depende bastante del tamaño de la muestra, si comparamos la
dispersión de dos conjuntos de datos de tamaños muy distintos, lo más probable es
que la muestra de mayor tamaño tenga también mayor amplitud o recorrido.

Estos dos inconvenientes hacen que el rango no sea una buena medida de
variabilidad en solitario, aunque se pueda añadir como complemento a algún otro
índice de dispersión.

Otra medida de variabilidad es el llamado rango o amplitud semi-intercuartil, tiene la
ventaja sobre el rango de que elimina el influjo de las puntuaciones extremas ya que
se calcula mediante los cuartiles primero y tercero y su fórmula es:


Q - Q
3 1
Q =
2


Su cálculo es más complicado que el del rango pero es más probable que dos
distribuciones con el mismo rango semi-intercuartil tengan parecida variación que dos
distribuciones con el mismo rango. De hecho, si las distribuciones son simétricas o
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 28 Ing. Antonio Torres Martínez
aproximadamente simétricas el 50% de las observaciones se encuentran entre Md - Q
y Md + Q. Este índice se utiliza sobre todo cuando por las características de los datos
utilizamos la mediana como medida de la tendencia central.

DESVIACIÓN MEDIA, DESVIACIÓN ESTÁNDAR Y VARIANZA.

Anteriormente se han descrito las características generales de una distribución de
frecuencias, se definió las medidas de variabilidad o dispersión como aquellas que
daban cuenta de la concentración o dispersión de los datos en torno a la tendencia
central. Así pues, cuando se trata de definir una de estas medidas parece lógico
pensar en una expresión que indique de alguna manera un promedio de distancias de
las observaciones a la media. Ya vimos que una de las propiedades de la media era
que la suma de estas diferencias era cero, es decir:

( ) ¿
n
j
j=1
x - x = 0

Para obviar este problema tenemos dos posibles soluciones: en primer lugar podemos
calcular la suma de los valores absolutos de esas diferencias:

¿
n
j
j=1
x - x

y así, al eliminar los signos, esta suma ya no es igual a cero o bien, en segundo lugar,
podemos calcular la suma de los cuadrados de las diferencias:

( ) ¿
n
2
j
j=1
x - x

Aun así, los resultados de estas sumas dependerían del número de elementos que
componen la muestra, es decir, estas cantidades son más grandes cuanto mayor sea
el tamaño de la muestra (recuérdese que se están sumando números positivos, o
mejor, siendo rigurosos, números no negativos). Para evitar este inconveniente,
podríamos calcular una "distancia promedio", es decir, dividir cada uno de estos
sumatorios por el número de individuos de la muestra.

El primer camino nos lleva a la definición de desviación media, que se calcula, para
datos sin agrupar, como:

( ) ¿
n
j
j=1
x - x
DM=
N


Y el segundo a la definición de la varianza como:

( ) ¿
2
n
j
j=1 2
x
x - x
S =
n- 1



La razón de que el denominador de la varianza sea n-1 y no n, escapa a los
conocimientos estadísticos expuestos en estas notas. No obstante podemos dar una
sencilla explicación de este hecho: el denominador es n-1 para que la varianza
muestral sea una "buena estimación" de la varianza de la población. Se entiende por
ser una “buena estimación” aquella que no comete errores sistemáticos.

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 29 Ing. Antonio Torres Martínez
Ejemplo. Para calcular la varianza de dos series de puntuaciones cuya media es 12:

A: 4, 10, 12, 14, 20
B: 10, 11, 12, 13, 14

( )
( ) ( ) ( ) ( )
¿
2
5
2 2 2 2
j
j=1 2
A
x - 12
4 - 12 + 10 - 12 + 14 - 12 + 20 - 12
136
S = = =
4 4 4


( )
( ) ( ) ( ) ( )
¿
2
5
2 2 2 2
j
j=1 2
B
x - 12
10 - 12 + 11- 12 + 13 - 12 + 14 - 12
10
S = = = = 2.5
4 4 4


La única conclusión que podemos extraer de todo esto es que la varianza de A es
mucho más grande que la de B, pero en lo que se refiere a cómo de agrupados están
los datos respecto a la tendencia central en la muestra A, la magnitud 34 no nos
proporciona demasiada información (¿es una varianza muy grande, grande,
pequeña?).

La cuestión es cómo valorar el grado de dispersión cuantificado mediante la varianza.
En realidad, no tiene mucho sentido hablar en términos absolutos de niveles altos o
bajos de dispersión sino, más bien, en términos relativos. La varianza sirve, sobre
todo, para comparar el grado de dispersión de dos o más conjuntos de valores en una
misma variable. Así, comparando varianzas de la misma variable en poblaciones
distintas se pueden hacer afirmaciones del tipo: “la población de hombres presenta
una mayor variabilidad en su estatura que la población de mujeres, que son más
homogéneas en esa característica”.

Aun así, por ejemplo, el valor de 34 no parece que tengan relación con las magnitudes
de los datos de A, entre 4 y 20, ni con las de la distancia de cada dato a su media, las
mayores distancias son de ocho puntos. Esto es así porque, para calcular la varianza
hemos elevado cada distancia al cuadrado, estamos “elevando al cuadrado” la unidad
de medida de las puntuaciones originales. Por ello, para retomar las unidades
originales de esas distancias, se calcula la raíz cuadrada de la varianza, que se
denomina desviación típica. Su fórmula es:

( ) ¿
n
2
j
j=1
x
x - x
S =
n- 1


Calculando las raíz cuadrada de 34, obtenemos la desviación típica de A que es 5,8.
Esta magnitud parece guardar más relación con el concepto de separación promedio
de los datos respecto a la tendencia central. En la muestra B, la varianza es 2,5 y, por
tanto, su desviación típica es 1,58.

De cualquier modo, hay que indicar que tanto la varianza como la desviación típica son
siempre cantidades positivas o nulas (este caso ocurrirá cuando todas las
observaciones de la variable tengan el mismo valor).


Para calcular la varianza o la desviación típica, no se usa normalmente esta fórmula
porque cuando la media es un número decimal, al elevar al cuadrado cada una de las
diferencias obtendremos de nuevo un número con el doble de cifras decimales que
tendremos que arrastrar o bien redondear lo que aumenta considerablemente el riesgo
de cometer errores. Normalmente la fórmula usada para el cálculo de la varianza es:

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 30 Ing. Antonio Torres Martínez

¿
n
2
2
i
j=1 2
x
X - nX
S =
n- 1


y la de la desviación típica


¿
n
2
2
i
j=1
x
X - nX
S =
n- 1


Estas fórmulas se obtienen sólo con desarrollar el binomio al cuadrado que aparece en
la expresión original.

Al igual que en el caso de la media, también podemos escribir expresiones para la
varianza y la desviación típica en caso de contar con una distribución de frecuencias
sin agrupar o agrupada en intervalos de clase. En el primer caso dichas expresiones
son:

¿ ¿
k k
2
2 2
i 1 i 1
j=1 j=1 2
x x
X f - n X X f - n X
S = y S =
n- 1 n- 1


donde fi es la frecuencia de la puntuación Xi y k es el número de puntuaciones
distintas que se han obtenido.

Y si contamos con una distribución de frecuencias agrupadas en intervalos de clase,
trabajaremos con el número de intervalos de clase, sus puntos medios y sus
respectivas frecuencias, que denotamos en las siguientes expresiones como k, Xmi y fi
respectivamente:

¿ ¿
k k
2
2 2
i 1 i 1
j=1 j=1 2
x x
Xm f - n X Xm f - n X
S = y S =
n- 1 n- 1


Igualmente se cuenta con distintas expresiones para la desviación media en el caso de
contar con una distribución de frecuencias sin agrupar o agrupada en intervalos de
clase.

A continuación pondremos ejemplos de la confección de las tablas de distribución para
calcular la varianza y la desviación típica con ayuda de las anteriores expresiones.

Observemos para ello los datos de la siguiente tabla relativos a una distribución de
frecuencias sin agrupar, a la que añadiremos una columna con los puntos medios de
cada intervalo de clase al cuadrado y otra con el producto de éstos por la frecuencia
del intervalo. El resultado aparece reflejado en la siguiente tabla. De ella extraemos los
siguientes datos:



i
X

i
f

i i
X f

2
1
X

1
2
1
X f
9 1 9 81 81
8 1 8 64 64
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 31 Ing. Antonio Torres Martínez
7 2 14 49 98
6 2 12 36 72
5 5 25 25 125
4 3 12 16 48
3 3 9 9 27
2 2 4 4 8
1 1 1 1 1

TOTAL

20

94

524


De ella extraemos lo siguientes datos:

¿
20
2
i i
j=1
94
X = = 4,7 X f = 524
20



2 2
X
524 - 20(4,7) 524 - 20(4,7)
X = = 4,32 y S = = 2,07
19 19


Para ejemplificar el cálculo de varianza y desviación típica en el caso de una
distribución de frecuencias agrupada en intervalos de clase, consideremos las
puntuaciones de 30 alumnos en el test de hábitos de estudio. Observemos la siguiente
tabla:



i
X

i
Xm

i
f

i i
Xm f

2
i
Xm

2 2
i i
Xm f
90 - 94 92 2 184 8464 16928
85 - 89 87 2 174 7569 15138
80 - 84 82 1 82 6724 6724
75 - 79 77 4 308 5929 23716
70- 74 72 5 360 5184 25920
65 - 69 67 2 143 4489 8978
60 - 64 62 3 186 3844 11532
55 - 59 57 3 171 3249 9747
50 - 54 52 2 104 2704 5408
45 - 49 47 2 94 2209 4418
40 - 44 42 1 42 1764 1764
35 - 39 37 1 37 1369 1369
30 - 34 32 2 64 1024 2048
TOTAL 30 1940 133690


Con los datos de la Tabla se está en condiciones de aplicar las expresiones para el
cálculo de la varianza y la desviación típica:


¿
j
13
2
m j
j =1
1940
X = =64,67 X f =133690
30


COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 32 Ing. Antonio Torres Martínez
2 2
2
x x
133690- 30(64,67) 133690- 30(64,62)
S = =283,58 S = =16,84
29 29



USO DE LAS MEDIDAS DE VARIABILIDAD.

Habitualmente cuando nos planteamos el cálculo de una medida de variabilidad para
una distribución solemos elegir la desviación típica, sobre todo si se quieren emplear
más adelante otras técnicas estadísticas.

Para calcular la desviación típica es necesario conocer la media. Cuando esto no sea
posible y sólo podamos calcular la mediana como medida de tendencia central, o si la
distribución está truncada o incompleta, usaremos el rango intercuartil como medida
de variabilidad.

Cuando estemos ante una distribución con variaciones extremas, podemos calcular la
desviación media.

Cuando se quiere comparar la variabilidad de grupos con medias muy diferentes no
resulta apropiado comparar sus varianzas sino más bien comparar el que se denomina
coeficiente de variación que se representa como CV y se calcula:

x
S
CV = .100
X


Este coeficiente está expresado como un porcentaje y nos da idea de la
representatividad de la media. Cuanto mayor es este coeficiente menos representativa
es la media.

Un ejemplo del uso de este índice se da cuando queremos comparar la variabilidad del
tiempo empleado en correr 1500 metros por un grupo de alumnos y otro grupo de
alumnas. La diferencia de las medias del tiempo empleado nos aconsejará el uso del
coeficiente de variación.


SESGO O ASIMETRIA

El sesgo o asimetría se refiere al grado en que los datos tienden a concentrarse en los
valores centrales, en los valores inferiores al promedio, o en los valores superiores a
éste. También podemos decir que hace referencia al grado en que los datos se
reparten equilibradamente por encima y por debajo de la tendencia central. Una
distribución será simétrica cuando, al dividirla en dos a la altura de la media, las dos
mitades se superponen.

Una distribución tiene asimetría positiva cuando la mayor concentración de
puntuaciones se produce en la parte baja de la escala mientras que algunas
puntuaciones son altas. Una distribución tiene asimetría negativa cuando la mayor
parte de las observaciones se sitúan en la parte alta de la escala mientras que se
produce alguna observación en la parte baja. Un ejemplo: si ponemos a nuestros
alumnos un examen muy fácil, la distribución de frecuencias de sus calificaciones
tendrá sesgo negativo puesto que la mayoría de los alumnos obtendrían calificaciones
altas. Si por el contrario el examen es difícil, estaremos ante una distribución con
sesgo positivo puesto que la mayoría de los alumnos obtendrían notas bajas y sólo
algunos destacarían con notas altas. Si el examen es de dificultad media, lo más
probable es que la distribución sea simétrica. Para esta característica no vamos a
estudiar ningún índice porque normalmente los cálculos son laboriosos, más bien
podemos dar un criterio aun cuando la podemos apreciar mediante la inspección visual
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 33 Ing. Antonio Torres Martínez
del polígono de frecuencias. El criterio tiene que ver con las diferencias entre cuartiles
y es el siguiente:

Si (Q3 - Q2) > (Q2 - Q1) entonces la distribución tiene sesgo positivo.
Si (Q3 - Q2) < (Q2 - Q1) tiene sesgo negativo.
Si (Q3 - Q2) = (Q2 - Q1) la distribución será simétrica

Respecto a la inspección gráfica, en la Figura 9 aparecen las gráficas de tres grupos
A, B y C. La distribución A es simétrica, la B tiene sesgo positivo y la C negativo.




















Figura 9: Ejemplos de distribuciones con distinto tipo de sesgo. La A es simétrica, la B
asimétrica positiva y la C asimétrica negativa.

La curtosis se usa para saber cómo es de escarpado o plano un polígono de
frecuencias. El concepto de curtosis sólo se aplica a distribuciones unimodales
(distribuciones que tienen un único “pico”) y se refiere al empinamiento de la curva en
la proximidad de la moda. Generalmente el grado de curtosis de una distribución se
compara con un modelo de distribución que estudiaremos más adelante que es la
llamada campana de Gauss o distribución normal. Así, las distribuciones que tienen el
mismo grado de apuntamiento que la normal se llaman mesocúrticas.

Las distribuciones que tienen mayor grado de apuntamiento que la normal se llaman
leptocúrticas y las que lo tienen menor platicúrticas. Los índices empleados
habitualmente para calcular la curtosis son demasiado complicados, comparados con
su utilización, por lo que en estas notas no haremos referencia a ellos.


















Figura 10: Ejemplos de distribuciones con distintos tipos de curtosis.
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 34 Ing. Antonio Torres Martínez
La A es leptocúrtica, la B mesocúrtica y la C platicúrtica.

































































COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 35 Ing. Antonio Torres Martínez

PROBABILIDAD

Introducción

El nacimiento del cálculo de probabilidades estuvo ligado a los juegos de azar.
Cardano (que tenía una afición desordenada por el ajedrez y los dados, según
reconoce en su autobiografía) escribió “Libro sobre los juegos de azar”, publicado
póstumamente en 1663, y que fue considerado el primer tratado serio sobre las
probabilidades matemáticas. La correspondencia que Pascal y Fermat intercambiaron
(a mediados del siglo XVII) sobre la geometría del azar marca el nacimiento de la
nueva ciencia.

En la actualidad el Cálculo de Probabilidades ha llegado a ser la rama de las
matemáticas de mayor penetración en todos los campos, directamente o a través de la
Estadística.

1. Experimento aleatorio. Espacio muestral.
Definición 1. Se llama experimento o fenómeno aleatorio a aquél que es
susceptible de dar varios resultados, no pudiéndose predecir de antemano cuál de
ellos va a producirse en una experiencia concreta.

Cada ejecución del experimento se llama una prueba del mismo.

Ejemplo 1: Lanzar un dado o una moneda al aire son experimentos aleatorios.

Se llama experimento determinista al que realizado en la mismas condiciones
se obtiene siempre el mismo resultado (de éstos se ocupa la Física).

Definición 2. Llamaremos suceso elemental a cada uno de los posibles
resultados del experimento aleatorio.

Ejemplo 2: En el experimento “lanzar un dado” los sucesos elementales son 6.
S
1
= “sacar un 1”,.........., S
6
= “sacar un 6”.

Definición 3. Se llama espacio probabilístico o espacio muestral, E, al
conjunto de todos sus sucesos elementales.

Ejemplo 3: En el experimento lanzar una moneda el espacio muestral tiene dos
elementos, E ={C, F}.

Ejercicio 1. Encuentra el espacio muestral del experimento lanzar dos
monedas.

Definición 4. Se llama suceso a cualquier subconjunto del espacio muestral.

Diremos que un suceso, A, ocurre (o se verifica) en una prueba si el resultado
de la misma es uno de los sucesos elementales que pertenecen a A.

Ejemplo 4: El suceso A = sacar par al lanzar un dado (A= {S
2
, S
4,
S
6
}) se
verifica si sale un dos, un cuatro o un seis.

Ejemplo 5. Si tiramos dos monedas al aire sea A = “al menos una sea cara”. El
suceso A consta de tres sucesos elementales a saber CC, CF y FC.

En todo espacio muestral podemos distinguir los siguientes sucesos:

 Sucesos elementales, los subconjuntos con un solo elemento.
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 36 Ing. Antonio Torres Martínez

 Suceso seguro, E, el propio espacio muestral.

 Suceso imposible, Ø, que no posee ningún suceso elemental (no
puede verificarse).

Teniendo en cuenta que los sucesos son subconjuntos se suelen usar los
diagramas de Venn para representarlos.








Figura 1
A E
Si A y B son dos sucesos del espacio muestral E, éste queda dividido en cuatro
partes:

Los que están en A y no en B, los que están en B y no en A, los que están en
ambos y los que no están ni en a ni en B.

Figura 2






A E
a c B
b d
En el dibujo se ha indicado el número de sucesos elementales que les
corresponden.

Llamaremos P(E) al conjunto de todos los sucesos, es decir a partes de E.

♣ Diremos que el suceso A implica el B, sí siempre que se verifica A se
verifica B. Se indica A c B, pues todos los sucesos de A pertenecen a
B.

Ejemplo 6. A = “sacar un dos ” B = “sacar par”

♣ Dos sucesos son iguales cuando contienen los mismos sucesos
elementales; se puede expresar esto diciendo que se implican mutuamente, A c B y
B c A.
Definición 5. Se llama suceso contrario (o complementario) de A, y se
representa por A’ ó A
c
, al formado por los sucesos elementales de E que no están en
A.
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 37 Ing. Antonio Torres Martínez


A A
c

Es decir se verifica A
c
cuando no se verifica A.
Ejemplo 7. Si consideramos el suceso A = sacar dos águilas, al lanzar dos
monedas, A
c
es el suceso sacar al menos un sol.
Ejemplo 8. En la figura 1 el contrario de B está formado por a + d elementos.

2. Operaciones con sucesos
Teniendo en cuenta que los sucesos son subconjuntos se definen la:

Unión de sucesos.

Se llamará unión de dos sucesos A y B al que se verifica cuando en una
prueba el resultado es un elemento de A o de B (o de ambos). Se representa AB
(corresponde a la unión conjuntista).

Ejemplo 9. En la figura 2 el suceso AB tiene a + c + b elementos.

· Intersección de sucesos.

Llamaremos suceso intersección de A y B al que ocurre cuando el resultado
de una prueba es un elemento de ambos. Se representa A·B (corresponde a la
intersección conjuntista).

Ejemplo 10. En la figura 2 el suceso intersección tiene c elementos.

♣ Diferencia de sucesos.

Si A y B son dos sucesos se define su diferencia como: A -
c
.

Se verifica pues: A
c
= E - A.

Ejemplo 11. En la figura 2., A - B tiene a elementos.

Definición 6. Dos sucesos A y B se dice que son incompatibles si tienen
intersección vacía. En otro caso se dirán compatibles.

Ejemplo 12. Cualquier suceso A y su contrario son incompatibles.

Ejemplo 13. Si extraemos dos cartas de una baraja española (40 cartas) los
sucesos:

A = “Las dos sean copas” y B = “una sea copas y la otra rey” son compatibles.

Problema 1. En una determinada población el 50% ha estado casado alguna
vez, el 50% tiene menos de 70 años y el 80% no padece ninguna enfermedad
contagiosa. De estos últimos el 60% tiene menos de 70 años y el 40% ha estado
casado alguna vez. De los que han estado casados alguna vez, sólo el 20% tiene
menos de 70 años. El 10% de la población reúne las tres condiciones. Representar la
información anterior en un diagrama de Venn.



COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 38 Ing. Antonio Torres Martínez
Solución:
(Por comodidad en la representación consideramos que la población tiene 100
personas)

Sea C el conjunto de los que han estado casados alguna vez.

“ B “ tienen menos de 70 años.

“ E “ no padecen enfermedad contagiosa.

card ( C ) = 50% de la población; card (E) = 80%; card (B) =50%:

card (E · B) = 48%; card (E · C) = 32%; card (C · B) = 10%;

card (C · E · B) = 10%



Ejercicio 1. Calcula el porcentaje de individuos que no habiendo estado casados
nunca, tengan menos de 70 años y no padecen enfermedad contagiosa.

Indicación: es el cardinal de C
c
· B · E (Sol. 38%)

3. Espacio probabilístico asociado a un experimento aleatorio.
Idea intuitiva de probabilidad
♣ Al realizar N pruebas de un experimento aleatorio se llama frecuencia
absoluta del suceso A, n(A), al nº de veces que se ha verificado A.

La frecuencia relativa de un suceso A se define como el cociente entre su
frecuencia absoluta y el nº total de pruebas, es decir:


Ejercicio 2. Lanzar un dado 30 veces y calcula las frecuencia relativa del
suceso obtener un 6.

Propiedades:
1) La frecuencia relativa de cualquier suceso, A, es un nº racional del intervalo
[0,1], es decir 0≤ f(A) ≤ 1

2) f(E) = 1, la frecuencia relativa del suceso seguro es 1

3) Si A · B =Ø ¬ f (A B) = f(A) + f(B), es decir si dos sucesos son
incompatibles la frecuencia relativa de su unión es la suma de sus frecuencias
relativas.

La comprobación es inmediata.

COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 39 Ing. Antonio Torres Martínez
♣ Cuando se realiza un nº muy grande de pruebas puede comprobarse que la
frecuencia relativa de uno cualquiera de los sucesos tiende a estabilizarse. Esto
quiere decir que la frecuencia relativa toma valores próximos a un nº fijo, y que según
aumenta el nº de pruebas más se acerca a ese valor. A dicho valor es al que
llamaremos la probabilidad
[1]
de A, p(A)

p(A) = (probabilidad a posteriori).


Esta forma de asignar probabilidades tiene el inconveniente de puede variar de
unas series a otras, a pesar de la estabilidad de las frecuencias.

♣ Otra forma consiste en asignar una probabilidad a priori cuando se cumpla el
postulado de indiferencia o ley de la ignorancia
[2]
.

Ejemplo 14. Si el experimento es lanzar un dado, que no esté trucado, se
cumple dicho postulado, a cada resultado se le asigna como probabilidad a priori el
valor 1/6.

Probabilidad de Laplace
Cuando se pueda asegurar que se cumple el postulado de indiferencia, es
decir que todos los sucesos elementales sean igualmente posibles, se define:




Se conoce como la Regla de Laplace, el nº obtenido es la probabilidad a priori
o de Laplace.

Ejemplo 15. Consideremos el experimento lanzar dos monedas al aire. Vamos
a calcular la probabilidad del suceso, A, sacar una cara y una cruz.

El espacio muestral consta de cuatro sucesos elementales igualmente
“probables”:

CC, CF, FC y FF, luego p(A) =2/4 =1/2.

Ejercicio 3. Calcula la probabilidad de obtener dos 6 al lanzar dos dados.

Definición axiomática de probabilidad
Sea A un álgebra de Boole asociada a un experimento del espacio muestral
E, teniendo en cuenta

las propiedades de la frecuencia relativa se define:

Definición 7. Se llama probabilidad a una aplicación p: P(E) → [0,1]

A → p(A)

que cumple las siguientes condiciones, llamadas axiomas de probabilidad:





A la terna (E, A, p) se le llama espacio probabilístico asociado al experimento
en cuestión.


p(A) =
Número de casos favorables a A


Número de caso posibles

I. p (E) = 1.

II. Si A y B son incompatibles ¬ p(A B) = p(A) + p(B)
COLEGIO DE ESTUDIOS CIENTÍFICOS Y TECNLÓGICOS DEL ESTADO DE HIDALGO
Plantel “Emiliano Zapata” Tizayuca
Probabilidad y Estadística 40 Ing. Antonio Torres Martínez

Ejercicio 4. ¿Cuál es la probabilidad de que al tirar dos dados la suma de
puntos obtenidos sea >10?.

Consecuencias de los axiomas de probabilidad
1) p(A
c
) = 1 - p(A)

Ejemplo 16. De una baraja de 40 cartas extraemos dos cartas a la vez., ¿Cuál
es la probabilidad de que al menos una de ellas sea copas?.

Solución:
Sea A el suceso “al extraer dos cartas al menos una es copas”
Pasamos al contrario, A
c
, es decir calculamos la probabilidad de que ninguna
sea copas.
Sucesos posibles: , que son todos los grupos de 2 cartas que se pueden
sacar.
Sucesos favorables: pues hay 30 cartas que no son copas.
Por la regla de Laplace tenemos: p(A
c
) =
- 0,56 = 0,44

2) p(Ø) = 0 .
3) Si A c B ¬ p(A) ≤ p(B).
4) Si A y B son sucesos compatibles: p(A B) = p(A) + p(B) - p(A · B)
Ejemplo 17. Calcular la probabilidad de obtener un as ó una copa al extraer
una carta de una baraja española.

Solución: p(as ó copas) = 1/10 + 1/4 - 1/40 = 13/40.

Ejercicio 5. En una baraja hemos suprimido varias cartas. Entre las cartas que
nos quedan se dan las siguientes probabilidades de ser extraídas: p(R) = 0,15, p(B) =
0,3, p(carta que no sea ni rey ni basto) = 0,6. ¿Está entre ellas el rey de bastos?. En
caso afirmativo calcula su probabilidad.

Nota. El resultado puede generalizarse a 3 o más sucesos.

En particular si A, B y C son tres sucesos compatibles se verifica:

(1)

p(A B C) = p(A) + p(B) + p(C) - p(A· B) - p(A·C) - p(B·C) + p(A· B·C)