You are on page 1of 122

ÍNDICE TEMÁTICO

CAP. 1.- ¿ QUE ES ESTADÍSTICA ? 3


Introducción ; Estadística ; Usos y Abusos de la
Estadística; Introducción a los Términos Básicos;
Relación entre Probabilidad y Estadística; Examen
de Autoevaluación.

CAP. 2.- ELABORACIÓN DE CUADROS ESTADÍSTICOS 11


Introducción ; Toma de Datos ; Técnicas Estadísticas;
Frecuencias ; Concepto de Variable ; Intervalos ; Cua-
dro estadístico ; Ejercicios Propuestos.

CAP. 3.- GRÁFICAS ESTADÍSTICAS 30


Introducción ; Representaciones gráficas ; Histograma
ó diagrama de barras ; Polígono de frecuencias ; Diagra-
ma de Pastel ; Ojiva o curva de frecuencias ; Curva de
Lorenz ; Curvas de frecuencias ; Curva de la Distribución
Normal ; Examen de Autoevaluación

CAP. 4.- MEDIDAS DE TENDENCIA CENTRAL 42


La Media Aritmética; La Mediana; La Moda;
Comparación de la Media, la Mediana y la Moda;
Media Geométrica; Media Armónica; Media Ar-
mónica para datos agrupados; Ejercicios Propuestos.

CAP. 5.- MEDIDAS DE DISPERSIÓN 60


Medidas de Dispersión; Desviación estándar;
Varianza; Cálculo de la Media y Desviación
Estándar para Datos Agrupados; Interpretación
practica de la desviación estándar; Ejercicios
Propuestos.

CAP. 6.- PROBABILIDAD 76


Conjuntos y sus operaciones; ¿ Qué es Espacio
Muestral ?; Sucesos Simples y Compuestos;
Probabilidad; Axiomas de la Probabilidad;
Análisis Combinatorio; Probabilidad Condicional;
Independencia Probabilistica; Leyes de Probabili-
dad; Ejercicios Propuestos.
PROBABILIDAD Y ESTADÍSTICA

CAP. 7.- DISTRIBUCIONES DE PROBABILIDAD 98


Distribución Binomial; Distribución de Poisson;
Distribución Normal; Distribución t de Student;
Ejercicos Propuestos.

APÉNDICE : TABLAS DE PROBABILIDADES


Tabla 1 Distribución Normal 115
Tabla 2 Distribución t de Student 116
Tabla 3 Distribución Binomial 117
Tabla 4 Valores de e- x 119

BIBLIOGRAFÍA 120

1
PROBABILIDAD Y ESTADÍSTICA

PRESENTACIÓN

Tomando en consideración que los estudiantes deben contar con


los elementos necesarios para un curso, ya que esto les facilitaría el proceso
del aprendizaje, nos dimos a la tarea de elaborar los apuntes del curso de
PROBABILIDAD Y ESTADÍSTICA en el Nivel Medio Superior, mismos
que se elaboraron tomando en consideración la bibliografía actualizada
existente en está área. El contenido de este libro se determino en base a los
programas que rigen en el Nivel Medio Superior en la Universidad de Colima.

En este cuaderno de apuntes se ha tratado de evitar al máximo las


demostraciones áridas, que en muchas ocasiones en lugar de aclarar,
obscurecen más el panorama del lector.

El objetivo del cuaderno de apuntes (La superación académica),


es ambicioso y sería presuntuoso afirmar que materiales como el presente lo
satisfacen. Con este material se pretende que al final el alumno tenga las
herramientas necesarias para concentrar y representar información, y al
mismo tiempo tenga las bases necesarias para posteriores cursos en el Nivel
Superior.

Esperamos que este cuaderno sea de utilidad tanto para los


alumnos como para los maestros, esperando de estos últimos sus comentarios
al utilizarlo.

LOS AUTORES

2
PROBABILIDAD Y ESTADÍSTICA

INTRODUCCIÓN

Para tratar de predecir el resultado de una elección nacional, los


encuestadores entrevistan a un número predeterminado de personas en todo el
país y registran sus preferencias. Sobre la base de esta información se
construye una predicción. Problemas similares se encuentran en
investigaciones de mercado, en sociología, en la industria, etc.

La producción de una planta química depende de muchos


factores. Observando estos factores y la producción durante cierto periodo de
tiempo, podemos construir una ecuación de predicción que relacione a la
producción con los factores observados. Si usamos esas ecuaciones para
predecir la producción, la predicción raramente será igual a la verdadera
producción, esto es, la predicción casi siempre tendrá algún error.
Encontramos problemas similares en los campos de la educación, la
sociología, la psicología, las ciencias físicas y muchas otras ciencias. A estos
predictores se les llama estadísticos de prueba, que son la base de toda
investigación y desarrollo científico. Además de la predicción, el estadístico
también sirve para tomar decisiones acerca de poblaciones a partir de
resultados obtenidos de investigaciones desarrolladas a muestras o pequeñas
partes de la población.

La Estadística es una ciencia que es de gran utilidad y en la


actualidad nos es mucho más difícil mencionar algún lugar en el que la
Estadística no se aplique que uno en el que tenga una gran importancia. Por
ejemplo, las Universidades podrían desear predecir el rendimiento promedio
de los estudiantes universitarios, para lo cual sería necesario utilizar la

3
PROBABILIDAD Y ESTADÍSTICA

Estadística. Podría desearse comparar dos técnicas de enseñanza físicamente


distintas; podríamos considerar la inspección de artículos comprados en una
fabrica en donde la inspección podría consistir en seleccionar diez artículos
de cada lote y registrar el número de defectuosos, en donde, la decisión de
aceptar o rechazar el lote, podría basarse en el número de defectuosos
encontrados.

Los ejemplos anteriores son una muestra de lo importante que


resulta ser el estudio de la Estadística, por lo que en el presente curso se
presenta una definición de Estadística y se da una relación que existe con la
Probabilidad para poder hacer toma de decisiones respecto de investigaciones
desarrolladas.

ESTADÍSTICA
Es un lenguaje universal de la ciencia tanto en sus ramas físicas
como sociales, la comunicación y el uso de la Estadística nos permiten
comunicar más exactamente los descubrimientos en las investigaciones. La
Estadística es también un instrumento que utilizado con cuidado y precisión
nos permite describir nuestros resultados y adoptar decisiones respecto a lo
que nos dicen.

Aprender Estadística es algo simple y se llega a su comprensión total


por medio de ejercicios; en la Estadística intervienen números y letras como
parte de su lenguaje, además, la Estadística posee significados diversos para
personas de formaciones e intereses diversos. El campo de la Estadística se
divide ampliamente en dos ramas, que son: La Estadística descriptiva y la
Estadística Inferencial.

4
PROBABILIDAD Y ESTADÍSTICA

La Estadística Descriptiva está dedicada a la recolección,


descripción y presentación de datos numéricos. La Estadística Inferencial se
refiere a las técnicas de interpretar los valores que se obtienen a partir de las
técnicas descriptivas, además de las técnicas de tomar decisiones sobre la
base de los datos obtenidos.

Estadística es la ciencia de recolectar, clasificar, describir e


interpretar datos numéricos.

USOS Y ABUSOS DE LA ESTADÍSTICA

Las aplicaciones de la Estadística son ilimitadas, pues sería más


difícil nombrar un campo en donde no se utiliza la Estadística, que señalar
uno en donde la Estadística desempeñe un papel importante. Ejemplos sobre
la utilización de la Estadística:

1.- En la Educación se usa mucho para describir resultados de pruebas.

2.- En la ciencia los datos obtenidos en experimentos deben recogerse y


analizarse estadísticamente para tomar una decisión.

3.- Los gobiernos utilizan la Estadística para la recolección de información en


sus diversos campos.

Los abusos de la Estadística suelen ser muy pintorescos y a veces


ocasionan muchas dificultades, a numerosas personas les preocupa la lejanía
de las descripciones estadísticas y a otras les preocupa toda la información
(dependiendo de sus necesidades) debido a que creen que es falsa, y sin
embargo, la mayoría de las mentiras estadísticas se deben a:
1.- La utilización de valores estadísticos inadecuados.
2.- Utilización de enunciados abiertos y no explícitos.

5
PROBABILIDAD Y ESTADÍSTICA

3.- Utilización de datos derivados de un diseño experimental defectuoso.


4.- Una mala presentación de resultados.
Todos estos factores comunes acarrean una sola consecuencia, que
es la mala concepción de la información por parte del investigador.

INTRODUCCIÓN A LOS TÉRMINOS BÁSICOS


Para estudiar Estadística debemos ser capaces de hablar su lenguaje,
por lo que definiremos primeramente sus términos básicos:

1.- POBLACIÓN : Colección completa de individuos, objetos o medidas que


tienen una característica en común, el concepto de Población es la idea
fundamental más importante de la Estadística. La Población debe definirse
cuidadosamente en cada caso a fin de poder determinar la preferencia de ella.

2.- MUESTRA : Es un subconjunto de la población, es decir, una Muestra se


compone de algunos de los individuos, objetos o medidas que componen la
población.

3.- VARIABLE DE RESPUESTA : Es una característica individual de cada


elemento de la población o de una muestra; por ejemplo: la edad de un
alumno al ingresar a la Universidad, el color del pelo, su estatura, su peso,
etc., son Variables de Respuesta y el valor de la variable será la medida de la
característica que interese.

4.- PIEZA DE DATOS : El valor de la variable de respuesta asociado con


cada elemento, será la Pieza de Datos, por ejemplo: el coche es verde, Jorge
ingresó a la Universidad a la edad de 23 años. Si nos damos cuenta estamos
asignando a cada elemento su variable o característica.

6
PROBABILIDAD Y ESTADÍSTICA

5.- DATOS : Comprende el conjunto de valores asignados a la variable de


respuesta para cada elemento perteneciente a la muestra.

6.- EXPERIMENTO : Es una actividad planificada cuyos resultados nos


producen un conjunto de datos.

7.- PARÁMETRO : Es una característica medida de una población completa,


por ejemplo: la proporción de alumnos de más de 21 años que ingresan a la
Universidad. En Estadística se asignan símbolos del alfabeto griego para
designar un Parámetro.

8.- ESTADÍSTICO : Es la medida de una característica relativa a la muestra,


al valor promedio de los datos y la imagen de éstos; la mayoría de los
Estadísticos muestrales se encuentran por medio de fórmulas y suelen
asignárseles símbolos del alfabeto latino.

Fundamentalmente existen dos clases de datos, los que presentan


información cualitativa y los datos consistentes en información cuantitativa.
Los que están dentro de los cualitativos se llaman Datos de Atributo, mientras
que los cuantitativos se dividen en Discretos y Continuos.
DATOS

CUALITATIVOS CUANTITATIVOS

ATRIBUTO DISCRETOS CONTINUOS

7
PROBABILIDAD Y ESTADÍSTICA

Los Datos de Atributo o Cualitativos son los que agrupan a una


muestra en características semejantes, pero no tienen medidas numéricas.
Los Datos Cuantitativos se dividen en:

Discretos : Son los datos que resultan de un conteo o una simple observación.
Continuos : Son los datos que se obtienen cuando la medida es un proceso
infinito.

RELACIÓN ENTRE PROBABILIDAD Y


ESTADÍSTICA

La Probabilidad y Estadística son dos campos distintos aunque

relacionados entre sí, en las matemáticas, se dice a veces que la Probabilidad

es el vehículo de la Estadística es decir, de no ser por las leyes de

Probabilidad, no existirían las teorías estadísticas, así que investigaremos la

diferencia entre estas dos ramas del árbol matemático. Observaremos un

ejemplo o modelo de dos cajas:

10 FICHAS

5 ROJAS

PROBABILIDAD 3 VERDES ESTADÍSTICA ? ? ? ?

2 AMARILLAS

En la caja de Probabilidad hay 10 fichas ( 5 Rojas, 3 Verdes y 2


Amarillas ), en el terreno de la Probabilidad se intenta responder preguntas;
por ejemplo, ¿ Cuál es la probabilidad de que si se saca una ficha de la caja,
sea Roja ?, ¿ Cuál es la probabilidad de la ocurrencia de un evento ?, por otra

8
PROBABILIDAD Y ESTADÍSTICA

parte, dentro de la Estadística necesitaremos extraer una muestra de ella para


hacernos conjeturas sobre lo que en ella existe. Por lo que se podría decir
como diferencia bien marcada entre una y otra, lo siguiente: " La Probabilidad
estudia la oportunidad de que algo ocurra, cuando se conocen las
posibilidades; mientras que la Estadística pregunta, cuales son esas
posibilidades a partir de los resultados de una muestra ".

EXAMEN DE AUTOEVALUACIÓN

1.- ¿Qué es la Estadística?

2.- Dé tres ejemplos en donde se utilice la Estadística.

3.- Explique los factores que ocasionan un mal uso de la Estadística.

4.- Mencione los ocho términos básicos de la Estadística.


5.- Defina los siguientes términos en base a lo que usted comprenda:
Población, Muestra, Pieza de Datos, Parámetro.

6.- Mencione como se clasifican los datos y defínalos.

7.- ¿ Qué relación existe entre la Probabilidad y la Estadística?.

8.- Suponga que desea obtener una estimación del consumo de gasolina
(Km por litro) del FORD COUGAR. Describa la población que sería de
interés para usted, de la cual tendría que seleccionar la muestra.

9
PROBABILIDAD Y ESTADÍSTICA

9.- Un investigador médico desea estimar el tiempo de supervivencia de un


paciente después de la aparición de un tipo particular de cáncer y después de
un régimen particular de radioterapia. Identifique la población de interés para
el investigador médico. ¿ Puede percibir algún problema en el muestreo de
esta población ?

10.- Suponga que usted es un candidato para la legislatura y que desea


evaluar la opinión de los votantes respecto a sus posibilidades de ganar.
Identifique la población de interés para usted y de la cual desearía seleccionar
su muestra.

10
PROBABILIDAD Y ESTADÍSTICA

INTRODUCCIÓN

Como veremos más adelante, el análisis estadístico de datos


requiere numerosas operaciones aritméticas, y sería muy tedioso describir
todas estas operaciones con palabras. La solución de esta dificultad es
expresar las operaciones en términos de una o más fórmulas. Entonces, para
analizar un conjunto dado de datos muéstrales se sustituirían las mediciones
muéstrales en el conjunto apropiado de fórmulas.

Una de las operaciones mas comunes en el análisis estadístico de


datos es el proceso de sumas (adición). Por lo tanto necesitaremos un símbolo
para indicarle que sume las mediciones muéstrales, o que sume un conjunto
de números calculados a partir de las mediciones muéstrales. Este símbolo,
llamado sumatoria, puede ser muy familiar para algunos y completamente
nuevo para otros (  ).

A continuación presentaremos algunos conceptos necesarios para


la elaboración de cuadros estadísticos, conceptos como frecuencia, frecuencia
relativa, frecuencia acumulada, etc.

TOMA DE DATOS
Si tuviéramos la población frente a nosotros, ¿ cómo podríamos
describir este subconjunto grande de mediciones ?. Muchos textos se han
dedicado a los métodos de la estadística descriptiva, es decir, a los métodos
para describir conjuntos de datos numéricos.

11
PROBABILIDAD Y ESTADÍSTICA

Esencialmente estos métodos se pueden clasificar como métodos


gráficos y métodos numéricos. En este texto hablaremos de los dos métodos
para describir información, y comenzaremos con el método numérico, el cual
se basa esencialmente en la recolección de datos para presentarlos en un
cuadro estadístico, cuadro en el que nosotros podremos leer la información
que se encontraba dispersa en la muestra o población. En la actualidad es muy
común encontrarnos con cuadros estadísticos, y lo más general es la
presentación de información en los distintos medios de comunicación de las
posiciones que ocupan los distintos equipos en los diferentes deportes.

TÉCNICAS ESTADÍSTICAS

Las técnicas estadísticas, los gráficos, las distribuciones de


frecuencias, promedios, etc., son términos de indudable valor práctico para la
descripción de los datos. Sin embargo la mayor utilidad estadística se
encuentra en el análisis de los datos numéricos.

El análisis de los datos numéricos por técnicas estadísticas es


una expresión abstracta. La característica esencial común a todas las técnicas
es el elemento de inferencia estadística, que se define como un proceso de
inducción lógica, que partiendo de los datos establece un juicio sobre todo el
conjunto, obteniéndose una medida de la incertidumbre para la consecuencia
que se infiere. Por ejemplo; consideremos el problema de estimar la
proporción de votos a favor de una determinada propuesta o candidato, se
toma una muestra de los votantes y se calcula la proporción de los que lo
hacen a favor de un sólo candidato, suponiendo que el 60% de la muestra

12
PROBABILIDAD Y ESTADÍSTICA

vota a favor de un candidato, entonces, se infiere que el 60% de todos los


votantes están a favor de ese candidato.

En otras palabras, hay un grado de incertidumbre vinculado a la


conclusión cuya medición se obtiene aplicando las técnicas estadísticas. La
Estadística reúne un conjunto de procedimientos para describir y analizar los
datos de diversas disciplinas, ésta debe ser neutral y por ello puede emplearse
la misma técnica de muestreo en economía, finanzas, educación, ingeniería,
y otras. Sin embargo, la Estadística ha elaborado técnicas peculiares para
cada campo de aplicación.

Por lo que podemos concluir que las TÉCNICAS-


ESTADÍSTICAS se basan en: la recolección de datos, los gráficos, las
frecuencias, los promedios, etc. En los negocios la Estadística ha
desarrollado técnicas como las de: Índices de Precios, Sucesiones, Series de
Tiempo, y otras. En las ciencias biológicas alcanzan el más alto nivel e
interés las técnicas para el diseño de experimentos. Mientras que en la
Industria se desarrollan técnicas para el control de calidad.

Así como se enunciaron anteriormente algunas ramas en las que


tiene aplicación la Estadística y en las cuales se han desarrollado técnicas
peculiares para cada una, podríamos mencionar algunas otras, pero con la
práctica nos daremos cuenta de cómo es el desarrollo en ellas.

FRECUENCIAS
Antes de comenzar con la distribución de frecuencias, será
conveniente definir el vocablo Frecuencia, ya que se ha mencionado con

13
PROBABILIDAD Y ESTADÍSTICA

anterioridad, sin embargo, no ha sido definido. Así mismo se hará una


clasificación de los tipos de frecuencias utilizados en la Estadística.

FRECUENCIA: Es el número total de repeticiones de un


elemento determinado, en una muestra o población. Existen varios tipos de
frecuencias a saber: Frecuencia de clase, Frecuencia relativa, Frecuencia
acumulada, Frecuencia relativa acumulada, etc. Para los objetivos que se
persiguen en este curso, definiremos las frecuencias de datos agrupados.

FRECUENCIA RELATIVA: Es el tanto por ciento o porcentaje


correspondiente a cada intervalo de clase. La manera de obtenerla es
dividiendo el número de elementos de esa clase entre el número total de
elementos de la muestra o población. La frecuencia relativa tiene gran
utilidad, ya que puede especificarnos el porcentaje de ocurrencia de un evento
dentro de una muestra, la elaboración de gráficas estadísticas, etc.. Por
ejemplo: la distribución de presupuestos por áreas, el porcentaje de
producción de ciertos productos, la distribución por edades de ciertas
poblaciones, etc.

FRECUENCIA ACUMULADA: Esta frecuencia se obtiene al sumar a


la frecuencia de cada clase, las frecuencias de las clases anteriores a ella. Las
frecuencias de las demás clases serán la suma sucesiva de las frecuencias de
las clases anteriores, de tal forma que en la última clase se tendrá una
frecuencia igual al tamaño de la muestra o población.

FRECUENCIA RELATIVA ACUMULADA: Se sigue el mismo


procedimiento que en la frecuencia acumulada, sólo que en este caso se toma
como base la frecuencia relativa, expresándose como porcentaje.

14
PROBABILIDAD Y ESTADÍSTICA

CONCEPTO DE VARIABLE

Consideremos la desigualdad X + 2 > 5, los valores de X que


satisfacen dicha desigualdad son todos los valores mayores que 3, dado que:
X+2>5
X>5-2
X>3
como X > 3, entonces X puede ser: 4, 5, 6, ...

X se llama variable porque toma distintos valores posibles


dentro de la desigualdad ( por lo que se dice que una variable es aquella que
puede tomar distintos posibles valores dentro de un suceso ).

Desde los tiempos más remotos dos tendencias opuestas, a veces


colaborando la una con la otra, han gobernado todo el desarrollo de la
matemática. Estas dos son el dominio de lo continuo y lo discreto. Una de las
grandes tareas de la matemática actual consiste en armonizar lo continuo y lo
discreto para incluirlos en una matemática única y para iluminar la oscuridad
de ambas.

Siguiendo con el concepto de variable, veremos que una variable


discreta es una regla bien definida para asignar valores numéricos a todos los
resultados posibles de un experimento. Lo anterior significa que una variable
aleatoria discreta es aquella que se asocia a todo experimento siempre y
cuando el conteo sea finito o infinito numerable y con datos numéricos
enteros.

Una variable continua es aquella cuyos valores posibles no tienen


interrupción, es decir, son aquellos valores que podemos obtener no mediante
un conteo o simple observación, si no mediante observaciones más concretas

15
PROBABILIDAD Y ESTADÍSTICA

y sus valores son no numerables (Los Reales). Veamos algunos ejemplos


sobre lo anterior:

a) Los posibles resultados de lanzar un dado normal.


S = { 1, 2, 3, 4, 5, 6 }
Es discreto por poderse obtener por un conteo.

b) Lanzar una moneda normal hasta que caiga sol.


S = { 1, 2, 3, 4, ... , n }
Es discreto por ser un proceso infinito numerable.

c) La cantidad de descargue de un Río hacia el Océano.

Es continua, ya que es imposible determinarlo por un conteo o por


una simple observación, y se requiere de un método más concreto para
estimarlo.

INTERVALOS

Es importante que repasemos un concepto ya manejado en


matemáticas, como es el de INTERVALO, ya que con el será necesario
trabajar en la formación de cuadros estadísticos, en donde hablaremos de
intervalos de clases, por lo que definimos lo siguiente:

“ Un intervalo de clase es aquel que contiene a una cierta


cantidad de elementos de la muestra o población ”, por ejemplo, el número de
alumnos que obtienen una calificación entre 5 y 8, en este ejemplo, el
intervalo es [5, 8], y como frecuencia contendrá a todos los alumnos que

16
PROBABILIDAD Y ESTADÍSTICA

hayan obtenido esas calificaciones, el 5 recibe el nombre de límite inferior


del intervalo y el 8 el de límite superior del intervalo. En la construcción de
cuadros estadísticos será necesario este concepto en la formación de clases.

CUADRO ESTADÍSTICO
El cuadro estadístico más usual es aquél en el que se representa
el número total de clases o de variables, con el número de elementos
correspondientes a cada uno, llamándose a esto frecuencia, así mismo,
veremos cuadros estadísticos en los que tendremos frecuencias acumuladas
(Suma de los elementos anteriores a la clase), frecuencia relativa (porcentaje
de cada clase con respecto a la muestra), frecuencia relativa acumulada,
marcas de clases, desviaciones medias, mediana, etc.

A continuación se presenta una forma de distribución en un


cuadro estadístico:

CLASE o FRECUENCIA FRECUENCIA FRECUENCIA FREC. REL.


VARIABLE ACUMULADA RELATIVA ACUMULADA
30 - 36 6 6 6/14 6/14
37 - 43 5 11 5/14 11/14
44 - 50 3 14 3/14 14/14
TOTAL 14 14/14

A continuación se muestra un conjunto de datos, con los que


vamos a elaborar un cuadro estadístico:
30 42 50 73 60 63
38 27 67 83 70 63
52 83 97 49 83 73
30 35 63 59 84 75
84 90 80 95 85 68

17
PROBABILIDAD Y ESTADÍSTICA

Para formar un cuadro estadístico es necesario primeramente


ordenar todos los elementos de la muestra en forma ascendente, para después
agruparlos en clases.

27 42 60 67 75 84
30 49 60 68 80 85
30 50 63 70 83 90
35 52 63 73 83 95
38 59 63 73 83 97

Para elegir el número de clases se deben observar ciertos


criterios; se debe evitar que queden demasiados elementos en una clase, así
como también clases sin elementos. Una clase con demasiados elementos
oculta información que en ocasiones es indispensable para el estadístico y una
clase vacía ocasiona problemas a la hora de calcular las medidas estadísticas.
Se recomienda un mínimo de 5 clases y un máximo de 20 clases,
dependiendo del número de elementos de la muestra y de lo disperso que se
encuentren. Es recomendable tomar entre 5 y 9 clases cuando la muestra
cuenta con menos de 50 elementos y entre 10 y 20 cuando tenga más de 50
elementos.

Para obtener el número de clases existen dos formas, una


conocida como forma empírica y otra de fórmula general. A continuación
enunciaremos la forma empírica:

Elemento máximo - Elemento mínimo  1


Número de Clases =
Intervalo de Clase

18
PROBABILIDAD Y ESTADÍSTICA

En este caso, dependiendo del número de elementos con que


cuente la muestra, se elige un Intervalo de clase y se realiza la operación
anterior para obtener el número de clases que se deben de colocar en el cuadro
estadístico, pero pudiese en lugar de elegir el Intervalo de clase, escogerse el
número de clases que se desean, entonces se aplicaría la siguiente fórmula:

Elemento máximo - Elemento mínimo  1


Intervalo de Clase =
Número de Clases

Ahora bien, si no se desea de esta manera se utiliza la fórmula


general, la cual se aplicará de la siguiente manera:

Si se tienen menos de 50 elementos en la muestra, el número de


clases se obtiene con la siguiente fórmula:

No. de Clases = 1 + 3.3 log N

pero si se tienen más de 50 elementos, entonces se utiliza:

No. de Clases = 3 + 3.3 log N

Continuando con el ejemplo anterior, procedemos a calcular el


número de clases en forma empírica para elaborar el cuadro estadístico.

Como el número de elementos es 30, escogemos un número en


forma aleatoria para el Intervalo de Clase o Amplitud de Clase de 9. Ahora
bien, aplicando la fórmula presentada para el número de clases, tenemos:

Elem. Má x. - Elem. Mín. + 1 97 - 27 + 1 71


No. de clases = = = = 7.88
Int. de Clase 9 9

como podemos ver tenemos 7.88 clases, pero debido a tener una porción de
una clase más, debemos incrementar o redondear a el inmediato superior,

19
PROBABILIDAD Y ESTADÍSTICA

teniendo entonces que el número de clases a utilizar será de 8 clases ya que


si utilizáramos 7 clases, tendríamos al final un valor que no entraría en el
número de clases escogidas para la colección de datos.

Para hacer una comparación entre el método empírico y la forma


general, aplicaremos la fórmula.

No. de clases = 1 + 3.3 log N

teniéndose al sustituir N = 30 lo siguiente:

No. de clases = 1 + 3.3 log(30)


= 1 + 3.3 (1.4771)
= 1 + 4.87 = 5.87

en este caso aproximaríamos a 6 clases y procederíamos a calcular el


Intervalo de Clase o Amplitud de Clase. El hecho de que en un procedimiento
se tengan 8 clases y en el otro 6 clases no afecta a los cálculos que el
estadístico hará, con lo que podemos decir que el estadista utilizará el método
que considere más práctico para sus fines.

Para elaborar el cuadro estadístico es necesario formar los


intervalos de clases, por lo que debemos escoger los límites inferior y superior
de los intervalos de clase de la siguiente manera: En la primera clase
tomamos el menor elemento de la colección de datos como el límite inferior
de esta clase, que es 27, para obtener el límite superior de la primera clase
debemos sumar 9 a el 27 debido a que el Intervalo de Clase es 9 (por que
estamos utilizando el método empírico ), teniéndose entonces que el límite
superior de la primera clase es 35. De esta manera tenemos que el Intervalo de
Clase de la primera clase es de 27 a 35, en este intervalo aparentemente

20
PROBABILIDAD Y ESTADÍSTICA

tenemos un intervalo de clase de 8, sin embargo debemos tomar en cuenta que


los extremos del intervalo están incluidos en él, teniéndose que del número 27
a el número 35 existen 9 unidades, que para mayor entendimiento lo
desarrollamos a continuación.

27 28 29 30 31 32 33 34 35

en donde claramente se ve que son 9. Ahora bien, para obtener el conteo de


cada intervalo o frecuencia de clase, debemos observar en la colección
original de datos cuantos elementos se encuentran en ese intervalo,
teniéndose que en este intervalo se encuentran los siguientes elementos de la
colección de datos, 27, 30, 30 y 35.

Para formar el Intervalo de Clase de la clase 2, tomamos el


inmediato superior a el límite superior de clase de la primera clase para
obtener el límite inferior de clase de la segunda clase ( Si la colección de
datos son números enteros, se suma uno a el límite superior de clase para
obtener el límite inferior de la clase siguiente, si la colección de datos es en
decimales se suma una unidad correspondiente a los decimales), por lo tanto
el intervalo de clase de la clase 2 inicia en 36 que al sumarle 9 y restarle 1
debido a que están incluidos los extremos tenemos que el límite superior de la
clase dos es 44 y en este intervalo los elementos de la colección original que
se encuentran son 38 y 42.

De la misma forma que se obtuvieron los intervalos de clase de


las clases 1 y 2 lo hacemos para las clases restantes de esta colección de datos.

21
PROBABILIDAD Y ESTADÍSTICA

Anteriormente en este capítulo definimos los conceptos de


frecuencia, frecuencia acumulada, frecuencia relativa y frecuencia relativa
acumulada, por lo tanto procederemos a explicar como se obtiene cada una
para poder terminar con nuestro cuadro estadístico. Para obtener la frecuencia
acumulada se deben tomar como referencia los límites superiores de clase; de
lo anterior tenemos que hasta el límite superior de la clase 1 (35) existen 4
datos; hasta el límite superior de la clase 2 (44) los datos que van son 6; para
el límite superior de la clase 3 (53) los datos acumulados de las clases es 9 y
asi sucesivamente hasta la última clase que deberá contener a la totalidad de
elementos. Con la explicación anterior concluimos que la frecuencia
acumulada se obtiene sumando a la frecuencia de clase la frecuencia de las
clases anteriores.

En lo que se refiere a la frecuencia relativa, tenemos que en cada


clase debemos especificar en razón a cuantos elementos tiene el intervalo de
clase con respecto a la colección total de datos, para el intervalo de clase 1
tenemos que la razón de elementos es 4/30 ( 4 de 30 ), para el intervalo de
clase 2 la razón es 2/30 ( 2 de 30 ) y así sucesivamente hasta la última clase.
Para las frecuencias relativas acumuladas se tienen que obtener las razones
acumuladas en cada intervalo de clase especificando que la última clase
deberá contener al total de elementos, por lo cual deberá aparecer la unidad.

Un punto más que debe aparecer en el cuadro estadístico es la


marca de clase, la cual nos servirá para elaborar las gráficas estadísticas en el
capítulo 3. La marca de clase se obtiene sumando el límite inferior de clase
con el límite superior de la misma clase y dividiendo entre dos, así para el

22
PROBABILIDAD Y ESTADÍSTICA

27  35
intervalo de clase 1, su marca de clase es  31, para el intervalo de
2

clase 2 su marca de clase es 40 y así sucesivamente.

En base a todos los datos obtenidos anteriormente, procedemos a


desarrollar nuestro cuadro estadístico, el cual queda de la siguiente manera:
Número Intervalo de Frecuencia Frecuencia Frecuencia Frecuencia Marca de
de Clase Acumulada Relativa Rel. Acum. Clase
Clase
1 27 - 35 4 4 4 / 30 4 / 30 31
2 36 - 44 2 6 2 / 30 6 / 30 40
3 45 - 53 3 9 3 / 30 9 / 30 49
4 54 - 62 3 12 3 / 30 12 / 30 58
5 63 - 71 6 18 6 / 30 18 / 30 67
6 72 - 80 4 22 4 / 30 22 / 30 76
7 81 - 89 5 27 5 / 30 27 / 30 85
8 90 - 98 3 30 3 / 30 30 / 30 94
Totales 30 30 / 30

Cuando se obtienen más de 20 clases por el método empírico al


escoger aleatoriamente el Intervalo de Clase o Amplitud de Clase, entonces
se recomienda usar el método general, debido a que se pueden obtener malos
resultados a causa de la dispersión de datos que existirá entre ellos.

Ejemplo: Con la siguiente distribución:


6 42 49 6 52 36 8 32 33 9
53 33 12 31 41 8 50 50 23 41
32 11 49 10 15 28 31 13 48 9
17 9 27 15 41 32 7 28 17 13
47 6 35 47 15 53 5 42 53 27
que nos muestra las edades de una comunidad, elaborar: Un cuadro
estadístico, especificando las Clases, Frecuencia, Frecuencia Relativa y la
Frecuencia Acumulada.

23
PROBABILIDAD Y ESTADÍSTICA

Primero ordenamos los datos:

5 8 10 15 23 31 33 41 47 50
6 8 11 15 27 31 33 41 48 52
6 9 12 15 27 32 35 42 49 53
6 9 13 17 28 32 36 42 49 53
7 9 13 17 28 32 41 47 50 53

ahora calculamos el Intervalo de Clases eligiendo un número de


clase igual a 9
Intervalo de Clase = (53 - 5 + 1) / 9 = 5.44

con estos datos elaboramos el cuadro estadístico, con 9 clases y un Intervalo


de Clase de 6.
# Clase Int. Clase Frecuencia Frec. Acum. Frec. Rel. Frec. R. A. Marca de
Clase
1 5 - 10 11 11 0.22 0.22 7.5
2 11 - 16 7 18 0.14 0.36 13.5
3 17 - 22 2 20 0.04 0.40 19.5
4 23 - 28 5 25 0.10 0.50 25.5
5 29 - 34 7 32 0.14 0.64 31.5
6 35 - 40 2 34 0.04 0.68 37.5
7 41 - 46 5 39 0.10 0.78 43.5
8 47 - 52 8 47 0.16 0.94 49.5
9 53 - 58 3 50 0.06 1.00 55.5
Totales 50 1.00

Para elaborar las gráficas estadísticas es necesario conocer


además de la marca de clase, los límites reales de clases.
Lim. Sup. de la Clase (n)  Lim. Inf. de la Clase (n  1)
L.R.C. =
2
( L.R.C. = Límite Real de Clase )

24
PROBABILIDAD Y ESTADÍSTICA

CUADRO ESTADÍSTICO CON LIMITES REALES DE CLASE


Número Intervalo de Intervalo de Clase Frecuencia Marca de Clase
de Clase Clase con Limites Reales
1 5 - 10 4.5 - 10.5 11 7.5
2 11 - 16 10.5 - 16.5 7 13.5
3 17 - 22 16.5 - 22.5 2 19.5
4 23 - 28 22.5 - 28.5 5 25.5
5 29 - 34 28.5 - 34.5 7 31.5
6 35 - 40 34.5 - 40.5 2 37.5
7 41 - 46 40.5 - 46.5 5 43.5
8 47 - 52 46.5 - 52.5 8 49.5
9 53 - 58 52.5 - 58.5 3 55.5

En el capítulo tres veremos de la necesidad de utilizar cuadros


estadísticos como el anterior para la elaboración de gráficas estadísticas. A
continuación presentamos una serie de ejercicios resueltos referentes a este
capítulo.

* Evalué las siguientes sumas:


5 6
a)  (y - 4) = b)  (y 2 - 5) =
y=0 y=2

4 3
c)  (yi - 2) = d)  (y + 2i) =
i=1 i=1

5
a)  (y - 4) = (0 - 4) + (1 - 4) + (2 - 4) + (3 - 4) + (4 - 4) + (5 - 4)
y=0

= -4 - 3 - 2 - 1 + 0 + 1 = -9

como podemos observar, se fue sustituyendo en el lugar de y el valor


consecutivo desde el cero hasta el máximo valor que era el 5. Lo hecho
anteriormente es similar para los incisos b), c) y d).

25
PROBABILIDAD Y ESTADÍSTICA

6
b)  (y 2 - 5) = (4 - 5) + (9 - 5) + (16 - 5) + (25 - 5) + (36 - 5)
y=2

= - 1 + 4 + 11 + 20 + 31 = 65

4
c)  (yi - 2) = (y1 - 2) + (y2 - 2) + (y3 - 2) + (y4 - 2)
i=1

= y1 + y2 + y3 + y4 - 8

3
d)  (y + 2i) = [y + 2(1)] + [y + 2(2)] + [y + 2(3)] = 3y + 12
i=1

* Si y es la variable de posición de una sucesión y la


fórmula para el elemento típico es y2 - 1:
a) Escriba los primeros cuatro elementos de la sucesión.
Los primeros cuatro elementos son:
si y = 1 entonces : (1)2 - 1 = 0 primer elemento
si y = 2 entonces : (2)2 - 1 = 3 segundo elemento
si y = 3 entonces : (3)2 - 1 = 8 tercer elemento
si y = 4 entonces : (4)2 - 1 = 15 cuarto elemento
b) Use el signo de sumatoria para escribir una expresión para la suma de
4
los primeros cuatro elementos. La fórmula de sumatoria es :  (y2 - 1)
y=1

c) Encuentre la suma de los primeros cuatro números.


4

 (y2 - 1) = [(1)2 - 1] + [(2)2 - 1] + [(3)2 - 1] + [(4)2 - 1]


y=1

= 0 + 3 + 8 + 15 = 26

26
PROBABILIDAD Y ESTADÍSTICA

* Para estimar la pérdida semanal debida a robos, una tienda


de ropas registró el total en nuevos pesos de las pérdidas durante un período
de 10 semanas. Estas pérdidas, redondeadas a la decena más cercana fueron:
y1 = 360.00 y2 = 430.00 y3 = 210.00 y4 = 320.00 y5 = 550.00
y6 = 170.00 y7 = 240.00 y8 = 370.00 y9 = 280.00 y10 = 290.00
10
a) Encuentre  yi = 360 + 430 + 210 + 320 + 550 + 170 + 240 + 370
i=1

+ 280 + 290 = 3,220.00


4 4
b) Encuentre: i)  yi ii)  yi2
i=2 i=2

4
i)  yi = 430.00 + 210.00 + 320.00 = 960.00
i=2

4
ii)  yi2 = (430.00)2 + (210.00)2 + (320.00)2 = 331,400.00
i=2

* Dados el siguiente conjunto de elementos:


16 19 17 8 11 9 14 8
11 13 19 17 7 6 5 9
16 8 9 13 12 17 16 14
9 16 15 18 6 8 5 7
16 17 13 9 7 5 7 11
elaborar un cuadro estadístico en el podamos observar la frecuencia,
frecuencia acumulada, frecuencia relativa, frecuencia relativa acumulada,
marca de clase, amplitud de clase y límites reales de clase.

Primero procederemos a ordenar los datos presentados


anteriormente:
5 7 8 9 11 14 16 17
5 7 8 9 12 14 16 17
5 7 8 9 13 15 16 18
6 7 9 11 13 16 17 19

27
PROBABILIDAD Y ESTADÍSTICA

6 8 9 11 13 16 17 19

como tenemos 40 elementos en la muestra, aplicaremos la fórmula de menos


de 50 elementos:
Num. de Clases = 1 + 3.3 log N
Num. de Clases = 1 + 3.3 log (40)
Num. de Clases = 1 + 3.3(1.602)
Num. de Clases = 1 + 5.28 = 6.28
como tenemos 6.28 clases, redondeamos al inmediato inferior, por lo que
utilizaremos 6 clases para la distribución anterior. Con 6 clases, el intervalo
de clase será:
Int. de Clase = ( 19 - 5 + 1 ) / 6 = 2.5

como el intervalo de clase es un número no entero, utilizaremos 3 como


intervalo de clase, y entonces el número de clases será 5, quedando nuestro
cuadro estadístico de la siguiente manera:
# de C Intervalo Int. Clase Frecuencia Frecuencia Frecuencia Frec. Rel. Marca de
de Clase Lim. Real relativa Acumulada Acumulada Clase
1 5-7 4.5 - 7.5 9 0.225 9 0.225 6
2 8 - 10 7.5 - 10.5 9 0.225 18 0.450 9
3 11 - 13 10.5 - 13.5 7 0.175 25 0.625 12
4 14 - 16 13.5 - 16.5 8 0.200 33 0.825 15
5 17 - 19 16.5 - 19.5 7 0.175 40 1.000 18
Totales 40 1.000

los límites reales se obtuvieron aplicando la relación de la página 23 vista en


este capítulo.

28
PROBABILIDAD Y ESTADÍSTICA

EJERCICIOS PROPUESTOS

1.- Defina los siguientes conceptos:


a) Frecuencia
b) Frecuencia Relativa
c) Cuadro Estadístico.
d) Amplitud de Clase.

2.- Las calificaciones de 50 alumnos de la materia de Matemáticas son:

2 8 5 2 7 2 5 5 5 6
1 6 2 3 6 7 7 6 3 3
4 3 4 8 1 4 5 2 7 5
5 4 4 6 6 3 8 3 7 1
8 8 3 2 3 8 6 2 7 2
Formar un cuadro estadístico con toda la información manejada
en este capítulo.

3.- Evalúe las siguientes sumas:


3
a)  y3
y=1

3
b)  ( 1 + 2x + x2 )
x=1

3
c)  ( x3 + 2x )
x=0

29
PROBABILIDAD Y ESTADÍSTICA

INTRODUCCIÓN
Es natural introducir los métodos gráficos para describir
conjuntos de datos a través de la consideración de un conjunto real de datos.
Anteriormente vimos el análisis de datos por métodos numéricos, métodos
con los que nosotros podemos leer información respecto a promedios,
poblaciones, etc. En los cuadros estadísticos se habló de clases y variables,
ahora podremos representar gráficamente esas clases o variables y a ello es lo
que llamaremos métodos estadísticos gráficos. Note que en los extremos de
los subintervalos o clases se han escogido de manera que ningún elemento
coincida con dos subintervalos o clases a la vez, eliminando así cualquier
ambigüedad relacionada con la ubicación de una observación particular. Justo
con los cuadros estadísticos vistos en el capítulo anterior es con los que
deberemos elaborar nuestras gráficas estadísticas para el desarrollo de los
métodos gráficos.

REPRESENTACIONES GRÁFICAS

En muchos casos una representación gráfica de una tabla de

frecuencias da una información concisa y clara de una distribución de

frecuencias. Son cuatro los tipos de representaciones gráficas más usuales,

también existen dos tipos de representación gráfica no muy común y que sin

embargo se deben de conocer; las representaciones gráficas son :

1.- Histograma ó Diagrama de Barras.


2.- Polígono de frecuencias.
3.- Diagrama de Pastel.
4.- Ojiva o Curva de frecuencias.

30
PROBABILIDAD Y ESTADÍSTICA

Los dos tipos de gráficas no muy usuales son:


1.- Curva de Lorenz.

2.- Curva de la distribución Normal.

HISTOGRAMA ó DIAGRAMA DE BARRAS

Es aquel en el que se representan los datos mediante un plano

coordenado, en el eje horizontal o de abcisas anotaremos la amplitud de clase

o valor de la variable, mientras que en el eje vertical o de ordenadas se

anota el número de elementos o frecuencias de clase; existen dos formas de

presentar un histograma, por ejemplo, utilizando los datos del siguiente

cuadro tendríamos:

Int. de Clase 30-39 40-49 50-59 60-69 70-79 80-89 90-99 Total
Frecuencia 4 6 8 12 8 8 4 50

PRIMERA FORMA

31
PROBABILIDAD Y ESTADÍSTICA

SEGUNDA FORMA

POLÍGONO DE FRECUENCIAS

Se obtiene relacionando la marca de clase (punto medio de cada


intervalo) con su frecuencia respectiva. Ahora bien, para poder formar el
polígono de frecuencias es necesario tomar una clase antes de la primera clase
y una clase después de la última clase ambas con frecuencia cero, de esta
manera al unir todos los puntos de relación marca de clase con frecuencia
quedara formado el polígono respectivo. Veamos un polígono de frecuencias
en base al siguiente cuadro estadístico. Las marcas de clase se obtienen como
se menciono en el capítulo 2.

Int. de Clase 30-39 40-49 50-59 60-69 70-79 80-89 90-99 Total
Frecuencia 4 6 8 12 8 8 4 50
Marca de Clase 34.5 44.5 54.5 64.5 74.5 84.5 94.5

32
PROBABILIDAD Y ESTADÍSTICA

DIAGRAMA DE PASTEL

Este diagrama se forma con la distribución de frecuencias


relativas y se llama así debido a su configuración, la forma de obtener las
rebanadas que le dan la forma de un pastel es multiplicando la frecuencia
relativa por 360 grados que es el número de grados que tiene una
circunferencia, su configuración es la siguiente:

Extracción de el estudiante Z. Urbana Z. Suburbana Z. Rural Totales


Frecuencia 240 1400 360 2000
Porcentaje ( % ) 12 70 18 100

33
PROBABILIDAD Y ESTADÍSTICA

OJIVA O CURVA DE FRECUENCIA ACUMULADA

Esta gráfica y distribución nos sirve para saber o poder


responder preguntas como las siguientes:

a) ¿Cuántos alumnos reciben calificaciones superiores a 60?


b) ¿Cuántos alumnos tienen calificaciones inferiores a 60?
Estas interrogantes en las que se desea conocer la frecuencia por
encima o por debajo de cierto valor de la variable, son preguntas muy visuales
en los distintos campos de la ciencia.
Variable Frecuencia Frec. Acum.
40 0 0
50 3 3
60 1 4
70 2 6
80 3 9
90 1 10
Totales 10

Si hiciéramos un histograma de frecuencias obtendríamos la


siguiente gráfica:

34
PROBABILIDAD Y ESTADÍSTICA

En base al mismo cuadro estadístico elaboraremos a continuación


un histograma de frecuencias acumuladas.

Sobre el mismo histograma de frecuencia acumulada podríamos


formar la curva u Ojiva, que es otra gráfica característica de la Estadística
Descriptiva, la cual se forma de la siguiente manera:

a).- Se eligirán los ejes coordenados en los cuales se especifica-


rán la clase (o variable) y la frecuencia acumulada.
b).- Si se trabaja con clases, para la formación de la Ojiva
utilizaremos los limites superiores de clase, mientras que si trabajamos con
variables, utilizaremos el punto donde se localiza la variable.

Tanto el histograma de frecuencia acumulada como la Ojiva son

utilizados en los cuadros estadísticos por clases o variables, veamos la gráfica

de una Ojiva.

35
PROBABILIDAD Y ESTADÍSTICA

Existe una curva más sobre frecuencia acumulada que toma el


nombre de Curva de Lorenz. La elaboración de esta curva se realiza de la
misma manera que la Ojiva, sólo que la unión entre puntos son líneas rectas,
además, de que se cierran los cuadros quedando la gráfica de la manera
siguiente:

36
PROBABILIDAD Y ESTADÍSTICA

Está curva no es muy utilizada en el campo de las Ciencias


Sociales, sin embargo, es muy importante dentro de las investigaciones en
Física, Matemáticas, Fisiología, Ingeniería, etc.

Las curvas de frecuencias son representaciones graficas de


distribuciones de frecuencias teóricas. Ciertas formas de curvas de
frecuencias reciben nombres específicos que guardan correspondencia con
tipos específicos de distribuciones de frecuencias. Existen cuatro tipos de
distribución correspondientes a estos tipos específicos, que son: La
distribución Rectangular, La distribución Normal, La distribución Asimétrica
y La distribución Bimodal. En este cuaderno hablaremos de la distribución
Normal o curva acampanada ya que será utilizada más adelante.

DISTRIBUCION NORMAL

Es una distribución simétrica alrededor de la media, con una


curva de frecuencias en forma acampanada; es la principal distribución
dentro de la Estadística Inferencial, más adelante en el capítulo siete esta
distribución será tratada con más detalle, su representación gráfica es:

A continuación se muestra un conjunto de datos, con los que


vamos a elaborar las graficas estadísticas que se mencionaron: un histograma,
un polígono de frecuencias, un diagrama de pastel y una ojiva.

37
PROBABILIDAD Y ESTADÍSTICA

30 42 50 73 60 63
38 27 67 83 70 63
52 83 97 49 83 73
30 35 63 59 84 75
84 90 80 95 85 68
Basándonos en que se trata del ejercicio presentado en el capítulo
anterior para la formación de un cuadro estadístico, procederemos a colocar
nuevamente dicho cuadro, el cual queda de la siguiente manera:

Número Intervalo de Frecuencia Frecuencia Frecuencia Frecuencia Marca de


de Clase Acumulada Relativa Rel. Acum. Clase
Clase
1 27 - 35 4 4 4 / 30 4 / 30 31
2 36 - 44 2 6 2 / 30 6 / 30 40
3 45 - 53 3 9 3 / 30 9 / 30 49
4 54 - 62 3 12 3 / 30 12 / 30 58
5 63 - 71 6 18 6 / 30 18 / 30 67
6 72 - 80 4 22 4 / 30 22 / 30 76
7 81 - 89 5 27 5 / 30 27 / 30 85
8 90 - 98 3 30 3 / 30 30 / 30 94
Totales 30 30 / 30

Basándose en el cuadro anterior, se procede a formar las gráficas estadísticas.

a) HISTOGRAMA

38
PROBABILIDAD Y ESTADÍSTICA

b) POLÍGONO DE FRECUENCIAS

c).- CÁLCULOS PARA OBTENER EL DIAGRAMA DE PASTEL

Num. de Clase Frecuencia Relativa Frecuencia Relativa x 360 Grados por Clase
1 0.133 0.133 x 360 48
2 0.067 0.067 x 360 24
3 0.100 0.100 x 360 36
4 0.100 0.100 x 360 36
5 0.200 0.200 x 360 72
6 0.133 0.133 x 360 48
7 0.167 0.167 x 360 60
8 0.100 0.100 x 360 36

39
PROBABILIDAD Y ESTADÍSTICA

d) O J I V A

frec. 30

26.5 35.5 44.5 53.5 62.5 71.5 80.5 89.5 98.5

Límites superiores de las clases

EXAMEN DE AUTOEVALUACIÓN
1.- Explique la elaboración de las siguientes gráficas estadísticas :
a) Histograma.
b) Diagrama de Pastel.
c) Pictograma
d) Polígono de Frecuencias

2.- Las calificaciones de 50 alumnos de la materia de Matemáticas son:


2 8 5 2 7 2 5 5 5 6
1 6 2 3 6 7 7 6 3 3
4 3 4 8 1 4 5 2 7 5
5 4 4 6 6 3 8 3 7 1
8 8 3 2 3 8 6 2 7 2

a) Formar un cuadro estadístico.

40
PROBABILIDAD Y ESTADÍSTICA

b) Construir un Histograma.
c) Construir un Polígono de Frecuencia.
d) Graficar una Ojiva.
e) Construir un Diagrama de Pastel.

3.- Con las siguientes estaturas de los estudiantes de un grupo de la Fac. de


Derecho:
1.87 1.79 1.75 1.90 1.84 1.82 1.77 1.85
1.73 1.98 1.87 1.81 1.79 1.85 1.89 1.90
1.77 1.83 1.91 1.94 1.79 1.80 1.92 1.84
1.76 1.85 1.82 1.91 1.90 1.87 1.86 1.91
1.91 1.89 1.86 1.86 1.97 1.78 1.74 1.76

a) Construir un Cuadro Estadístico.


b) Elaborar las cuatro gráficas estadísticas más usuales.

41
PROBABILIDAD Y ESTADÍSTICA

LA MEDIA ARITMÉTICA

También se le conoce como promedio; es la suma de todos los


elementos dividida entre el número total de ellos. Matemáticamente se
representa de la siguiente manera:

" Sea X una variable; X1, X2, . . . , Xn , la población generada


por X, el promedio de la población será :
n

 Xi
  i=1
(1)
n
Existen dos tipos de medias, la Media Poblacional que se
representa con la letra griega "  ", y la Media Muestral que se representa con
una X testada " X ", ambas se obtienen de la misma forma. La Media
Aritmética es una medida que se utiliza para describir poblaciones, por
ejemplo:

1.- La vida media de una pila es cierto número de horas.


2.- La calificación promedio de los estudiantes de un grupo.
3.- El gasto promedio de gasolina por kilómetro recorrido en un auto.
4.- El salario medio de los empleados de una empresa.
5.- La altura media de los jugadores de un equipo de básquetbol.

Una característica de la Media Aritmética que debe tenerse en


cuenta cuando se describe una población es que esta medida es afectada por
los valores extremos de la muestra o población. Así por ejemplo: Si se le
pide a un empresario que informe sobre el salario promedio de los

42
PROBABILIDAD Y ESTADÍSTICA

trabajadores de su empresa, esta información se verá totalmente afectada si


en el cálculo se incluye su propio salario y el de sus trabajadores de más alta
jerarquía, ya que elevaría el salario promedio, en caso contrario, al calcular el
salario promedio de los ejecutivos, no se incluiría el sueldo de los intendentes,
porque esto bajaría el salario promedio de estas personas. La Media
Aritmética es una buena medida descriptiva de una población, si los datos de
ésta no se encuentran muy dispersos. Veamos a continuación algunos
ejemplos.

* Obtenga la media aritmética o promedio de las calificaciones de


un grupo de 18 alumnos en la materia de Filosofía, las calificaciones de los
alumnos son:
7 9 6 9 4 8 5 8 7
6 9 8 5 7 5 8 4 7
para obtener la media aritmética de los datos anteriores, debemos aplicar la
fórmula (1), teniéndose entonces que :
2(4)  3(5)  2(6)  4(7)  4(8)  3(9) 122
X =   6.77
18 18

teniéndose entonces que el promedio de los alumnos es: X = 6.77

* Si la estatura de 12 jugadores de Básquet Bol de la


Universidad de Colima son:
1.97 1.92 1.84 1.86 1.88 1.92
1.82 1.85 1.94 1.87 1.80 1.93

¿cuál es la estatura promedio de los 12 jugadores?

43
PROBABILIDAD Y ESTADÍSTICA

Aplicando la misma fórmula (1), tenemos que la media aritmética o


estatura promedio es:

1.80 + 1.82 + 1.84 + 1.85 + 1.86 + 1.87 + 1.88 + 1.92 + 1.92 + 1.93 + 1.94 + 1.97
X =
12

22.6
X = = 1.88 mts
12

* Si la producción mensual de maíz en toneladas, durante un año


en Tlaxcala fue :
12,000 14,280 15,720 13,318 14,420 13,300

12,800 13,618 14,710 15,127 14,360 13,750

¿cuál es la producción promedio mensual y cuál es la producción anual ?.

Aplicando la fórmula (1) tenemos:

12,000 + 14,280 + 15,720 +    + 15,127 + 14,360 + 13750 167,403


X = =
12 12

X = 13,950.25 toneladas

para obtener la producción anual, sólo debemos sumar todos datos de

producción mensual, para lo cual, aplicaremos el concepto de sumatoria visto

en la unidad 2.
12
Producción anual =  xi = 12,000 + 14,280 + * * * + 14,360 + 13,750
i=1

Producción anual = 167,403 toneladas

44
PROBABILIDAD Y ESTADÍSTICA

LA MEDIANA
Es otra medida que se utiliza para describir el valor central de
una población. Para calcular la Mediana se ordenan los datos en forma
ascendente o descendente, si el tamaño de la población es impar, la Mediana
es el dato que queda al centro del los datos ordenados; si es par, la Mediana es
el promedio de los dos datos que ocupan el centro de la ordenación. Se
observa que la Mediana divide en dos partes iguales a los datos de una
muestra o población. La Mediana es una medida que no es afectada por los
valores extremos de la muestra o población. Veamos algunos ejemplos.

* Calcular la mediana de los siguientes datos:


46, 54, 58, 56, 48, 58, 112
Para calcular la Mediana, primero se ordenan los datos en forma ascendente o
descendente, teniéndose:
46, 48, 54, 56, 58, 58, 112
Una vez ordenados, se toma el dato al centro de la ordenación ya
que en este caso tenemos un número impar de datos, por lo tanto, la Mediana
es: 56

* En un grupo de 15 alumnos de la Fac. de Medicina, los


alumnos obtuvieron las siguientes calificaciones en Anatomía:
85 92 78 87 96
87 79 90 77 92
87 94 83 78 89

Determine la Mediana.

45
PROBABILIDAD Y ESTADÍSTICA

Para obtener la Mediana es necesario ordenar los datos,


teniéndose entonces que:

77 78 78 79 83 85 87 87 87 89 90 92 92 94 96

La Mediana de los datos o el dato que divide en dos partes iguales a la


muestra es 87 debido a ser el dato que ocupa el centro de la muestra por ser
un número impar. A partir de este momento, representaremos a la Mediana de
la siguiente manera: X

* Determine la Mediana del siguiente conjunto de datos:


12 18 23 16 24 17 18 20
15 9 16 22 18 11 14 19

para obtener la Mediana debemos ordenar los datos en forma ascendente y


escoger el dato que se encuentre en el centro de la colección, por lo tanto:
9 11 12 14 15 16 16 17
18 18 18 19 20 22 23 24

como podemos observar en este caso el número de datos es par y por lo tanto
la Mediana de esta colección de datos será el media aritmética de los datos
que ocupan el centro de la colección, siendo estos datos los números 17 y 18
17  18
teniéndose entonces que la Mediana en este ejercicio es : X =  17.5 .
2

46
PROBABILIDAD Y ESTADÍSTICA

LA MODA

Es otra medida de tendencia central y que se utiliza para describir


el valor típico de una población. La Moda en una población o muestra es el
valor que se presenta con mayor frecuencia. Sí en una muestra de 10 casas, se
considera la siguiente distribución en número de hijos, 3, 0, 1, 5, 6, 2, 1, 2, 7,
2, entonces la Moda es el número 2, ya que es el elemento que aparece con
mayor frecuencia. La Moda la representaremos de la siguiente manera : Mo .
Debemos aclarar que pudiera existir una colección de datos en la que existan
dos o más modas, lo cual sucedería cuando existieran dos o más elementos
que aparecen la misma cantidad de veces y que además son el que mayor
frecuencia tienen. Veamos algunos ejemplos.

* En un grupo de 15 alumnos de la Fac. de Medicina, los


alumnos obtuvieron las siguientes calificaciones en Anatomía:
85 92 78 87 96
87 79 90 77 92
87 94 83 78 89

¿ Cuál es la Moda ?. La Moda es la calificación que se presentó con mayor


frecuencia en el grupo, teniéndose entonces que: Mo = 87

* Si la estatura de 12 jugadores de Básquet Bol de la Universidad


de Colima son:
1.97 1.92 1.84 1.86 1.88 1.92
1.82 1.85 1.94 1.87 1.80 1.93

47
PROBABILIDAD Y ESTADÍSTICA

¿cual es la estatura que existe en mayor cantidad en los 12 jugadores? A la


estatura que mayor frecuencia tenga es la que llamaremos la Moda,
teniéndose entonces que: Mo = 1.92

* Obtenga la Moda de la siguiente colección de datos:


9 11 12 14 16 16 16 17
18 18 18 19 20 22 23 24

en este ejemplo tenemos que los números que mayor veces aparecen son el 16
y el 18, por lo tanto, en esta colección de datos tenemos un ejemplo de
distribución bimodal ( existen 2 modas en la colección ), por lo que las modas
son: Mo = 16 y 18

COMPARACIÓN DE LA MEDIA
ARITMETICA, LA MEDIANA Y LA MODA
Hemos visto 3 medidas de tendencia central que describen a una
población, pero, ¿cuál debe usarse en una situación determinada?. La elección
de la medida de tendencia central a usarse depende del tipo de variable que
genera la población y de las finalidades del estudio que se está realizando. Un
criterio fuerte para la elección de alguna de estas medidas es el de escoger la
que presente ventajas significativas sobre las otras dos, por ejemplo: En el
caso de una fábrica de automóviles la empresa deber decidir que marca de
acumuladores usar en sus vehículos, para lo que le puede ser útil además del
costo, comparar la durabilidad de los acumuladores de diversas marcas. En
poblaciones de este tipo, la media, la mediana, y la moda son en la mayor
parte de los casos valores muy parecidos.

48
PROBABILIDAD Y ESTADÍSTICA

La media sólo puede calcularse cuando la variable de interés es


numérica. A pesar de que la media puede ser afectada por valores muy
grandes o muy pequeños respecto al resto de la población, es una medida que
se emplea con mucha frecuencia para orientar la toma de decisiones, porque
su naturaleza numérica facilita el tratamiento estadístico.

La mediana es una medida que sólo se puede obtener si la


variable al menos es cardinal, en general, se acude a esta medida cuando no se
puede calcular la media o ésta no sea representativa de la población.

La moda es una medida que puede obtenerse para cualquier tipo


de variable. Hay muchas ocasiones en que esta medida presenta ventajas
sobre las otras dos para describir a una población. Por ejemplo: Consideremos
el caso de planear la producción de un nuevo tipo de chamarras, para el largo
de la manga y la talla, el fabricante considerará las de mayor frecuencia, es
decir, la moda. En este caso, la media o la mediana no le aportan la
información requerida. Veamos un ejemplo:

El siguiente conjunto de datos contiene las calificaciones de 50


alumnos de la materia de Economía:
5 2 3 8 4 5 4 7 5 8
6 8 7 7 2 9 1 10 9 6
9 7 10 8 9 9 10 5 9 5
9 10 10 2 8 2 10 2 7 3
3 10 5 10 9 6 1 9 7 6

a) Obtener La Media Aritmética, La Mediana y La Moda.


X = ( 1 + 1 + 2 + . . . + 10 + 10 + 10 ) / 50
X = 326 / 50 = 6.52
Mediana = X = 7 ( por ocupar los lugares 25 y 26 en el arreglo )
La Moda = Mo = 9 ( por ser el que más se repite ó aparece )

49
PROBABILIDAD Y ESTADÍSTICA

b) Mencione cuál de las tres medidas de tendencia central es la más


adecuada y ¿por que?

La más representativa es la Media Aritmética, ya que los datos no se


encuentran muy dispersos, además de que la Mediana y la Moda tienden a
cargarse más hacia un extremo.

Debemos señalar que las tres medidas de tendencia central


mencionadas anteriormente son las más comunes, más no son las únicas.
Existen otras medidas de tendencia central como son la Media Geométrica, La
Media Armónica, La Media Ponderada, La Media Supuesta, y algunas otras.
Veamos un ejemplo de lo anterior.

* La duración en horas de una muestra de focos tomados de la


producción diaria de una fabrica son:

129 145 168 164 165 172 168 179 168 170
159 168 175 164 179 168 180 173 149 159
168 178 177 178 168 172 168 158 154 168

a) Calcular la Media Aritmética, la Mediana y la Moda.

129 + 145 +    + 154 + 168 4991


X = = = 166.36 horas
30 30
 = 168 por ocupar el lugar 15 y 16 de la ordenación
X
Mo = 168 por ser el número en horas que más se repite.

b) Mencione cuál de las tres medidas de tendencia central es la más


apropiada para este evento.
Para este evento, consideramos que la medida de tendencia
central más apropiada es la Media Aritmética, ya que es el dato que se

50
PROBABILIDAD Y ESTADÍSTICA

encuentra más hacia el centro de la distribución aun cuando es afectado por la


medida de 129 horas.

MEDIA GEOMÉTRICA
La Media Geométrica es muy usual para el cálculo de promedios
de tasas de variación, en la elaboración de Números Índice, etc. Se define de
la siguiente manera: “Sí tenemos n elementos, la Media Geométrica es la raíz
n-ésima del producto de todos los elementos ”. La fórmula para obtenerla es:

MEDIA GEOMÉTRICA ( g ) =
n X1 * X2 * . . . * Xn

donde: n = Tamaño de la Muestra


Xi = Elemento de la Muestra

* Obtener la Media Geométrica de los siguientes números: 3, 5,


7, 9, 8.
g = 5 3 * 5 * 7 * 8 * 9 = 5 7,560 = 5.966

Veamos algunos ejercicios de lo visto hasta este momento.

* Obtener la Media Aritmética de los datos:


6 3 8 5 2

6 3 8 5 2 24
X = = = 4.8
5 5
* Los ingresos anuales de 12 profesores en nuevos pesos son:

72,000 72,000 75,000 81,000 163,000 78,000


81,000 89,000 72,000 90,000 84,000 81,000

51
PROBABILIDAD Y ESTADÍSTICA

Calcular las medidas de tendencia central. Indique cual es la más significativa


y ¿por que?
72,000 + 72,000 +    + 90,000 + 163,000 1' 038,000
X = =
12 12
X = 86,500 nuevos pesos
Mo = 72,000 y 81,000
 = 81,000
X

La más significativa es la Mediana, por que es el valor que se


encuentra al centro de la distribución, mientras que la Moda toma un valor
extremo lo que la hace no muy significativa y a la Media la afecta el valor de
163,000 por estar muy disperso.

* Obtener la Media Geométrica de los siguientes datos:

12 15 17 13 18 14 18 13 17 15

g = 10 12 x 15 x 17 x 13 x18 x 14 x 18 x 13 x 17 x 15

g = 10 5,981,655,000,000 = 15.05

MEDIA ARMÓNICA
La idea de promedio es tan manejable que no es sorprendente que
se hayan inventado diversos tipos de promedio de modo que pueda
representarse con un mínimo de deformación un campo tan amplio como sea
posible. Podemos escoger nuestro promedio, y tomamos el apropiado para
nuestro propósito. El promedio aritmético de un conjunto de números es el
más simple de los promedios ó medidas de centralización.

52
PROBABILIDAD Y ESTADÍSTICA

Un segundo tipo de promedio importante es la Media Armónica,


que es el recíproco de la media aritmética de los recíprocos de los valores que
queremos promediar. La Media Armónica es el promedio adecuado cuando
tratamos con tarifas y precios. Consideremos un ejemplo para explicar este
tipo de promedio.

* Un aeroplano vuela alrededor de un cuadrado cuyo lado tiene


100 Km de largo, tomando el primer lado a 100 Km/h , el segundo lado a 200
Km/h , el tercer lado a 300 Km/h y el cuarto lado a 400 Km/h. ¿Cuál es la
velocidad media del aeroplano en su vuelo alrededor del cuadrado?

Si promediamos las velocidades usando la media aritmética de la


manera usual, tenemos:
100  200  300  400
X= = 250 Km/h
4
pero éste no es el resultado correcto, ya que lo podemos comprobar de la
siguiente manera :

Tiempo para viajar el primer lado 1 hora


Tiempo para viajar el segundo lado 30 minutos
Tiempo para viajar el tercer lado 20 minutos
Tiempo para viajar el cuarto lado 15 minutos

De el desglose anterior tenemos que el tiempo total empleado en


recorrer los 400 kilómetros fue de 2 horas 5 minutos, con este total se
deduce que la velocidad media del aeroplano en recorrer los 400 Km del
cuadrado fue de 192 Km/h.

El promedio aritmético nos da por lo tanto un resultado


equivocado. Podemos deducir la razón de esto a partir del hecho de que no

53
PROBABILIDAD Y ESTADÍSTICA

todas las velocidades se mantienen durante el mismo tiempo, sólo lo hacen


para la misma distancia.

El promedio correcto para usar en este caso es la Media


Armónica. Para dar la fórmula introduciremos la notación de sumatoria ya
analizada anteriormente, teniéndose entonces que:
n
Media Armónica (H) = n
1
X i
i=1

a partir de este momento, cuando hablemos de la Media Armónica, la


representaremos con la letra H. Para ilustrar esta fórmula, apliquémosla a
nuestro ejemplo del aeroplano.

Las cuatro velocidades que se mantenían cada una sobre la


misma distancia, eran 100 Km/h, 200 Km/h, 300 Km/h y 400 Km/h. Estos
son los valores de Xi . Puesto que hay cuatro valores, el valor de n en
nuestro ejemplo es 4, y tenemos entonces:
4 4 4,800
H= = = = 192 Km/ h
1 1 1 1 25 25
  
100 200 300 400 1200

en donde 192 Km/h es la respuesta correcta.

Como podemos ver, la media armónica es adecuada aquí porque


los tiempos eran variables con las distancias constantes. De haber sido las
tiempos constantes y las distancias variables, la media aritmética hubiese sido
la correcta. Cabe señalar que el tipo de promedio adecuado depende siempre
de los términos del problema en curso. Las fórmulas no se han de aplicar
indiscriminadamente. Veamos algunos ejemplos.

54
PROBABILIDAD Y ESTADÍSTICA

* Un agricultor puede arar un terreno empleando un tractor en


cuatro días; un ayudante suyo puede hacer el mismo trabajo con un tractor
más pequeño en 6 días. ¿Cuál es el rendimiento representativo de los dos
tractores?, ¿En cuántos días pueden arar el mismo campo si trabajan
conjuntamente?

Para calcular el rendimiento representativo, tenemos:

n 2 2 2 24 4
H      4
n
1 1 1 3 2 5 5 5
 xi

4 6 12 12
i1

4
por lo tanto el rendimiento representativo de los dos tractores es de 4 días.
5

Para determinar en cuántos días los tractores pueden arar el


campo si trabajan conjuntamente tenemos que su rendimiento representativo
4
es de 4 días, por lo que al trabajar conjuntamente resulta:
5
4 24
4 24 2
5 5
   2
2 2 10 5
por lo tanto para arar el campo si los dos tractores trabajan conjuntamente, se
2
requiere 2 días.
5
Comprobación: Los dos tractores pueden arar en un día
1 1 5
  del campo; en arar todo el campo tardarán : por dos días de arado
4 6 12
10 2
conjuntamente habrán arado del campo, pero como araron juntos de un
12 5
2 5
día más, eso es en proporción del campo lo siguiente : de un día por de
5 12

55
PROBABILIDAD Y ESTADÍSTICA

2
campo arado conjuntamente en un día da de campo, que es el complemento
12
10 2
de del campo, entonces, en arar todo el campo tardarán 2 días.
12 5

* En una ruta ferroviaria la velocidad a la que se desplaza un tren


es: los primeros 90 Km. a 70 Km/h, en el segundo tramo de 70 Km. a 100
Km/h; determinar la velocidad promedio para todo el recorrido.

Dado que las distancias de los tramos no son iguales, se debe


utilizar una ecuación representativa que denominamos “media armónica
ponderada” para las velocidades donde los “pesos” son las distancias
1 1 f
respectivas, es decir:  
H N X
en donde N = f , o también puede ser

N f
  sustituyendo los datos de velocidad y distancia, resulta:
H X

d1 + d2 + d3 + . . . + d N d1 d2 d3 dN
    ... +
v v1 v2 v3 vN

sustituyendo los datos en la ecuación de la media armónica ponderada para la


velocidad media, resulta:
90  70 90 70
= 
v 70 100
160
= 1 .2 8 5 7 + 0 .7
v
160
 1 .9 8 5 7
v
v = 8 0 .5 7

por lo tanto la velocidad promedio para todo el recorrido es 80.57 Km/h.

Comprobación: Determinamos primeramente el tiempo


requerido para recorrer el primer tramo:

56
PROBABILIDAD Y ESTADÍSTICA

DISTANCIA ( d ) 90 Km
TIEMPO ( t ) = =  1.2857 horas
VELOCIDAD ( v ) 70 Km / h

El tiempo requerido para recorrer el segundo tramo es:

d 70 Km
(t) =   0.7 horas.
v 100 Km / h

La velocidad media para todo el recorrido es:

DISTANCIA TOTAL 90 Km + 70 Km 160 Km


VELOCIDAD MEDIA =  
TIEMPO TOTAL 1.2857 h + 0.7 h 1.9857 h

 VELOCIDAD MEDIA = 80.57 Km / h

MEDIA ARMONICA PARA DATOS AGRUPADOS

Si consideramos los elementos ( X1 , X2 , X3 , . . . , XN ) que se


presentan con frecuencias ( f1 , f2 , f3 , . . . , fN ) en donde ( f1 + f2 + f3 + . . . +
fN = N ) representa la frecuencia total; la ecuación de la Media Armónica para
datos agrupados se expresa por:

H =
f 
N
f f
X X
donde: H = Media Armónica
N=  f = Número total de frecuencias
XN = Marcas de clases de datos agrupados.
fN = Frecuencias de clase.
* La siguiente tabla de distribuciones de frecuencias registra las
longitudes en centímetros que en una semana tienen 100 plantas de frijol; con
esta información obtener la Media Armónica.

57
PROBABILIDAD Y ESTADÍSTICA

INTERVALOS FRECUENCIAS ( f )
( LONGITUDES ) ( No. DE PLANTAS )
5.4 - 5.7 7
5.8 - 6.1 16
6.2 - 6.5 21
6.6 - 6.9 29
7.0 - 7.3 18
7.4 - 7.7 9
100

SOLUCION: Para determinar la Media Armónica es necesario construir la


siguiente tabla de distribuciones:
INTERVALOS MARCA DE FRECUENCIAS ( f ) f
( LONGITUDES ) CLASE ( X) (No. DE PLANTAS) X
5.4 - 5.7 5.55 7 1.261261
5.8 - 6.1 5.95 16 2.689075
6.2 - 6.5 6.35 21 3.307086
6.6 - 6.9 6.75 29 4.296296
7.0 - 7.3 7.15 18 2.517482
7.4 - 7.7 7.55 9 1.192052
N = 100 = f f
X  15.2632252

Sustituyendo los datos anteriores en la correspondiente ecuación tenemos:


N 100
H= = = 6.55
f 15.2632252
X
La media armónica calculada a partir de los datos agrupados es de 6.55 cm.

EJERCICIOS PROPUESTOS

1.- ¿Qué es una medida de tendencia central?

58
PROBABILIDAD Y ESTADÍSTICA

2.- Describa el proceso para la obtención de la Media Aritmética, la


Mediana y la Moda.
3.- ¿Qué criterio se sigue para determinar la medida de tendencia central
más significativa?
4.- Determine la Media, la Mediana, la Moda y la Media Geométrica de los
siguientes datos:
1 1 2 2 3 3 3 4
4 4 4 5 5 6 7 8
5.- Los siguientes datos representan el tiempo de vida en años de una
muestra aleatoria de 30 motores eléctricos similares.
2.0 3.0 0.3 3.3 1.3 0.4
0.2 6.0 5.5 6.5 0.2 2.3
1.5 4.0 5.9 1.8 4.7 0.7
4.6 0.3 1.5 0.5 2.5 5.0
1.0 6.0 5.6 6.0 1.2 0.2
a) Construya un cuadro estadístico.
b) Construya un Histograma, un Polígono de Frecuencias y un
Diagrama de Pastel.
c) Con los datos calcular la Media Aritmética, la Mediana y la
Moda.

59
PROBABILIDAD Y ESTADÍSTICA

MEDIDAS DE DISPERSIÓN
Cuando una población es generada por una variable numérica,
además de poderla describir mediante una medida de tendencia central,
también se puede obtener una medida que nos indique el grado de
homogeneidad de sus datos. A este tipo de medidas se les conoce como
medidas de variabilidad o de dispersión. Existen varias medidas de
dispersión, como son el Rango, la Desviación Media, la Varianza, y algunas
otras, las cuales estudiaremos en este capítulo.

RANGO: Es una medida de dispersión que se obtiene restando al


mayor elemento de la colección de datos, el elemento menor. Aunque el rango
es una medida que tiene la ventaja de calcularse fácilmente, tiene la
desventaja de sólo considerar los valores extremos de la población (También
se le conoce como Amplitud Total ).

DESVIACIÓN ESTÁNDAR
Esta medida nos indica que tan dispersos se encuentran en
promedio, los datos con respecto a la media aritmética. Existen dos tipos de
desviación estándar, la Desviación Estándar Muestral y la Desviación
Estándar Poblacional.

La Desviación Estándar Poblacional se calcula en base a la media


aritmética poblacional, utilizando la siguiente fórmula:
n

 ( X i -  )²
  i=1
N
donde: N = Tamaño de la Población.

60
PROBABILIDAD Y ESTADÍSTICA

 = Media Aritmética Poblacional.


Xi = Elemento de la Población.
 = Desviación Estándar Poblacional.

La desviación estándar nos puede indicar como se comportan los


datos alrededor de una medida de tendencia central y como en ocasiones a
pesar de tener el mismo valor dos muestras diferentes, en su medida de
tendencia central, el grado de dispersión es distinto. Pudiéramos tener una
muestra en que su media aritmética fuera 4 y que los datos oscilaran entre 3
y 5, y otra muestra que su media aritmética fuera 4 y que sus datos oscilaran
entre 0 y 8. Aunque ambas tienen el mismo valor en su medida de tendencia
central, tienen distinta distribución de los datos, de aquí la importancia de
tener una medida que nos indique el grado de dispersión de los datos con
respecto al dato central.

La Desviación Estándar Muestral tiene dos modificaciones con


respecto a la Poblacional, ya que se utiliza la media aritmética muestral y el
tamaño de la muestra menos 1, quedando la fórmula de la siguiente manera:
n

(X i - X )²
i =1
s =
n - 1

donde: n = Tamaño de la Muestra.


Xi = Elemento de la Población
X = Media Aritmética Muestral.

s = Desviación Estándar Muestral.

61
PROBABILIDAD Y ESTADÍSTICA

Existe otra medida de dispersión llamada Desviación Media, que


requiere del cálculo de la Amplitud, aún cuando no es muy utilizada, es
necesario tener conocimiento de ella. Se obtiene con la siguiente fórmula:

X i - X
m= i=1

ahora bien, este tipo de medida de dispersión no nos proporciona un grado


adecuado de homogeneidad, por lo que es necesario utilizar el de la
desviación estándar para representar el grado de dispersión de la muestra con
respecto a su media, además, de que no sirve para calcular la varianza.

VARIANZA
Es el cuadrado de la desviación estándar. Dependiendo de la
desviación estándar de que se trate, recibirá el nombre de Varianza Muestral o
Varianza Poblacional ( s2 si es la muestral y 2 si es la poblacional ).
Veamos algunos ejemplos.

* Se tomó la presión sanguínea de diez personas antes y después


de fumar. Los cambios fueron:
+10, -5, +7, +4, +2, +3 -4, -5, -3, +9
Calcular la Varianza y Desviación Estándar con esos datos.
10  5  7  4  2  3  4  5  3  9 18
X= = = 1.8
10 10
(10 - 1.8)² + (-5 - 1.8)² +    + (-3 - 1.8)² + (9 - 1.8)²
s2 =
10 - 1
s2 = 33.511

62
PROBABILIDAD Y ESTADÍSTICA

Como la desviación estándar es la raíz cuadrada de la varianza,


entonces tenemos que la desviación estándar de las diez presiones sanguíneas
registradas es: s = 5.788

* Dados los siguientes datos:


3, 5, 16, 23, 31, 12, 23, 13, 15.
a).- Calcular las medidas de tendencia central.
3  5  16  23  31  12  23  13  15 141
X= =
9 9
X = 15.66

Ordenando los elementos tenemos que:


3 5 12 13 15 16 23 23 31
teniéndose que la mediana será el dato que se encuentre al centro del arreglo,
por lo tanto : Mediana = 15 La Moda = 23

b).- Calcular las medidas de Dispersión

(3 - 15.66)² + (5 -15.66)² +    + (23 -15.66)² + (31- 15.66)²


s2 =
9 - 1
160.27 + 113.63 + 13.39 + 7.07 + 0.43 + 0.12 + 3.87 + 53.87 + 235.31 637.96
s2 =   79.745
8 8
por lo tanto, la desviación estándar es entonces: s = 79.745 = 8.93

* En el departamento de Inglés de la UAS se informó que el


sueldo anual de los profesores es en promedio de 72,000 dólares, con una
desviación estándar de 0.0 ¿Cuál será la mediana y la moda de estos sueldos?

R.- Tanto la Mediana y la Moda es 72,000; ya que cuando la


desviación estándar es 0, se tiene que no existe dispersión entre los valores de
la muestra (dicho de otra manera, no existe variación entre los datos).

63
PROBABILIDAD Y ESTADÍSTICA

* Si en una colonia se registró el número de personas que viven


por casa tomando una muestra de 18 viviendas, obteniéndose los siguientes
resultados:

6 5 6 4 9 2
8 4 5 3 3 5
6 5 7 2 5 7

determine la media aritmética, la varianza y desviación estándar de la


muestra.

2(2)  2(3)  2(4)  5(5)  3(6)  2(7)  8  9 92


X= = = 5.11
18 18
n

2
( X i - X )²
s = i=1

n - 1

2(2-5.11)² +2(3-5.11)² +2(4-5.11)² +5(5-5.11)² +3(6-5.11)² +2(7-5.11)² +(8-5.11)² +(9-5.11)²


s2 =
18 - 1

19.3442 +8.9042 +2.4642 + 0.0605+2.3763+7.1442 +8.3521+ 15.1321 63.7778


s2 = =
17 17

s2 = 3.7516353

por lo tanto la desviación estándar es s = 1.9369135

* Calcule la media aritmética, la varianza y desviación estándar


de los siguientes datos: 5 7 1 2 4
5  7  1  2  4 19
X=   3.8
5 5
(5 - 3.8)² + (7 - 3.8)² + (1- 3.8)² + (2 - 3.8)² + (4 - 3.8)² 22.8
s2 = 
5 - 1 4
s2 = 5.7 ;
por lo tanto la desviación estándar es : s = 2.3874673

64
PROBABILIDAD Y ESTADÍSTICA

CALCULO DE LA MEDIA Y DESVIACIÓN


ESTÁNDAR PARA DATOS AGRUPADOS
Generalmente cuando se agrupan en clases los datos generados
por una variable numérica, es posible calcular la media y la desviación
estándar con los datos tabulados. En estos casos, tanto la media como la
desviación estándar son aproximaciones de los valores reales, debido a que
uno conoce la cantidad de elementos que pertenecen a la clase, pero
desconocemos sus valores.
Para calcular la Media Aritmética de un conjunto de datos
agrupados, se emplea la siguiente fórmula:

 ( mi * fi )  ( mi * fi )
X= =
 fi n

Donde: mi = Marca de Clase.


fi = Frecuencia de Clase.
n = Tamaño de la Muestra.
X = Media Aritmética.

Para el cálculo de la Varianza se utiliza:

( m i- X )²  f i
s2 
n - 1
Existe otra forma de calcular la varianza, llamada forma
simplificada, la cual se obtiene sustituyendo en la fórmula de la varianza la de
la media, y al simplificar quedaría así:

65
PROBABILIDAD Y ESTADÍSTICA

n (X)²
i  fi -  (X  f ) ²
i i
s² =
n(n -1)

donde : n = Tamaño de la Muestra


Xi = Elemento de la Muestra
fi = Frecuencia de la Clase

La fórmula anterior es para calcular la Varianza de un grupo de


variables colocadas en un cuadro estadístico, para determinar la varianza de
un cuadro estadístico cuando esté agrupado por clases, entonces sustituimos
en el lugar de la variable ( Xi ) la marca de clase ( mi ) teniéndose entonces
que la fórmula a aplicar será:
n[  {(mi)2* fi }] - [  ( mi * fi )]2
s2 =
n(n-1)

donde : n = Tamaño de la Muestra


mi = Marca de Clase
fi = Frecuencia de Clase
En los dos casos anteriores, la Desviación Estándar se obtiene
sacando la raíz cuadrada de la Varianza.

INTERPRETACIÓN PRACTICA DE LA
DESVIACIÓN ESTÁNDAR

Introduciremos ahora un teorema interesante y útil, desarrollado


por el matemático ruso Tchebysheff. La demostración del teorema no es
difícil, pero la omitiremos para manejar directamente su significado.

66
PROBABILIDAD Y ESTADÍSTICA

El teorema de Tchebysheff dice : “ Dado un número k mayor o


igual a 1 y un conjunto de n observaciones x1, x2, x3, * * * , xn , por lo
menos ( 1 - 1/k2 ) de las observaciones se encuentran dentro de k
desviaciones estándar de la media ”.

El teorema de Tchebysheff se aplica a cualquier conjunto de


observaciones y, para propósitos de ilustración, nos podríamos referir tanto a
la muestra como a la población. Usaremos la notación correspondiente a
poblaciones, pero deben darse cuenta que bien podríamos usar la media
aritmética y la desviación estándar muestral. La idea contenida en el teorema
de Tchebysheff se ilustra en la siguiente figura:

k 1 - 1/k2
1
2 3/4
3 8/9
4 15/16
-3 -2 -1 0 1 2 3

Se construye un intervalo midiendo una distancia de k veces la


 en unidades a ambos lados de la media aritmética  . Note que el teorema
es cierto para cualquier valor que le demos a k , siempre y cuando k sea
mayor o igual a 1. Entonces, calculando la fracción 1 - 1/k2 , vemos que el
teorema de Tchebysheff establece que al menos esa fracción del número de
observaciones caerán en el intervalo construido.

Ponemos énfasis en la expresión “ al menos ” del teorema de


Tchebysheff porque el teorema es muy conservador, siendo aplicable a

67
PROBABILIDAD Y ESTADÍSTICA

cualquier distribución. En la mayoría de las situaciones, la fracción de las


observaciones que caen en el intervalo especificado excede a 1 - 1/k2.
Enunciaremos ahora una regla que describe con precisión la variabilidad de
una distribución particular en forma de campana y que describe
razonablemente bien la variabilidad de otras distribuciones de datos de forma
monticular. La frecuente ocurrencia de distribuciones acampanadas y
monticulares en la naturaleza, y por tanto la aplicabilidad de nuestra regla,
nos conduce a llamarla la “ regla empírica ”.

Regla empírica: Dada una distribución de observaciones que es


aproximadamente acampanada, el intervalo :

1)    contiene aproximadamente el 68 % de las observaciones.


2)   2 contiene aproximadamente el 95 % de las observaciones.
3)   3 contiene todas o casi todas las observaciones.

Las relaciones anteriores las podemos mostrar por medio de una


gráfica en la cual se muestra la distribución en porcentajes de los datos
alrededor de la media aritmética.

-3 -2 -   2 3
68.27 %
95.45 %
99.95 %

68
PROBABILIDAD Y ESTADÍSTICA

La distribución acampanada se conoce comúnmente como la


Distribución Normal y será discutida con detalle en el capítulo 7. Lo que
quisiéramos recalcar aquí, es que la regla empírica es sumamente útil y
proporciona una descripción excelente de la variación para muchos tipos de
datos. Note que el Teorema de Tchebysheff es un hecho que puede ser
demostrado matemáticamente y sin embargo dejamos el razonamiento
matemático para un curso de Cálculo.

Aunque los porcentajes mencionados en la regla corresponden a


áreas bajo la curva normal, los mismos porcentajes son validos
aproximadamente para distribuciones con formas diversas, siempre que
tiendan a ser más o menos monticulares. Veamos algunos ejemplos.

* La media y varianza de un conjunto de n = 25 observaciones


son 75 y 100 respectivamente. Usando la regla empírica para describir esta
distribución tendríamos : Sabemos que  = 75 y que  2 =100 . La
desviación estándar es  = 10. La distribución de las observaciones esta
centrado alrededor de  = 75, y la regla empírica establece que:

a)    = 75  10 ; que el 68 % de las observaciones esta entre 65 y 85.


b)   2 = 75  20; que el 95 % de las observaciones esta entre 55 y 95.
c)   3 = 75  30; que todas o casi todas las observaciones se
encuentran entre 45 y 105.
* En la siguiente tabla se especifica la vida útil de una marca de
pilas que se utilizan en una misma marca de reloj.

Vida Útil fi mi mi x fi ( mi )2 x fi
(Horas )
420 - 439 15 429.5 06,442.5 2’767,053.75
440 - 459 20 449.5 08,990.0 4’041,005.00
460 - 479 25 469.5 11,737.5 5’510,756.25
480 - 499 25 489.5 12,237.5 5’990,256.25
500 - 519 32 509.5 16,304.0 8’306,888.00

69
PROBABILIDAD Y ESTADÍSTICA

520 - 539 30 529.5 15,885.0 8’411,107.50


540 - 559 24 549.5 13,188.0 7’246,806.00
560 - 579 14 569.5 07,913.0 4’540,623.50
580 - 599 7 589.5 04,126.5 2’432,571.75
TOTALES 190 95,945.0 48’806,208.00

Obtener la Media Aritmética, la Varianza y Desviación Estándar


(por el método general y el simplificado).

 ( mi * fi ) 95,945
X= = = 504.97
n 190
La Varianza en su forma simplificada es :

n[  {(mi)2* fi }] - [  ( mi * fi )]2
s2 =
n(n-1)

(190)(48806 ' ,500  9,205443


' ,208) - (95,945)² 9,273179 ' ,000
s2 = 
190(190 -1) 35,910
67'736,500
s2 = = 1,886.2852
35,910

por lo tanto : s = 43.43

si a continuación obtenemos la varianza en su forma general para datos


agrupados tendremos :

 [( mi - X )2 * fi]
s2 =
n-1
(429.5-504.97)² (15) + (449.5-504.97)² (20) +  +(569.5-504.97)² (14) + (589.5-504.97)² (7)
s2 =
190-1

70
PROBABILIDAD Y ESTADÍSTICA

85,435814
.  61,538.418     + 58,297.693 + 50,017.246 360,950.31
s2 = 
189 189

s2 = 1,909.79

s = 1,909.79 = 43.701

Como podemos observar, no existe gran diferencia entre la


desviación estándar obtenida por la forma simplificada y la obtenida por la
forma general.

* Obtener la Varianza y Desviación Estándar para los siguientes


datos: 6, 3, 8, 5, 2
6  3  8  5  2 24
X=   4.8
5 5
(6 - 4.8)² + (3 - 4.8)² + (8 - 4.8)² + (5 - 4.8)² + (2 - 4.8)²
s2 =
5 -1
1.44 + 3.24 + 10.24 + 0.04 + 7.84 22.8
s2 = 
4 4
s2 = 5.7 por lo tanto s = 5.7 = 2.387

* Los ingresos anuales de 12 profesores en nuevos pesos son:

72,000 72,000 75,000 81,000 163,000 78,000


81,000 89,000 72,000 90,000 84,000 81,000

Calcular la Varianza y Desviación Estándar.

La media aritmética se determino en el capitulo anterior, por lo que tenemos


que X = 86,500, por lo tanto la varianza es:

(72,000  86,500) ² +    + (163,000 - 86,500)²


s2 =
12  1

71
PROBABILIDAD Y ESTADÍSTICA

210'250,000 +    + 5,852' 250,000 6,803'000,000


s2 = 
11 11
s2 = 6.1845455 x 108

como la desviación estándar se obtiene sacando la raíz cuadrada a la


varianza, tenemos entonces que esta es: s = 24,868.746

* Se sabe que la frecuencia de respiración en los humanos puede


variar desde 4 respiraciones por minuto hasta 70 ó 75 para una persona que
realiza ejercicios extenuantes. Supongamos que las frecuencias de respiración
en estado de reposo, para estudiantes universitarios, poseen una distribución
de forma monticular con media 12 y desviación estándar 2.3 respiraciones por
minuto. ¿Qué fracción de los estudiantes poseen frecuencias en los siguientes
intervalos:

a).- 9.7 a 14.3 respiraciones por minuto?


Aplicando la regla empírica, tenemos que la relación de 9.7 a 14.3 es lo
mismo que señalar una desviación estándar alrededor de la media aritmética,
ya que 12 + 2.3 nos da el límite superior y 12 - 2.3 nos da el límite inferior, y
por tratarse de una relación con distribución monticular, tenemos que en ese
intervalo se encuentra el 68 % de los estudiantes o bien la fracción es 0.68

b).- 7.4 a 16.6 respiraciones por minuto?


Basándonos en el inciso anterior tenemos que la fracción que se
encuentra alrededor de la media a 2 desviaciones estándar es 0.95 o el 95 %
de los estudiantes.

c).- más de 18.9 o menos de 5.1 respiraciones por minuto?


En este inciso vemos que tenemos una relación alrededor de la media
de tres desviaciones estándar, por lo que se encuentran todos o casi todos los
estudiantes universitarios.

72
PROBABILIDAD Y ESTADÍSTICA

* La siguiente tabla muestra el concentrado de los resultados de


25 estudiantes universitarios:

Num C. Int. de Clase Frecuencia mi mi x fi mi2 x fi


1 1.8 - 2.1 4 1.95 07.80 15.210
2 2.2 - 2.5 6 2.35 14.10 33.135
3 2.6 - 2.9 8 2.75 22.00 60.500
4 3.0 - 3.3 4 3.15 12.60 39.690
5 3.4 - 3.7 3 3.55 10.65 37.808
Totales 25 67.15 186.343

En base al cuadro estadístico, calcule la media aritmética, la


desviación estándar y la varianza

X=
 ( m i  f i)

6 7 .1 5
 2 .6 8 6
n 25

n   (mi)²  fi   -   m i  fi   ² 25(186.343) - (67.15)²


s2 = 
n(n - 1) 25(25 - 1)

4,658.575 - 4,509.125 149.45


s2 = =
600 600

s2 = 0.25 ;

por lo tanto, la desviación estándar es : s = 0.5

73
PROBABILIDAD Y ESTADÍSTICA

EJERCICIOS PROPUESTOS
1.- ¿Qué es una medida de dispersión?

2.- Describa el proceso para la obtención de la Varianza.

3.- ¿Qué es el Rango?

4.- ¿Qué diferencia hay entre la forma simplificada para la obtención de la


Varianza y la forma general?

5.- Defina la desviación media.

6.- Los siguientes datos representan el tiempo de vida en años de una


muestra aleatoria de 30 motores eléctricos similares.
2.0 3.0 0.3 3.3 1.3 0.4
0.2 6.0 5.5 6.5 0.2 2.3
1.5 4.0 5.9 1.8 4.7 0.7
4.6 0.3 1.5 0.5 2.5 5.0
1.0 6.0 5.6 6.0 1.2 0.2
Calcular la Desviación Media , la Varianza y la Desviación Estándar.
7.- El cociente de inteligencia (CI) expresa la inteligencia como la razón
de la edad mental a la edad cronológica multiplicada por 100.
Así, el promedio cuando la edad mental es igual a la edad
cronológica es 100. Para los siguientes CI.

100 103 99 101 100 120 109 82


101 112 95 118 118 114 113 89
92 137 94 130 87 93 111 96
93 101 98 96 84 86 89 90

74
PROBABILIDAD Y ESTADÍSTICA

a) Construya un histograma de frecuencias relativas.


b) Calcule X , s2 y s.
c) Encuentre el número de puntuaciones en los intervalos X  s;
X  2s y X  3s. Compare las proporciones de observaciones en

estos intervalos con las especificadas por el teorema de Tchebysheff


y la regla empírica.

75
PROBABILIDAD Y ESTADÍSTICA

En este capítulo veremos lo que es la Probabilidad, o sea, la


relación que existe entre la muestra y el conjunto original de datos, por eso
para poder tomar decisiones se necesita tener conocimientos de la
Probabilidad.

En general, la Estadística entra al método científico a través de la


experimentación o de la observación. Cualquier investigación es únicamente
un medio para lograr un fin determinado. Es un dispositivo para someter a
prueba una hipótesis establecida a partir de la cual desea hacerse una
conclusión. La mayor parte de los enunciados que resultan de investigaciones
son únicamente inferencias. Son de carácter incierto. La cuantificación de esa
incertidumbre por el uso de la Teoría de Probabilidades es una de las
contribuciones más importantes de la Estadística.

Probabilidad es una medida de la frecuencia de ocurrencia de un


evento casual. Una definición clara y simple de Probabilidad (definición
clásica), es:

“Si un evento puede ocurrir de N maneras mutuamente


exclusivas e igualmente posibles, y si n de ellas tienen una característica E ,
n
entonces la Probabilidad de ocurrencia de E es la fracción . Esto se
N
n
acostumbra indicarlo o representarlo con P(E) = .”
N

Para el estudio de la Probabilidad surge como necesidad el


estudio de la Teoría de conjuntos, por lo cual veremos a continuación su
definición y sus operaciones básicas.

76
PROBABILIDAD Y ESTADÍSTICA

CONJUNTOS Y SUS OPERACIONES

El estudio de la Probabilidad se simplifica utilizando la Teoría de


Conjuntos, por lo tanto, analizaremos algunas ideas básicas de esta teoría. La
Teoría de Conjuntos fue desarrollada por Georg Cantor entre 1874 y 1895, es
un instrumento básico que se utiliza en las distintas ramas de la Matemática,
como en la Teoría de Probabilidad, el Cálculo Infinitesimal, Geometría, etc.

Un Conjunto es un grupo de objetos dentro de un todo definido y


bien diferenciado; por ejemplo:
* Un grupo de estudiantes de la materia de Biología.
* Un juego de cartas.
* Las cuentas de un collar.

A continuación definiremos algunas de las operaciones y


símbolos que se utilizan en la Teoría de Conjuntos. A los conjuntos los
representamos con mayúsculas y a sus elementos con minúsculas.

* Conjunto Universo o Universal ( U ): Es el conjunto que contiene a


todos los elementos.
* Conjunto Vacío (  ): Es un conjunto que no contiene a ningún
elemento.
* Pertenencia (  ): Indica que un elemento pertenece a un conjunto.
* No Pertenencia (  ): Indica que un elemento no pertenece a un
conjunto determinado.
* Subconjunto (  ): Se dice que un conjunto A es subconjunto de
B, cuando todos los elementos de A pertenecen a B.

77
PROBABILIDAD Y ESTADÍSTICA

* Unión (  ): La unión de dos conjunto A y B, es el conjunto de


elementos que están en A, en B ó en ambos.
A B={x/xA ó xB}
* Intersección (  ): La intersección de dos conjuntos A y B, es el
conjunto de elemento que están en A y B simultáneamente.
A B={x/xA y xB}
* Complemento ( A', ~A, Ac ) : El conjunto A' , recibe el nombre
de complemento de A debido a que contiene a todos los elementos del
universo que no están en A.
A' = { x / x  A }

Para la comprensión de los conjuntos se recomienda utilizar los


diagramas de Venn, que son la representación gráfica de los conjuntos y sus
operaciones.
U U U

AUB AB Ac

* Sea A = { a, b, c, d, e, f, g, h, y, j, k, l, m, n, o, p, q, r, s, t };
B = { a, e, i, o, u } ;
C = { b, c, d, f, g, h, j, k, l, m, n, p, q, r, s, t } y
el conjunto Universo el abecedario. Realizar las siguientes operaciones entre
conjuntos:

a) AUB; b) A(BUC) c) (AB)U(BC)


a) A U B = { a, b, c, d, e, f, g, h, y, j, k, l, m, n, o, p, q, r, s, t, u }

78
PROBABILIDAD Y ESTADÍSTICA

b) A  ( B U C ) = { a, b, c, d, e, f, g, h, y, j, k, l, m, n, o, p, q, r, s, t } = A
c) ( A  B ) U ( B  C ) = { a, e, i, o }
* Sea U el conjunto de todos los valores posibles que pueden
caer al lanzar dos dados normales, defina los siguientes conjuntos : el
conjunto A contiene a todos los elementos en que la primera cara es mayor
que 3 pero menor que 6, A = { ( x, y ) / 3 < x < 6 ; 0 < y < 7 } ; el conjunto B
contiene a todos los elementos en que la suma de las caras es mayor que 5
pero menor que 8, B = { ( x, y ) / 5 < x + y < 8 }
(1,1) ; (1,2) ; (1,3) ; (1,4) ; (1,5) ; (1,6) 
(2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6) 
 
(3,1) ; (3,2) ; (3,3) ; (3,4) ; (3,5) ; (3,6) 
Sea U =  
(4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6) 
(5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6) 
 
(6,1) ; (6,2) ; (6,3) ; (6,4) ; (6,5) ; (6,6) 

(1,5) ; (1,6) ; (2,4) 


(4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6)  (2,5) ; (3,3) ; (3,4) 
entonces, A =   y B= 
(5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6)  (4,2) ; (4,3) ; (5,1) 
(5,2) ; (6,1) 

¿QUE ES ESPACIO MUESTRAL?

El Espacio Muestral se define como el conjunto de todos los


resultados posibles de un experimento E, usualmente se designa a este
conjunto con la letra S. Un Espacio Muestral se puede representar por medio
de un diagrama de Venn, una línea recta, un producto cartesiano, etc.
Producto Cartesiano : Es el conjunto de todos los pares
ordenados de dos conjuntos A y B.
A X B = { (x , y) / x  A , y  B }

79
PROBABILIDAD Y ESTADÍSTICA

Debemos tener cuidado de respetar el orden de las parejas


ordenadas, ya que ( a, b ) es diferente de ( b, a ). Lo anterior puede describirse
con la siguiente gráfica:

M (a,b) c

N (b,a) b M

MN a N

B
a b c

El número de elementos del espacio muestral1 del Producto


Cartesiano es igual al producto del número de elementos de A por el de B.
Ejemplo: En la gráfica anterior se tiene un espacio muestral de 9 elementos, el
cual se obtuvo de n(A) x n(B).

* Dados los siguientes conjuntos:


U = { 1,5,7,13,15,18,23,29,37,48,63,71,96 }
A = { 1,5,7,13,15,18,23 } B = { 7,15,23,29,37,48,63 }
C = { 7,8 }
Obtener: a) A U B ; b) A' U A ; c) A  B ; d) B' U A ; e) A X C
a).- A U B = { 1,5,7,13,15,18,23,29,37,48,63 }
b).- A' = { 29,37,48,63,71,96 }
A' U A = { 1,5,7,13,15,18,23,29,37,48,63,71,96 } = U
c).- A  B = { 7,15,23 }

1 Dentro de los espacios muestrales cuando tenemos un conjunto de varios elementos, el orden de estos
no se toma en cuenta, esto es, {a,b} y {b,a} son conjuntos equivalentes.

80
PROBABILIDAD Y ESTADÍSTICA

d).- B' = { 1,5,13,18,71,96 }


B' U A = { 1,5,13,15,23,71,96 }
e).- A X C = { (1,7);(1,8);(5,7);(5,8);(7,7);(7,8);(13,7);(13,8);
(15,7);(15,8);(18,7);(18,8);(23,7);(23,8) }

SUCESOS SIMPLES Y COMPUESTOS

En un conjunto de resultados posibles de un experimento E. Los


sucesos pueden ser Simples o Compuestos.

Consideremos el experimento de lanzar un dado y observar que


cara cae hacia arriba, la variable X tiene los resultados posibles X1, X2 ,* * *,
X6, cada uno de estos resultados se denomina Suceso Elemental Simple. En
otras palabras, un suceso simple es aquel que no se puede descomponer en
otros sucesos simples y se representa con Ei .

Un suceso que se puede descomponer en dos o más sucesos


simples se llama Suceso Compuesto, por ejemplo, en el lanzamiento de un
dado, la ocurrencia de X  3, es un Suceso Compuesto, ya que tendríamos que
el suceso E estaría constituido por todas las caras de el dado de valor mayor o
igual a 3, quedando de la siguiente manera : E = { 3,4,5,6 }.

Una vez definidos los sucesos, se expresarán ahora en términos


de la Teoría de Conjuntos. El conjunto Universo representará al espacio
muestral, mientras que los conjuntos que lo constituyan serán los sucesos
compuestos y sus elementos los sucesos simples.

81
PROBABILIDAD Y ESTADÍSTICA

PROBABILIDAD
La Probabilidad tiene dos enfoques, llamados enfoques de la

teoría de Probabilidades, los cuales son: El enfoque objetivo de la

probabilidad y el enfoque subjetivo de la probabilidad. En este cuaderno

definiremos únicamente el concepto de probabilidad y dejaremos el estudio

de estos enfoques a los cursos de Estadística del Nivel Superior.

El famoso matemático Jacobo Bernoulli señala que cuando no


hay fundamentos para preferir uno de los posibles resultados o sucesos a
cualquier otro, todos deben de considerarse que tienen la misma probabilidad
de ocurrir. El famoso matemático francés P. S. Laplace estableció este
concepto en su libro “A Philosophical Essay on Probabilities” de esta manera:
“La teoría de la probabilidad consiste en reducir todos los elementos de la
misma clase a cierto número de casos iguales o igualmente posibles, es decir,
que nosotros debemos estar igualmente indecisos ante su existencia para
determinar la cantidad de casos favorables para el suceso cuya probabilidad se
busca”. La relación de este número con el de todos los casos posibles es la
medida de la probabilidad, que, es por tanto sencillamente una fracción cuyo
numerador es el número de casos favorables y el denominador es el número
de todos los casos posibles (definición de probabilidad clásica).

Por otra parte, puesto que los cálculos de la probabilidad no


dependen de la experiencia, esto permite calcular las probabilidades sin

82
PROBABILIDAD Y ESTADÍSTICA

realizar una gran cantidad de ensayos. Este tipo de cálculos se denomina


algunas veces a priori.

En base a lo anterior podemos especificar algunos puntos

referentes a la teoría de probabilidades, los cuales son:

1.- Se asigna un número P(E) al suceso y lo da cuando la cantidad

de ensayos es grande, M/n y P(E) son iguales.

2.- En esta relación se define la probabilidad del suceso E como


el límite de M/n cuando n tiende a infinito. Matemáticamente este enfoque
se expresa así:
M
P(E) = ln ím
n

Veamos algunos ejemplos de cálculo de probabilidades.

* ¿Cuál es la probabilidad de que al lanzar dos dados legales, a)


la suma de las caras sea par? ; b) las caras sean diferentes? ; c) las caras sean
iguales?
(1,1) ; (1,2) ; (1,3) ; (1,4) ; (1,5) ; (1,6) 
(2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6) 
 
(3,1) ; (3,2) ; (3,3) ; (3,4) ; (3,5) ; (3,6) 
S=  
(4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6) 
(5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6) 
 
(6,1) ; (6,2) ; (6,3) ; (6,4) ; (6,5) ; (6,6) 

M 18 1
a).- P(A) = = =
n 36 2

83
PROBABILIDAD Y ESTADÍSTICA

30 5
b).- P(B) = =
36 6

6 1
c).- P(C) = =
36 6

* ¿Cuál es la probabilidad de sacar una bola roja de una urna si se


sabe que en ella hay 5 bolas blancas, 4 negras, 3 azules y 8 rojas?

A = Sacar una bola roja.


S = {5 blancas, 4 negras, 3 azules, 8 rojas}
8 2
P(A) = = = 0.40 x 100 = 40 %
20 5

* Dado que se lanzan 3 monedas legales, ¿cuál es la


probabilidad de que caigan exactamente una cara? ; dos caras?

Sea s = cruz y c = cara, entonces al lanzar la moneda tres veces


tenemos: S = {sss, ssc, scs, css, ccs, csc, scc, ccc}
A = {ssc, scs, css} B = {ccs, csc, scc}
3 3
P(A) = = 0.375 x 100 = 37.5 % P(B) = = 0.375 x 100 = 37.5 %
8 8
Un punto de vista personalista es que la probabilidad mide la
confianza que tiene un individuo determinado en la verdad de una
proposición particular, por ejemplo, la proposición de que mañana llueva.
Estos puntos de vista postulan que el individuo en cuestión de algún modo es
razonable, pero no niega la posibilidad de que los individuos razonables con
la misma prueba, puedan tener diferentes grados de confianza en la verdad de
la misma proposición.

84
PROBABILIDAD Y ESTADÍSTICA

AXIOMAS DE LA TEORÍA DE PROBABILIDAD

A continuación se establecen los axiomas de la Teoría de la


Probabilidad. Aunque se emplea la palabra axioma, éstas no son apriori, son
suposiciones básicas elaboradas por el hombre. Los axiomas son:

a) Dado un experimento E con resultados posibles mutuamente

excluyentes ( sucesos simples ) E1 , E2 , . . ., En , se les asigna un número

positivo tal que 0  P( Ei )  1 y se le llama la probabilidad del suceso Ei .

b) La suma de probabilidades de todos los sucesos posibles

mutuamente excluyentes es 1. P( E1 ) + P( E2 ) + * * * + P( En ) = 1

c) La probabilidad de que ocurra uno de dos sucesos mutuamente

excluyentes Ei ó Ej , es igual a la suma de sus probabilidades.

P( Ei U Ej ) = P( Ei ) + P( Ej ).

Para aclarar el significado de estos tres axiomas se puede utilizar


la teoría de la frecuencia probabilística. De acuerdo con la Teoría de
Probabilidad subjetiva se puede utilizar las ponderaciones para expresar la
importancia relativa de un suceso. Estos axiomas se utilizarán para deducir
otras reglas de cálculo de probabilidades.

85
PROBABILIDAD Y ESTADÍSTICA

ANÁLISIS COMBINATORIO

El enfoque del concepto de probabilidad planteado en el punto


anterior, genera todo un trabajo alrededor del cálculo de probabilidades y
como una herramienta ineludible para esto, se tiene al análisis combinatorio,
cabe aquí recordar a manera de repaso los elementos que éste nos
proporciona, considerando que un análisis más a fondo corresponde a un
curso de Álgebra; únicamente enunciaremos las dos reglas generales que se
utilizan en el cálculo de probabilidades.

Permutaciones: Es el número de maneras de ordenar n objetos


distintos (diferentes), tomando r cada vez. Se denota con el símbolo nP r .

n!
nPr =
(n - r)!

Combinaciones: Una combinación r de n objetos, es una


selección de r en r de dichos objetos sin considerar el orden de la misma.
Se representa con el símbolo nCr.

P
n r n!
n Cr = =
r! (n - r)!  r!

* Se seleccionan tres boletos de una lotería, de un total de 50.


Supongamos que el orden de selección es importante. ¿Cuántos puntos
muéstrales están asociados con este experimento?

El número total de puntos muéstrales es :


50 ! 50 !
50P3 = = = 50(49)(48) = 117,600
(50 - 3) ! 47 !

86
PROBABILIDAD Y ESTADÍSTICA

* Un aparato está compuesto de cinco partes que pueden ser


ensambladas en cualquier orden. Se desea realizar una prueba para determinar
el tiempo necesario para cada una de las formas posibles de montaje. Si cada
una de las formas se va aprobar una vez, ¿cuántas pruebas deben realizarse?

5! 5!
5P 5 = = = (5)(4)(3)(2)(1) = 120
(5 - 5)! 0!

* Un tubo de radio se puede adquirir en cinco fábricas. ¿De


cuántas formas se pueden escoger tres de las cinco fabricas?

5! 5! (5)(4)(3 !) 5  4
5 C3 = = = = = 10
(5 - 3)!  (3 !) (2 !)  (3 !) (2 !)  (3 !) 2  1

* Una compañía desea ascender a 3 de sus 24 gerentes para


colocarlos en las posiciones de vice presidente de ventas, de manufacturas y
de finanzas. ¿Cuántas opciones distintas se tienen para efectuar estos
ascensos?

R.- Como si nos importa el orden, entonces tenemos una


permutación, debido a que los puestos son A, B y C, y los trabajadores
pueden ocupar el que sea, por lo tanto:

24 ! (24)(23)(22)(21 !)
24P3 = = = 24  23  22 = 12,144 opciones
( 24 - 3 ) ! 21 !

* Un experimento consiste en asignar 10 trabajadores a 10


empleos. ¿De cuántas formas distintas se pueden asignar estos 10 trabajadores
a estos 10 empleos?
10 ! 10 !
10P10 = = = 10 ! = 3' 628,800 formas distintas
(10 - 10) ! 0!

87
PROBABILIDAD Y ESTADÍSTICA

* ¿De cuántas maneras podemos permutar 7 libros que se


encuentran en un estante?.
7! 7!
7P7 = = = 7 ! = 5,040
(7 - 7)! 0!

* ¿De cuántas maneras posibles se pueden permutar esos libros si


dos de ellos deben de estar siempre juntos?
6! 6!
6P6 = = = 6 ! = 720
(6 - 6)! 0!

Se multiplica el resultado por dos ya que esos dos libros pueden cambiar de
lugar entre ellos, estando juntos, por lo tanto el número de permutaciones que
puede haber es: # de arreglos = (720)(2) = 1440

* ¿ De cuántas maneras posibles puedo tomar de dos en dos las


vocales sin interesarnos el orden ?.
5! (5)(4)(3 !) 5  4
5 C5 = = = = 10
(5 - 2) ! (2 !) (3 !)  (2 !) 2  1

PROBABILIDAD CONDICIONAL
En la práctica es común enfrentarnos al problema de obtener la
probabilidad de un evento, condicionado a la ocurrencia o no ocurrencia de
otro, esto es, el caso en que la ocurrencia de un evento altera las condiciones
de las que depende la probabilidad del otro, estas probabilidades se llaman
probabilidades condicionadas. Si A y B son los eventos en cuestión,
tenemos que P(A/B) es la probabilidad de A dado que ya ocurrió el evento
B. P(B/A) es la probabilidad de B dado que A ya ocurrió.

Sea S el espacio muestral de E y sean A y B eventos


definidos en S. Si preguntamos por la probabilidad de A dado que ocurrió

88
PROBABILIDAD Y ESTADÍSTICA

B, el espacio se reduce sólo a lo comprendido en el conjunto B y viceversa,


como se observa en el diagrama:

A B

Definiremos las probabilidades condicionales de B dado A y


de A dado B, como sigue:

P(A  B) P(A  B)
P( A B ) = Y P( B A ) =
P(B) P(A)

INDEPENDENCIA PROBABILISTICA
Se dice que dos sucesos son independientes si la ocurrencia o no
ocurrencia de uno de ellos no cambia la probabilidad de ocurrencia del otro, a
esto se le llama independencia probabilística. Sí A y B son eventos
independientes, tenemos que : P(A/B) = P(A) y P(B/A) = P(B).

LEYES DE PROBABILIDAD
Las leyes pueden ser simplemente enunciadas y tomadas como
ciertas mientras sean consistentes con nuestro modelo y con la realidad.

Ley Aditiva de Probabilidad: Esta ley se aplica a las uniones y


es igual a:

89
PROBABILIDAD Y ESTADÍSTICA

P ( A U B ) = P ( A ) + P ( B ) - P (A  B )

sí A  B = , se dice que A y B son mutuamente excluyentes, entonces:

P(AUB)=P(A)+P(B)

Ley Multiplicativa de Probabilidad: Esta ley se aplica a las


intersecciones y es igual a:
P(A B)=P(A) * P(B/A)=P(B)*P(A/B)

Sí A y B son independientes, entonces P ( A  B ) = P ( A ) * P ( B )

Un experimento a menudo produce observaciones numéricas que


varían de muestra a muestra. Por esta razón se define una variable aleatoria
como una función con valores numéricos definida sobre un espacio muestral.
En otras palabras, una variable X es una variable aleatoria si el valor que
asume es un suceso numérico aleatorio. Un ejemplo de suceso numérico es el
valor de cierre diario de ciertas acciones industriales.

Las variables aleatorias se clasifican en discretas y continuas.


Una Variable Aleatoria Discreta es una variable que sólo puede asumir un
conjunto numerable de valores. Veamos algunos ejemplos:
* El número de tornillos defectuosos en una muestra de 100,
extraída de una producción industrial.
* El número de casas rurales que tienen agua potable en una
región.
* El número de personas que esperan en el consultorio de un
dentista.

90
PROBABILIDAD Y ESTADÍSTICA

Una Variable Aleatoria Continua es una variable que puede


asumir un número infinitamente grande de valores correspondientes a los
puntos sobre un intervalo en una línea recta. Ejemplos:

* El tiempo de vida de una célula humana.


* La cantidad de lluvia que cae en Ixtlahuacán durante una hora.
* La cantidad de azúcar en una manzana.

Veamos algunos ejercicios referentes a este capítulo.

* Dado que se lanzan dos dados normales, ¿Cuál es la


probabilidad de que la suma de las caras sea 4, si se sabe:
a) que cayeron dos caras impares?
(1,1) ; (1,2) ; (1,3) ; (1,4) ; (1,5) ; (1,6) 
(2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6) 
 
(3,1) ; (3,2) ; (3,3) ; (3,4) ; (3,5) ; (3,6) 
S=  
(4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6) 
(5,1) ; (5,2) ; (5,3) ; (5,4) ; (5,5) ; (5,6) 
 
(6,1) ; (6,2) ; (6,3) ; (6,4) ; (6,5) ; (6,6) 

A = { (1,3) (3,1) (2,2) }


B = { (1,1) (1,3) (1,5) (3,1) (3,3) (3,5) (5,1) (5,3) (5,5) }
A  B = { (1,3) (3,1) }
P( A  B ) = 2 / 36 = 1/18 P( B ) = 9 / 36 = 1 / 4
P( A / B ) = P( A  B) / P( B ) = ( 2 / 36 ) / ( 9 / 36 ) = 2 / 9
b) que la primera cara es par?
(2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6) 
 
C = (4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6) 
(6,1) ; (6,2) ; (6,3) ; (6,4) ; (6,5) ; (6,6) 
 

A  C = { (2,2) }

91
PROBABILIDAD Y ESTADÍSTICA

P( A  C ) = 1 / 36 P( C ) = 18 / 36 = 1 / 2
P( A / C ) = P( A  C ) / P( C ) = ( 1 / 36 ) / ( 18 / 36 ) = 1 / 18
c) que al menos una cara es par?
(1,2) ; (1,4) ; (1,6) ; (2,1) ; (2,2) ; (2,3) ; (2,4) ; (2,5) ; (2,6) 
 
D = (3,2) ; (3,4) ; (3,6) ; (4,1) ; (4,2) ; (4,3) ; (4,4) ; (4,5) ; (4,6) 
(5,2) ; (5,4) ; (5,6) ; (6,1) ; (6,2) ; (6,3) ; (6,4) ; (6,5) ; (6,6) 
 

A  D = { (2,2) }
P( A  D ) = 1 / 36 P( D ) = 27 / 36 = 3 / 4
P( A / D ) = P( A  D ) / P( D ) = ( 1 / 36 ) / ( 27 / 36 ) = 1 / 27
d) que la primera cara es 1?
E = { (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) }
A  E = { (1,3) }
P( A  E ) = 1 / 36 P( E ) = 6 / 36 = 1 / 6
P( A / E ) = P( A  E ) / P( E ) = ( 1 / 36 ) / ( 6 / 36 ) = 1 / 6

* Se tienen dos urnas, en la urna A hay 8 bolas blancas, 6 rojas y


6 azules y en la B 4 blancas, 5 rojas y 6 azules.
a) ¿Cuál es la probabilidad de sacar una bola blanca de la urna A?
P(A) = M/n = 8/20 = 2/5 = 0.40 x 100 = 40 %
b) ¿Cuál es la probabilidad de sacar una azul de la urna B?
P(B) = 6/15 = 2/5 = 0.40 x 100 = 40 %
c) ¿Cuál es la probabilidad de sacar una roja de la urna A ó B?
P(A  B) = P(A) + P(B) = 6/20 + 5/15 = 19/30 = 0.633 x 100 = 63.3 %
d) ¿Cuál es la probabilidad de sacar una azul de la urna A y B?
P(A  B) = P(A) * P(B) = (6/20)(6/15) = 36/300 = 0.12 x 100 = 12 %

92
PROBABILIDAD Y ESTADÍSTICA

* Los pacientes que llegan a una clínica pueden seleccionar una


de tres secciones para ser atendidos. Supongamos que los médicos se asignan
al azar a las secciones y que los pacientes no tienen preferencia especial por
ninguna de las secciones. Tres pacientes llegan a la clínica y se registra la
sección que escogen.

a) Haga una lista de los puntos muéstrales para este experimento.


Los puntos muéstrales serán los escogidos por los pacientes entre las
secciones 1, 2 y 3, teniéndose entonces que:

(111) ; (112) ; (113) ; (121) ; (122) ; (123) ; (131) ; (132) ; (133) 


 
S = (211) ; (212) ; (213) ; (221) ; (222) ; (223) ; (231) ; (232) ; (233) 
(311) ; (312) ; (313) ; (321) ; (322) ; (323) ; (331) ; (332) ; (333) 
 

b) Sea A el suceso de que cada sección recibe un paciente. Haga una lista
de los puntos muéstrales de A.
A = { (123) ; (132) ; (213) ; (231) ; (312) ; (321) }

c) Haga una asignación razonable de probabilidad a los puntos muéstrales


y encuentre P(A).
Sea Ei cada evento, entonces la P( Ei ) = 1/27 ; por lo tanto la
P(A) se obtiene de la suma de 6 eventos posibles, teniéndose entonces que :
P(A) = 6 / 27 = 2 / 9

* Se le pide a un catador de té que pruebe y clasifique tres


variedades de té, A, B y C, de acuerdo a su preferencia.

a) Defina el experimento.
Ordenar A, B y C para poder llevar a cabo el proceso.

93
PROBABILIDAD Y ESTADÍSTICA

b) Haga una lista de los puntos muéstrales.


S = { (ABC) ; (ACB) ; (BAC) ; (BCA) ; (CBA) ; (CAB) }

c) Si el catador no tuviera habilidad para distinguir la diferencia de sabor


entre los tres tipos de té, ¿cuál es la probabilidad de que concluya que el té de
tipo A es el mejor?

Como en dos de las seis ocasiones de los puntos muéstrales


coloca a el té de tipo A como mejor que los otros dos, tenemos entonces de
que la probabilidad de que escoja al té de tipo A como el mejor es:

P( A) = 2 / 6 = 1 / 3 = 0.333 x 100 = 33.3 %

* Los avisos comerciales de televisión se diseñan para atraer a la


audiencia más probable del programa que se está auspiciando. Sin embargo,
S. Ward en su trabajo “Reacciones de los niños a los Avisos Comerciales”,
observa que los niños frecuentemente poseen una comprensión baja de los
avisos comerciales, aún de aquellos diseñados para atraer especialmente a los
niños. Las investigaciones de Ward demuestran que los porcentajes de niños
que comprenden los avisos comerciales para diferentes edades son los
especificados en la siguiente tabla.

Edad
5 - 7 8 - 10 11 - 12
No comprenden 55 % 40 % 15 %
Comprenden 45 % 60 % 85 %

94
PROBABILIDAD Y ESTADÍSTICA

En un experimento de laboratorio para evaluar la comprensión de los avisos


comerciales, se muestra a un niño de 6 años y a un niño de 9 años.

a) ¿Cuál es la probabilidad de que el mensaje sea entendido por el niño de


6 años?
R.- La probabilidad de que el aviso sea entendido por el niño de 6
años es 45 %, ya que para el niño de 6 años existen dos valores posibles, los
cuales son el que entienda y el que no entienda, por lo tanto según la tabla
mostrada por Ward tenemos que el niño de 6 años comprende el mensaje con
una probabilidad de 45 %.

b) ¿Cuál es la probabilidad de que ambos niños comprendan el aviso?


R.- Como la probabilidad de que el niño de 6 años comprenda es
independiente de la del niño de 9 años, tenemos un evento independiente,
por lo tanto el producto de las probabilidades de que los dos niños
comprendan el aviso será la probabilidad de que ambos niños lo comprendan,
teniéndose entonces que: P(Comprendan ambos niños) = (0.45)(0.60) =
0.27x100 = 27%

EJERCICIOS PROPUESTOS
1.- Un inversionista tiene la oportunidad de invertir en tres de cinco tipos
recomendados de acciones. El inversionista no sabe que sólo dos de los
cinco tipos producirán un beneficio sustancial en los próximos 5 años.
Si el inversionista selecciona los tres tipos de acciones al azar (dándole
a cada combinación de tres tipos la misma probabilidad de selección),

95
PROBABILIDAD Y ESTADÍSTICA

¿cuál es la probabilidad de que seleccione los dos tipos de acciones más


beneficiosos?
2.- Se lanzan dos dados normales, ¿cuál es la probabilidad de que la suma
de los dos números que aparecen sea igual a 7?, ¿ igual a 11?
3.- Cuatro trabajadores, de los cuales dos pertenecen a un grupo
minoritario, se asignan a cuatro empleos netamente distintos.
a) Defina el experimento.
b) Haga una lista de los puntos muéstrales en S.
c) Si la asignación de empleos es imparcial, es decir, si una
asignación es tan probable como cualquier otra, ¿cuál es la
probabilidad de que los dos trabajadores del grupo minoritario
sean asignados a los dos empleos menos deseables?
4.- Una encuesta entre consumidores en una comunidad particular mostró
que el 10 % no quedó satisfecho con los trabajos de plomería hechos en
sus casas. 50 % de las quejas fueron respecto al plomero A, si el
plomero A hace el 40 % de los trabajos de plomería en la ciudad, ¿cuál
es la probabilidad de obtener:
a) Un trabajo de plomería no satisfactorio, si fue el plomero A?
b) Un trabajo satisfactorio, dado que el plomero es A?
5.- En cada uno de los siguientes casos, indique si la variable es discreta o
continua:
a) El número de homicidios en Ixtlahuacán durante un mes.
b) El tiempo que transcurre entre la llegada de pacientes a una
clínica.
c) El número de errores de mecanografía por página.
d) El tiempo requerido para terminar un examen.

96
PROBABILIDAD Y ESTADÍSTICA

e) El número de bombillos defectuosos en un paquete que contiene


4 bombillos.
6.- Si se lanzan tres monedas legales, ¿cuál es la probabilidad de que caiga:
a) Una cara o más?
b) Al menos un sol?
c) Exactamente dos caras?
7.- De cuántas formas se pueden sentar diez personas en una banca con
espacio para cuatro.
8.- De cuantas formas puede elegirse una comisión de cinco personas de
entre nueve.
9.- Si hay seis bulbos defectuosos en lote de cien y se hace una selección
aleatoria de dos bulbos sin reemplazo, ¿cuál es la probabilidad de que:
a) se seleccione un bulbo bueno y uno defectuoso?
b) se escojan dos bulbos en buen estado?
c) se seleccionen dos bulbos defectuosos?
d) se elijan uno o más bulbos defectuosos?
e) se tomen uno o más bulbos en buen estado?

97
PROBABILIDAD Y ESTADÍSTICA

En esté capítulo se explicarán algunas distribuciones de muestreo


que son necesarias en un curso de Probabilidad y Estadística, como son: La
Distribución de Poisson, La Distribución Binomial, La Distribución Normal y
La Distribución t de Student. Este tipo de distribución corresponde a el tipo
de variable aleatoria continua, ya que la distribución de variable aleatoria
discreta la podemos observar en las frecuencias relativas de los cuadros
estadísticos presentados en el capítulo dos.

Para obtener una distribución de probabilidad con variable


aleatoria continua, notamos que la probabilidad de que X se encuentre entre
dos valores diferentes tiene significado. Esta idea y las siguientes
propiedades:

1.- f(X)  0



2.- 
f ( x ) dx  1

nos conducen a postular la existencia de una función f(x), donde


x (  , ) . Entonces definimos la probabilidad de que x  [a,b], como:

 f ( x ) dx
b
P (a  x  b)  a

de donde se puede demostrar que esta definición satisface los axiomas de


probabilidad dados en el capítulo 6. Una función f(x) que satisface los
requisitos anteriores se llama función de probabilidad o distribución de
probabilidad para variable aleatoria continua, pero con mayor frecuencia se le
denomina función de densidad de probabilidad o simplemente función de
densidad.

98
PROBABILIDAD Y ESTADÍSTICA

DISTRIBUCION BINOMIAL

Es una de las distribuciones de probabilidad que se encuentra con


mayor frecuencia en Estadística aplicada. La distribución se obtiene de un
proceso conocido como Ensayo de Bernoulli2.

Cuando un ensayo de algún experimento puede conducir sólo a


uno o dos resultados mutuamente excluyentes, tales como: muerto ó vivo, día
ó noche, masculino ó femenino, cara ó cruz, etc. , el ensayo se conoce con el
nombre de Ensayo de Bernoulli. Una sucesión de Ensayos de Bernoulli
forman un Proceso de Bernoulli, bajo las siguientes condiciones:

1.- Cada ensayo conduce a uno de dos resultados posibles mutuamente


excluyentes denominados por éxito (p) o fracaso (q).

2.- La probabilidad de éxito denotada por (p), permanece constante de


ensayo a ensayo. La probabilidad de fracaso (q) es 1-p.

3.- Los ensayos son independientes, es decir, el resultado de uno no es


afectado por el resultado del otro.

A continuación veremos la fórmula para obtener la probabilidad


aplicando la Distribución Binomial, enunciando que esta distribución sirve
para obtener la probabilidad de un evento cuando se tienen muestras grandes
y probabilidades grandes.

P( x ) = nCx * px*qn - x

2 James Bernoulli (1654-1705), matemático suizo que realizó importantes contribuciones en el campo de la
probabilidad.

99
PROBABILIDAD Y ESTADÍSTICA

n !
Como: nCx =
(n - r)!  r!

n!
entonces: P( x ) =  p x  q n-x
(n - r)!  r!

donde: n = Tamaño de la muestra.


x = No. de elementos tomados de la muestra.
p = Probabilidad de éxito.
q = 1 - p = Probabilidad de fracaso.

A la expresión anterior se le conoce como Distribución de


Probabilidad Binomial, y debe de cumplir con:

a).- P(X)  0 para todos los valores de x.


b).-  P(X) = 1
c).- n  1, ya que debe de existir una muestra.

Hablando estrictamente el uso de la Distribución Binomial es


aplicable en aquellos casos en donde el muestreo es a partir de una población
finita con reemplazo. Como en la práctica real frecuentemente se extraen las
muestras sin reemplazo de poblaciones finitas, surge naturalmente la pregunta
de lo apropiado de la Distribución Binomial bajo estas circunstancias. El que
la Distribución Binomial sea apropiada o no, depende de que tan drástico sea
el efecto de estas condiciones sobre las circunstancias de éxito de ensayo a
ensayo. En general se conviene que cuando n es pequeño relativo a N, el
modelo de la Distribución Binomial resulta el más apropiado. Algunos
autores mencionan que n es pequeña respecto a N , si N por lo menos es 10
veces mayor que n.

100
PROBABILIDAD Y ESTADÍSTICA

* Supóngase que la tasa de mortalidad para cierta enfermedad de


una población es 0.1 , supóngase que la contraen 10 personas, ¿cuál es la
probabilidad de que:
a).- ninguna sobreviva?
p = 0.1
q = 0.9
10 !
x = 10 P(10) =  (0.10)10  (0.90) 10-10
(10 - 10)!  10!
n = 10
= ( 1 )( 1 x 10- 10 )( 1 ) = 1 x 10- 10 x 100
= 1 x 10- 8 %

b).- el 50 % se muera?
p = 0.1
q = 0.9
10 !
x=5 P(5) =  (0.10) 5  (0.90) 10-5
(10 - 5)!  5!
n = 10
= ( 252 )( 1 x 10- 5 )( 0.59049 )
= 0.1488 %

c).- al menos 3 mueran?


p = 0.1 P(X  3) = P( 3 ) + P( 4 ) + · · · + P( 10 )
q = 0.9
x = 0,1,2 = 1 - [ P( 0 ) + P( 1 ) + P( 2 ) ]
n = 10

10 ! 10 ! 10 !
P(X  3) = 1 - [  (.10)0 (.90)10-0   (.10)1  (.90)10-1   (.10)2  (.90)102]
(10-0)! 0! (10-1)!1! (10-2)! 2!

P(X  3) = 1 - [0.3486 + 0.3874 + 0.1937] = 1 - 0.9297 = 0.0703 x 100

P(X  3) = 7.03 % es el valor de la probabilidad de que 3 o más mueran.

d).- exactamente 3 se mueran?

101
PROBABILIDAD Y ESTADÍSTICA

p = 0.1
q = 0.9
10 !
x=3 P(3) =  (0.10) 3  (0.90) 10-3
(10 - 3)!  3!
n = 10
= 120 * ( 1 x 10- 3 )( 0.4782 )
= 0.0573 x 100 = 5.73 %

DISTRIBUCION DE POISSON
La Distribución de Poisson3 es usada con amplitud en Biología,
Medicina y en todas las ramas de las Ciencias Sociales, sin embargo existen
muchos problemas en los que es bastante útil. Si x es el número de
ocurrencias de un evento aleatorio en un intervalo de tiempo o espacio, la
probabilidad de que ocurra x está dada por:

e -   x

P( x ) =
X !

donde x = 0, 1, 2, 3, . . . ;  = parámetro de la distribución y es el número


promedio de ocurrencias del evento aleatorio en el intervalo; e = 2.7183 ,
que es una constante del número exponencial. Puede demostrarse también
que:
1.- f(x)  0
2.-  f(x) = 1

de modo que la distribución satisface los requerimientos para la distribución


de una probabilidad. Se ha observado que la Distribución Binomial surge a
partir de un conjunto de suposiciones acerca de un proceso fundamental que

3 Simond Denis Poisson (1781 - 1840) matemático francés a quien se le acreditó la publicación de su deducción en 1837.

102
PROBABILIDAD Y ESTADÍSTICA

proporciona un conjunto de observaciones numéricas. Este también es el caso


de la Distribución de Poisson que además cumple con las siguientes
proposiciones:

1.- La ocurrencia de los eventos son independientes.


2.- Teóricamente debe ser posible un número infinito de ocurrencias del
evento en el intervalo.
3.- La probabilidad de la ocurrencia única del evento en un intervalo
dado, es proporcional a la longitud del intervalo.
4.- En cualquier porción infinitesimal del intervalo debe despreciarse la
probabilidad de más de una ocurrencia en el evento.
5.- Una particularidad de la distribución de Poisson es que la varianza y
la media son iguales.

La Distribución de Poisson tiene muchas aplicaciones, así mismo


mencionaremos que este tipo de distribución se utiliza cuando se tienen
probabilidades grandes y sucesos o eventos pequeños.

* El administrador de un Hospital a observado que las


admisiones de emergencia durante un periodo de varios años se distribuyen de
acuerdo a la ley de Poisson. Los registros del Hospital revelan que durante
este periodo han sido de un promedio de 3 por día. Si el administrador del
Hospital está en lo cierto, hallar la probabilidad de que:
a).- en un día dado ocurran exactamente dos admisiones.
e = 2.7183
e-   x
(2.7183) -3  (3) 2
= 3 P( 2 ) =   0.2240 x 100 = 22.4 %
X! 2!
x=2

103
PROBABILIDAD Y ESTADÍSTICA

b).- en un día particular no ocurra admisión alguna.


e = 2.7183
e -   x

= 3 P( x ) =
X !
x=0

(2.7183) 3  (3) 0
P( 0 ) =  0.04978 x 100 = 4.978 %
0!

c) en un día en particular se admitan 3 ó 4 casos.


e = 2.7183
e -   x

= 3 P( x ) =
X !
x=3ó4

P( 3 ó 4 ) = P( 3 ) + P( 4 )

(2.7183) 3  (3) 3 (2.7183) 3  (3) 4


P( 3 ó 4 ) = 
3! 4!

P( 3 ó 4 ) = 0.2240 + 0.1680 = 0.3920 x 100 = 39.2 %

* El 10 % de los tornillos producidos en una fábrica resultan


defectuosos. Hallar la probabilidad de que en una muestra de 10 tornillos
seleccionados aleatoriamente, exactamente dos estén defectuosos.

a).- Empleando la Distribución Binomial.


n!
P( x ) =  p x  q n-x
(n - r)!  r!
p = 0.1 q = 0.9 x=2 n = 10

10 !
P(2)=  (010 . )102  (45)(001
. ) 2  (090 . )(04304
. )  01937
. x100  19.37 %
(10- 2)! 2!

104
PROBABILIDAD Y ESTADÍSTICA

b).- Empleando la Distribución de Poisson.


e = 2.7183
e -   x

 = n * p = 1 P( x ) =
X !
x=2

( 2 .7183) 1  (1) 2
P(2) =  0.1839 x 100 = 18.39 %
2!

* Si la probabilidad de que un individuo sufra una reacción por


una inyección de un determinado suero es 0.001; determinar la probabilidad
de que de un total de 200 individuos:
a).- exactamente 3 tengan reacción.
e = 2.7183
e -   x

= n * p = 0.2 P( x ) =
X !
x=3
( 2 .7183)  0 .2  ( 0.2 ) 3
P( 3 ) =  0.0010916 x 100 = 0.10916 %
3!

b).- más de dos individuos tengan la reacción.

e = 2.7183
e -   x

= n * p = 0.2 P( x ) =
X !
x = 3, 4, * * * , 200

P(X  2) = P(3) + P(4) + * * * + P(200) = 1 - [ P(0) + P(1) + P(2) ]

( 2.7183) 0.2  ( 0.2 ) 0 ( 2.7183) 0.2  ( 0.2 ) 1 ( 2.7183) 0.2  ( 0.2 ) 2


= 1 - + 
0! 1! 2!

= 1 - (0.813781 + 0.162756 + 0.016275 ) = 1 - 0.992812

= 0.007188 x 100 = 0.7188 %

105
PROBABILIDAD Y ESTADÍSTICA

DISTRIBUCION NORMAL

Uno de los más importantes ejemplos de la distribución continua


es la Distribución Normal, algunas veces denominada Distribución
Gaussiana. La función de densidad para la Distribución Normal está dada por:

1  ( x -  ) 2 / 2 2
f ( x)  e
 2
donde:    x  

µ = media aritmética.
 = desviación estándar.
La función de distribución correspondiente esta dada por:

x
1
 e  (x -  )
2 2
/ 2
F(x) = P(X  x) = dx
  2 -

En este caso decimos que la variable aleatoria X está


normalmente distribuida con media µ y varianza  . Una de las
características de la Distribución Normal es que se va a desplazar sobre el eje
horizontal dependiendo del valor de la media de la siguiente manera:

0 µ1 µ2

106
PROBABILIDAD Y ESTADÍSTICA

Para la distribución, como ya vimos anteriormente en su función


de densidad, el valor de la probabilidad se va a obtener mediante una función
de integración, la cuál no será necesario desarrollar debido a que existen
tablas que podemos utilizar para el cálculo de las probabilidades, además,
sería muy difícil ya que una integral se resuelve mediante una sucesión. Para
el cálculo de la Distribución Normal utilizaremos la Distribución Normal
Unitaria, a la cual se llega desarrollando la integral y encontrando un
parámetro Z con el cual obtendremos el área bajo la curva, que será la
probabilidad buscada.

Y si hacemos que Z sea la variable normalizada de x, tenemos:


X - 
Z=

Ahora bien, si µ = 0 y  = 1 al sustituirlos en F(x) tenemos:
1
f( z ) = e  z/2
2

Este resultado se conoce frecuentemente como la función o la


distribución de densidad normal tipificada. La función de distribución
correspondiente esta dada por:
x x
1 1 1
F(z) = P(Z  z) =
2
e - u2 /2
du =
2

2
e - u2 /2
du
- -0

Esta integral no puede evaluarse por métodos ordinarios. (La


dificultad proviene del hecho que no podemos aplicar el Teorema
Fundamental del Cálculo puesto que no podemos encontrar una función cuya
-u²/2
derivada sea igual a e ). Sin embargo esta función ha sido tabulada
ampliamente, y en el Apéndice se da un extracto de tal tabla. En la siguiente

107
PROBABILIDAD Y ESTADÍSTICA

figura se muestra una representación gráfica de la función de densidad, que


también se conoce como Curva Normal Tipificada.

-3 -2 -1 0 1 2 3

P( -1  Z  1 ) = 0.6827 (68.27 %)
P( -2  Z  2 ) = 0.9545 (95.45 %)
P( -3  Z  3 ) = 0.9973 (99.73 %)

* Hallar el área bajo la curva normal tipificada:


a).- Entre z = 0 y z = 1.2
Utilizando la tabla del Apéndice II (tabla 1), baje por la columna
marcada con z hasta alcanzar el valor 1.2. Luego proceda a la derecha hasta la
columna marcada con 0. El resultado 0.3849 es el área pedida y representa
la probabilidad de que Z esté entre 0 y 1.2, por lo tanto:
P( 0  Z  1.2 ) = 0.3849 x 100 = 38.49 %

b).- Entre z = -0.68 y z = 0


Área pedida = área entre z = 0 y z = +0.68 (por simetría). Por tanto, baje por
la columna z hasta alcanzar el valor 0.6. Entonces, proceda a la derecha hasta
la columna 8; el resultado, 0.2517, es el área pedida y representa la
probabilidad de que Z esté entre -0.68 y 0.

c).- Entre z = -0.46 y z = 2.21


Área pedida = (área entre z = -0.46 y z = 0) + (área entre z = 0 y z = 2.21 ).

108
PROBABILIDAD Y ESTADÍSTICA

En base al mismo proceso tenemos:


Área entre z = -0.46 y z = 0 es: 0.1772
Área entre z = 0 y z = 2.21 es: 0.4864
Área entre z = -0.46 y z = 2.21 es: 0.6636

d).- Entre z = 0.81 y z = 1.94


Área pedida = (área entre z = 0 y z = 1.94) - (área entre z = 0 y z = 0.81)
En base al mismo proceso tenemos:
Área entre z = 0 y z = 1.94 es: 0.4738
Área entre z = 0 y z = 0.81 es: 0.2910
Área entre z = 0.81 y z = 1.94 es: 0.1828

e).- Para z  -1.28


Área pedida = (área entre z = -1.28 y z = 0) + (área a la derecha de z = 0)
Área entre z = -1.28 y z = 0 es: 0.3997
Área a la derecha de z = 0 es: 0.5000
Área para z  -1.28 es: 0.8997

* Si las estaturas de 300 estudiantes están distribuidas


normalmente con media igual a 1.7 metros y desviación típica de 0.1 metros.
Hallar la probabilidad de que:
a).- Los estudiantes sean mayores de 1.85 metros.
x-
z =

µ = 1.7  = 0.1 x = 1.85
1 .8 5 - 1.70 0 .1 5
z=  = 1 .5
0 .1 0 0 .1 0
El área entre 0 y 1.5 es 0.4332; el área pedida es:

109
PROBABILIDAD Y ESTADÍSTICA

( área a la derecha de z = 0 ) - ( 0.4332 ) = 0.0668


entonces P( x  1.85 ) = 0.0668 x 100 = 6.68 %

b).- Cuántos estudiantes tendrán una estatura mayor que 1.85 m.


x = n·p = (300)(0.0668) = 20 estudiantes

c).- Tengan una estatura  1.55 metros


1 .5 5 - 1 .7 0 - 0 .1 5
z=  = - 1 .5
0 .10 0 .1 0
El área pedida es para z  -1.5, por lo tanto la probabilidad es:
P( x  1.55 ) = 0.5000 - 0.4332 = 0.0668 x 100 = 6.68 %

* Las ventas diarias de un pequeño restaurante tienen una


distribución normal aproximada con media = 530 y desviación típica de 120.
a).- ¿Cuál es la probabilidad de que las ventas excedan los 700 un día dado?
7 00 - 53 0 170
z=  = 1.41 6
120 120
P( x  700 ) = 0.5000 - 0.4207 = 0.0793 x 100 = 7.93 %
b).- ¿Cuál es la probabilidad de que las ventas sean menores de 300?
3 00 - 5 3 0 - 230
z=  = - 1.91 6
120 120
P( x  300 ) = 0.5000 - 0.4719 = 0.0281 x 100 = 2.81 %
c).- ¿Cuál es la probabilidad de que las ventas estén entre 350 y 610?
3 50 - 53 0 - 18 0
z1 =  = - 1 .5
12 0 120
6 10 - 5 3 0 80
z2 =  = - 0.67
120 12 0
P(350  x  610) = 0.4332 + 0.2486 = 0.6818 x 100 = 68.18 %

110
PROBABILIDAD Y ESTADÍSTICA

DISTRIBUCION t de Student
La distribución del estadístico de prueba para muestras extraídas
de una distribución normal, es conocida como la t de Student.
-  x
t =
s
n
Omitiremos la complicada expresión matemática de la densidad
de t, pero describiremos algunas de sus características. La distribución de t4,
al repetirse el muestreo tiene igual que z un a forma monticular y
perfectamente simétrica respecto a t = 0. A diferencia de z, es mucho más
variable, extendiéndose rápidamente a la derecha y a la izquierda. La
variabilidad de z, al repetirse el muestreo, se debe solamente a x. Las otras
cantidades que aparecen en z(n y  ) no son aleatorias. En cambio, la
variabilidad de t se debe a dos cantidades aleatorias, x y s, y puede
demostrarse que éstas son independientes entre sí. Así, cuando x es muy
grande, s puede ser muy pequeña y viceversa. Como resultado de esto, t es
más variable que z. Finalmente, como podríamos imaginar, la variabilidad de
t disminuye a medida que n aumenta porque la estimación s de  estará
basada en más y más información. Cuando n es infinitamente grande, las
distribuciones t y z son idénticas. Así, Gosset descubrió que la distribución
de t depende del tamaño de la muestra n.

El divisor (n - 1) de la suma de los cuadrados de las desviaciones,


que aparece en la fórmula de s², se llama el número de grados de libertad
asociados con s². El origen del término "grados de libertad" está asociado
con

4 W. S. GOSSET: Descubrió y publico en 1908 esta distribución bajo el nombre de Distribución t de Student.

111
PROBABILIDAD Y ESTADÍSTICA

la teoría estadística subyacente en la distribución de probabilidad de s². Se


puede decir que el estadístico de prueba t está basado en una muestra de n
observaciones o que tiene (n - 1) grados de libertad.

Los valores críticos de t que separan las regiones de aceptación y


rechazo para la prueba estadística, se presentan en la tabla 2 del Apéndice II.
Los valores de tp indican el valor de t tal que a su derecha se encuentra un
área p, según se muestra en la siguiente figura:

tp
Sí deseamos encontrar el valor de t tal que 5 % del área se
encuentre a su derecha, usamos la columna marcada t.95 . El valor crítico de t
para nuestro ejemplo, se encuentra en la columna marcada con t.95 y en la
fila correspondiente a g.l. = (n - 1) = 5, es t = 2.02.

* Hallar los valores de t para los cuales el área de la cola a la


derecha de la distribución t es 0.05 si el número de grados de libertad (g.l.) es:
a).- 16 ; b).- 27 ; c) 200
a).- 1.75 correspondiente a v = 16 y t.95
b).- 1.70 correspondiente a v = 27 y t.95
c).- 1.645 correspondiente a v = 200 y t.95 (cuando v  121 se toman los
valores para v =  )

112
PROBABILIDAD Y ESTADÍSTICA

EJERCICIOS PROPUESTOS
1.- Se sabe que el número promedio de accidentes en una sección dada de
una autopista es de 3 por semana. ¿Cuál es la probabilidad de que:
a).- no ocurran accidentes durante una semana?
b).- ocurran exactamente 2 accidentes en una semana dada?
c).- ocurran 3 o más accidentes en una semana en particular?

2.- Consideremos un defecto metabólico que ocurre aproximadamente uno


en cada cien nacimientos. Sí cuatro niños nacen en un hospital un día
dado, ¿cuál es la probabilidad de que:
a).- ninguno tenga el defecto?
b).- no más de uno tenga el defecto?
c).- exactamente 3 tengan el defecto?

3.- Durante un período largo de tiempo se observa que un tirador da en el


blanco con probabilidad igual a 0.8 cada vez que hace un disparo. Si
dispara 4 veces, ¿cuál es la probabilidad de que de en el blanco:
a).- exactamente 2 veces?
b).- al menos dos veces?
c).- exactamente 4 veces?

4.- El número de personas que ingresan a la unidad de cuidado intensivo de


cierto hospital durante un día dado, tiene una distribución de
probabilidad con media igual a 5 personas por día. ¿Cuál es la
probabilidad de que en un día dado:
a).- ingresen entre 4 y 7 personas?
b).- ingresen dos personas exactamente?
c).- ingresen entre 3 y 5 personas?

5.- Supóngase que el número de un tipo particular de bacterias en un


mililitro de agua potable tiene una distribución aproximadamente

113
PROBABILIDAD Y ESTADÍSTICA

normal con media 85 y desviación estándar 9. ¿Cuál es la probabilidad


de que en una muestra dada de un mililitro de agua existan:
a).- más de 100 bacterias?
b).- entre 75 y 90 bacterias?
c).- menos de 80 bacterias?
d).- exactamente 93 bacterias?

6.- Los promedios de aprovechamiento de una población grande de


estudiantes universitarios tiene una distribución normal con media igual
a 2.4 y desviación estándar 0.8.
a).- ¿Qué porcentaje de los estudiantes tiene un promedio mayor que
3?
b).- Sí los estudiantes que tienen aprovechamiento menor o igual
a 1.9 deben abandonar la Universidad, ¿qué porcentaje de
los estudiantes deben irse?

7.- Para una distribución t de Student con 15 g.l., hallar el valor de t tal:
a).- que el área a la derecha de t sea 0.01
b).- que el área a la izquierda de t sea 0.80
c).- que el área a la derecha de t sea 0.10

114
PROBABILIDAD Y ESTADÍSTICA

AREAS BAJO LA CURVA


NORMAL TIPIFICADA
DE 0 a Z
0 Z

z 0 1 2 3 4 5 6 7 8 9
0.0 .0000 .0040 .0080 .0120 .0160 .0199 .0239 .0279 .0319 .0359
0.1 .0398 .0438 .0478 .0517 .0557 .0596 .0636 .0675 .0714 .0753
0.2 .0793 .0832 .0871 .0910 .0948 .0987 .1026 .1064 .1103 .1141
0.3 .1179 .1271 .1255 .1293 .1331 .1368 .1406 .1443 .1480 .1517
0.4 .1554 .1591 .1628 .1664 .1700 .1736 .1772 .1808 .1844 .1879
0.5 .1915 .1950 .1985 .2019 .2054 .2088 .2123 .2157 .2190 .2224
0.6 .2257 .2291 .2324 .2357 .2389 .2422 .2454 .2486 .2517 .2549
0.7 .2580 .2611 .2642 .2673 .2704 .2734 .2764 .2794 .2823 .2852
0.8 .2881 .2910 .2939 .2967 .2995 .3023 .3051 .3078 .3106 .3133
0.9 .3159 .3186 .3212 .3238 .3264 .3289 .3315 .3340 .3365 .3389
1.0 .3413 .3438 .3461 .3485 .3508 .3531 .3554 .3577 .3599 .3621
1.1 .3643 .3665 .3686 .3708 .3729 .3749 .3770 .3790 .3810 .3830
1.2 .3849 .3869 .3888 .3907 .3925 .3944 .3962 .3980 .3997 .4015
1.3 .4032 .4049 .4066 .4082 .4099 .4115 .4131 .4147 .4162 .4177
1.4 .4192 .4207 .4222 .4236 .4251 .4265 .4279 .4292 .4306 .4319
1.5 .4332 .4345 .4357 .4370 .4382 .4394 .4406 .4418 .4429 .4441
1.6 .4452 .4463 .4474 .4484 .4495 .4505 .4515 .4525 .4535 .4545
1.7 .4554 .4564 .4573 .4582 .4591 .4599 .4608 .4616 .4625 .4633
1.8 .4641 .4649 .4656 .4664 .4671 .4678 .4686 .4693 .4699 .4706
1.9 .4713 .4719 .4726 .4732 .4738 .4744 .4750 .4756 .4761 .4767
2.0 .4772 .4778 .4783 .4788 .4793 .4798 .4803 .4808 .4812 .4817
2.1 .4821 .4826 .4830 .4834 .4838 .4842 .4846 .4850 .4854 .4857
2.2 .4861 .4864 .4868 .4871 .4875 .4878 .4881 .4884 .4887 .4890
2.3 .4893 .4896 .4898 .4901 .4904 .4906 .4909 .4911 .4913 .4916
2.4 .4918 .4920 .4922 .4925 .4927 .4929 .4931 .4932 .4934 .4936
2.5 .4938 .4940 .4941 .4943 .4945 .4946 .4948 .4949 .4951 .4952
2.6 .4953 .4955 .4956 .4957 .4959 .4960 .4961 .4962 .4963 .4964
2.7 .4965 .4966 .4967 .4968 .4969 .4970 .4971 .4972 .4973 .4974
2.8 .4974 .4975 .4976 .4977 .4977 .4978 .4979 .4979 .4980 .4981
2.9 .4981 .4982 .4982 .4983 .4984 .4984 .4985 .4985 .4986 .4986
3.0 .4987 .4987 .4987 .4988 .4988 .4989 .4989 .4989 .4990 .4990
3.1 .4990 .4990 .4991 .4991 .4991 .4991 .4992 .4992 .4992 .4992
3.2 .4993 .4993 .4993 .4993 .4993 .4994 .4994 .4994 .4994 .4995
3.3 .4995 .4995 .4995 .4995 .4995 .4996 .4996 .4996 .4996 .4996
3.4 .4997 .4997 .4997 .4997 .4997 .4998 .4998 .4998 .4998 .4998
3.5 .4998 .4999 .4999 .4999 .4999 .4999 .4999 .4999 .5000 .5000

115
PROBABILIDAD Y ESTADÍSTICA

PERCENTILES DE LA
DISTRIBUCION t de Student
CON v GRADOS DE LIBERTAD
tp

v t.500 t.600 t.700 t.750 t.800 t.900 t.950 t.975 t.990 t.995
1 0.158 0.325 0.727 1.000 1.376 3.080 6.314 12.706 31.821 63.657
2 0.142 0.289 0.617 0.816 1.061 1.886 2.920 4.303 6.965 9.425
3 0.137 0.277 0.586 0.765 0.978 1.638 2.353 3.182 4.541 5.841
4 0.134 0.271 0.569 0.741 0.941 1.533 2.132 2.776 3.747 4.604
5 0.132 0.267 0.559 0.727 0.920 1.476 2.015 2.571 3.365 4.032
6 0.131 0.265 0.553 0.718 0.906 1.440 1.943 2.447 3.143 3.707
7 0.130 0.263 0.549 0.711 0.896 1.415 1.895 2.365 2.998 3.499
8 0.130 0.262 0.546 0.706 0.889 1.397 1.860 2.306 2.896 3.355
9 0.129 0.261 0.543 0.703 0.883 1.383 1.833 2.262 2.821 3.250
10 0.129 0.260 0.542 0.700 0.879 1.372 1.812 2.228 2.764 3.169
11 0.129 0.260 0.540 0.697 0.876 1.363 1.796 2.201 2.718 3.055
12 0.128 0.259 0.539 0.695 0.873 1.356 1.782 2.179 2.681 3.012
13 0.128 0.259 0.538 0.694 0.870 1.350 1.771 2.160 2.650 2.997
14 0.128 0.258 0.537 0.692 0.868 1.345 1.761 2.145 2.624 2.947
15 0.128 0.258 0.536 0.691 0.866 1.341 1.753 2.131 2.602 2.921
16 0.128 0.258 0.535 0.690 0.865 1.337 1.746 2.120 2.583 2.898
17 0.128 0.257 0.534 0.689 0.863 1.333 1.740 2.110 2.567 2.878
18 0.127 0.257 0.534 0.688 0.862 1.330 1.734 2.101 2.552 2.861
19 0.127 0.257 0.533 0.688 0.861 1.328 1.729 2.093 2.539 2.845
20 0.127 0.257 0.533 0.687 0.860 1.325 1.725 2.086 2.528 2.831
21 0.127 0.257 0.532 0.686 0.859 1.323 1.721 2.080 2.518 2.819
22 0.127 0.256 0.532 0.686 0.858 1.321 1.717 2.074 2.508 2.807
23 0.127 0.256 0.532 0.685 0.858 1.319 1.714 2.069 2.500 2.797
24 0.127 0.256 0.531 0.685 0.857 1.318 1.711 2.064 2.492 2.787
25 0.127 0.256 0.531 0.684 0.856 1.316 1.708 2.060 2.485 2.779
26 0.127 0.256 0.531 0.684 0.856 1.315 1.706 2.056 2.479 2.771
27 0.127 0.256 0.531 0.684 0.855 1.314 1.703 2.048 2.473 2.763
28 0.127 0.256 0.530 0.683 0.855 1.313 1.701 2.045 2.467 2.763
29 0.127 0.256 0.530 0.683 0.854 1.311 1.699 2.030 2.462 2.756
30 0.127 0.256 0.530 0.683 0.854 1.300 1.685 2.020 2.440 2.750

40 0.126 0.255 0.529 0.681 0.851 1.300 1.680 2.020 2.420 2.700
50 0.126 0.255 0.529 0.681 0.851 1.300 1.680 2.000 2.390 2.700
60 0.126 0.254 0.527 0.679 0.848 1.290 1.670 1.980 2.390 2.660
70 0.126 0.254 0.527 0.679 0.848 1.290 1.670 1.980 2.360 2.620
 0.126 0.253 0.524 0.674 0.842 1.280 1.640 1.960 2.330 2.580

116
PROBABILIDAD Y ESTADÍSTICA

TABLAS DE PROBABILIDADES BINOMIALES

a
Los valores que se dan en la tabla son  p( y ) .
y=0
( Los cálculos están redondeados a la tercera cifra decimal )

a) n = 5 p
a 0.01 0.05 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 0.95 0.99
0 0.951 0.774 0.590 0.328 0.168 0.078 0.031 0.010 0.002 0.000 0.000 0.000 0.000
1 0.999 0.997 0.919 0.737 0.528 0.337 0.188 0.087 0.031 0.007 0.000 0.000 0.000
2 1.000 0.999 0.991 0.942 0.837 0.683 0.500 0.317 0.163 0.058 0.009 0.001 0.000
3 1.000 1.000 1.000 0.993 0.969 0.913 0.812 0.663 0.472 0.263 0.081 0.023 0.001
4 1.000 1.000 1.000 1.000 0.998 0.990 0.969 0.922 0.832 0.672 0.410 0.226 0.049

b) n = 10 p
a 0.01 0.05 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 0.95 0.99
0 0.904 0.599 0.349 0.107 0.028 0.006 0.001 0.000 0.000 0.000 0.000 0.000 0.000
1 0.996 0.914 0.736 0.376 0.149 0.046 0.011 0.002 0.000 0.000 0.000 0.000 0.000
2 1.000 0.988 0.930 0.678 0.383 0.167 0.055 0.012 0.002 0.000 0.000 0.000 0.000
3 1.000 0.999 0.987 0.879 0.650 0.382 0.172 0.055 0.011 0.001 0.000 0.000 0.000
4 1.000 1.000 0.998 0.967 0.850 0.633 0.377 0.166 0.047 0.006 0.000 0.000 0.000
5 1.000 1.000 1.000 0.994 0.953 0.834 0.623 0.367 0.150 0.033 0.002 0.000 0.000
6 1.000 1.000 1.000 0.999 0.989 0.945 0.828 0.618 0.350 0.121 0.013 0.001 0.000
7 1.000 1.000 1.000 1.000 0.998 0.988 0.945 0.833 0.617 0.322 0.070 0.012 0.000
8 1.000 1.000 1.000 1.000 1.000 0.998 0.989 0.954 0.851 0.624 0.264 0.086 0.004
9 1.000 1.000 1.000 1.000 1.000 1.000 0.999 0.994 0.972 0.893 0.651 0.401 0.096

c) n = 15 p
a 0.01 0.05 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 0.95 0.99
0 0.860 0.463 0.206 0.035 0.005 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
1 0.990 0.829 0.549 0.167 0.035 0.005 0.000 0.000 0.000 0.000 0.000 0.000 0.000
2 1.000 0.964 0.816 0.398 0.127 0.027 0.004 0.000 0.000 0.000 0.000 0.000 0.000
3 1.000 0.995 0.944 0.648 0.297 0.091 0.018 0.002 0.000 0.000 0.000 0.000 0.000
4 1.000 0.999 0.987 0.836 0.515 0.217 0.059 0.009 0.001 0.000 0.000 0.000 0.000
5 1.000 1.000 0.998 0.939 0.722 0.403 0.151 0.034 0.004 0.000 0.000 0.000 0.000
6 1.000 1.000 1.000 0.982 0.869 0.610 0.304 0.095 0.015 0.001 0.000 0.000 0.000
7 1.000 1.000 1.000 0.996 0.950 0.787 0.500 0.213 0.050 0.004 0.000 0.000 0.000
8 1.000 1.000 1.000 0.999 0.985 0.905 0.696 0.390 0.131 0.018 0.000 0.000 0.000
9 1.000 1.000 1.000 1.000 0.996 0.966 0.849 0.597 0.278 0.061 0.002 0.000 0.000
10 1.000 1.000 1.000 1.000 0.999 0.991 0.941 0.783 0.485 0.164 0.013 0.001 0.000
11 1.000 1.000 1.000 1.000 1.000 0.998 0.982 0.909 0.703 0.352 0.056 0.005 0.000
12 1.000 1.000 1.000 1.000 1.000 1.000 0.996 0.973 0.873 0.602 0.184 0.036 0.000
13 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.995 0.965 0.833 0.451 0.171 0.010
14 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.995 0.965 0.794 0.537 0.140

117
PROBABILIDAD Y ESTADÍSTICA

d) n = 20 p
a 0.01 0.05 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 0.95 0.99
0 0.818 0.358 0.122 0.012 0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
1 0.983 0.736 0.392 0.069 0.008 0.001 0.000 0.000 0.000 0.000 0.000 0.000 0.000
2 0.999 0.925 0.677 0.206 0.035 0.004 0.000 0.000 0.000 0.000 0.000 0.000 0.000
3 1.000 0.984 0.867 0.411 0.107 0.016 0.001 0.000 0.000 0.000 0.000 0.000 0.000
4 1.000 0.997 0.957 0.630 0.238 0.051 0.006 0.000 0.000 0.000 0.000 0.000 0.000
5 1.000 1.000 0.989 0.804 0.416 0.126 0.021 0.002 0.000 0.000 0.000 0.000 0.000
6 1.000 1.000 0.998 0.913 0.608 0.250 0.058 0.006 0.000 0.000 0.000 0.000 0.000
7 1.000 1.000 1.000 0.968 0.772 0.416 0.132 0.021 0.001 0.000 0.000 0.000 0.000
8 1.000 1.000 1.000 0.990 0.887 0.596 0.252 0.057 0.005 0.000 0.000 0.000 0.000
9 1.000 1.000 1.000 0.997 0.952 0.755 0.412 0.128 0.017 0.001 0.000 0.000 0.000
10 1.000 1.000 1.000 0.999 0.983 0.872 0.588 0.245 0.048 0.003 0.000 0.000 0.000
11 1.000 1.000 1.000 1.000 0.995 0.943 0.748 0.404 0.113 0.010 0.000 0.000 0.000
12 1.000 1.000 1.000 1.000 0.999 0.979 0.868 0.584 0.228 0.032 0.000 0.000 0.000
13 1.000 1.000 1.000 1.000 1.000 0.994 0.942 0.750 0.392 0.087 0.002 0.000 0.000
14 1.000 1.000 1.000 1.000 1.000 0.998 0.979 0.874 0.584 0.196 0.011 0.000 0.000
15 1.000 1.000 1.000 1.000 1.000 1.000 0.994 0.949 0.762 0.370 0.043 0.003 0.000
16 1.000 1.000 1.000 1.000 1.000 1.000 0.999 0.984 0.893 0.589 0.133 0.016 0.000
17 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.996 0.965 0.794 0.323 0.075 0.001
18 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.999 0.992 0.931 0.608 0.264 0.017
19 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.999 0.988 0.878 0.642 0.182

e) n = 25 p
a 0.01 0.05 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90 0.95 0.99
0 0.778 0.277 0.072 0.004 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
1 0.974 0.642 0.271 0.027 0.002 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
2 0.998 0.873 0.537 0.098 0.009 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000
3 1.000 0.966 0.764 0.234 0.033 0.002 0.000 0.000 0.000 0.000 0.000 0.000 0.000
4 1.000 0.993 0.902 0.421 0.090 0.009 0.000 0.000 0.000 0.000 0.000 0.000 0.000
5 1.000 0.999 0.967 0.617 0.193 0.029 0.002 0.000 0.000 0.000 0.000 0.000 0.000
6 1.000 1.000 0.991 0.780 0.341 0.074 0.007 0.000 0.000 0.000 0.000 0.000 0.000
7 1.000 1.000 0.998 0.891 0.512 0.154 0.022 0.001 0.000 0.000 0.000 0.000 0.000
8 1.000 1.000 1.000 0.953 0.677 0.274 0.054 0.004 0.000 0.000 0.000 0.000 0.000
9 1.000 1.000 1.000 0.983 0.811 0.425 0.115 0.013 0.000 0.000 0.000 0.000 0.000
10 1.000 1.000 1.000 0.994 0.902 0.586 0.212 0.034 0.002 0.000 0.000 0.000 0.000
11 1.000 1.000 1.000 0.998 0.956 0.732 0.345 0.078 0.006 0.000 0.000 0.000 0.000
12 1.000 1.000 1.000 1.000 0.983 0.846 0.500 0.154 0.017 0.000 0.000 0.000 0.000
13 1.000 1.000 1.000 1.000 0.994 0.922 0.655 0.268 0.044 0.002 0.000 0.000 0.000
14 1.000 1.000 1.000 1.000 0.998 0.966 0.788 0.414 0.098 0.006 0.000 0.000 0.000
15 1.000 1.000 1.000 1.000 1.000 0.987 0.885 0.575 0.189 0.017 0.000 0.000 0.000
16 1.000 1.000 1.000 1.000 1.000 0.996 0.946 0.726 0.323 0.047 0.000 0.000 0.000
17 1.000 1.000 1.000 1.000 1.000 0.999 0.978 0.846 0.488 0.109 0.002 0.000 0.000
18 1.000 1.000 1.000 1.000 1.000 1.000 0.993 0.926 0.659 0.220 0.009 0.000 0.000
19 1.000 1.000 1.000 1.000 1.000 1.000 0.998 0.971 0.807 0.383 0.033 0.001 0.000
20 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.991 0.910 0.579 0.098 0.007 0.000
21 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.998 0.967 0.766 0.236 0.034 0.000
22 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.991 0.902 0.463 0.127 0.002
23 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.998 0.973 0.729 0.358 0.026
24 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 0.996 0.928 0.723 0.222

118
PROBABILIDAD Y ESTADÍSTICA

TABLA DE VALORES DE e- X

X e-X X e-X X e-X X e-X


0.00 1.000000 2.60 0.074274 5.10 0.006097 7.60 0.000501
0.10 0.904837 2.70 0.067206 5.20 0.005517 7.70 0.000453
0.20 0.818731 2.80 0.060810 5.30 0.004992 7.80 0.000410
0.30 0.740818 2.90 0.055023 5.40 0.004517 7.90 0.000371
0.40 0.670320 3.00 0.049787 5.50 0.004087 8.00 0.000336
0.50 0.606531 3.10 0.045049 5.60 0.003698 8.10 0.000304
0.60 0.548812 3.20 0.040762 5.70 0.003346 8.20 0.000275
0.70 0.496585 3.30 0.036883 5.80 0.003028 8.30 0.000249
0.80 0.449329 3.40 0.033373 5.90 0.002739 8.40 0.000225
0.90 0.406570 3.50 0.030197 6.00 0.002479 8.50 0.000204
1.00 0.367879 3.60 0.027324 6.10 0.002243 8.60 0.000184
1.10 0.332871 3.70 0.024724 6.20 0.002029 8.70 0.000167
1.20 0.301194 3.80 0.022371 6.30 0.001836 8.80 0.000151
1.30 0.272532 3.90 0.020242 6.40 0.001661 8.90 0.000136
1.40 0.246597 4.00 0.018316 6.50 0.001503 9.00 0.000123
1.50 0.223130 4.10 0.016573 6.60 0.001360 9.10 0.000112
1.60 0.201897 4.20 0.014996 6.70 0.001231 9.20 0.000101
1.70 0.182684 4.30 0.013569 6.80 0.001114 9.30 0.000091
1.80 0.165299 4.40 0.012277 6.90 0.001008 9.40 0.000083
1.90 0.149569 4.50 0.011109 7.00 0.000912 9.50 0.000075
2.00 0.135335 4.60 0.010052 7.10 0.000825 9.60 0.000068
2.10 0.122456 4.70 0.009095 7.20 0.000747 9.70 0.000061
2.20 0.110803 4.80 0.008230 7.30 0.000679 9.80 0.000056
2.30 0.100259 4.90 0.007447 7.40 0.000611 9.90 0.000050
2.40 0.090718 5.00 0.006738 7.50 0.000553 10.00 0.000045
2.50 0.082085

119
PROBABILIDAD Y ESTADÍSTICA

BIBLIOGRAFIA
1 MENDENHALL, WILLIAM ; INTRODUCCION A LA
PROBABILIDAD Y ESTADISTICA : WADSWORTH
INTERNATIONAL / IBEROAMERICA ; U.S.A 1982

2 SPIEGEL, MURRAY R.; PROBABILIDAD Y ESTADISTICA ;


McGRAW HILL ; MEXICO. 1990

3 HERNANDEZ L. HONESIMO ; ELEMENTOS DE PROBABILIDAD


Y ESTADISTICA ; FONDO DE CULTURA ECONOMICA ;
MEXICO ; 1979

4 OSTLE, BERNARD ; ESTADISTICA APLICADA ; LIMUSA ;


MEXICO ; 1989

5 McALLISTER, HARRY E. ; ELEMENTOS DE ESTADISTICA EN


ECONOMIA Y LOS NEGOCIOS ; ECASA ; MEXICO ; 1987

6 FELLER, WILLIAM ; INTRODUCCION A LA TEORIA DE


PROBABILIDAD Y SUS APLICACIONES ; VOLUMEN 1 ;
LIMUSA ; MEXICO ; 1983

7 MEYER, PAUL L. ; PROBABILIDAD Y APLICACIONES


ESTADISTICAS ; FONDO EDUCATIVO INTERAMERICANO ;
MEXICO ; 1982

8 LEVIN, JACK ; FUNDAMENTOS DE ESTADISTICA EN LA


INVESTIGACION SOCIAL ; HARLA ; MEXICO ; 1987

9 CEDILLO, TENOCH E. ; ESTADISTICA ; SECCION DE


MATEMATICA EDUCATIVA DEL CINVESTAV - IPN ; MEXICO ;
1986

120
PROBABILIDAD Y ESTADÍSTICA

10 MORENO N., MIGUEL A. ; PROBABILIDAD ; SECCION DE


MATEMATICA EDUCATIVA DEL CINVESTAV - IPN ; MEXICO ;
1985

11 HARNETT - MURPHY ; INTRODUCCION A LA PROBABILIDAD


Y ESTADIS TICA; ADDISON - WESLEY IBEROAMERICANA ;
U.S.A.; 1987

12 GARZA OLVERA, BENJAMIN ; ESTADISTICA Y


PROBABILIDAD ; INTER- AMERICANA DE ACESORIA Y
SERVICIOS ; D.G.T.I. ; MEXICO; 1994

121

You might also like