You are on page 1of 13

Medidas de tendencia central y dispersión

Tendencia central La tendencia central se refiere al punto medio de una distribución. Las medidas
de tendencia central se conocen también como medidas de posición.

Dispersión La dispersión se refiere a la separación de los datos en una distribución, es decir, al


grado en que las observaciones se separan.

Sesgo Las curvas que representan los datos puntuales de un conjunto de datos pueden ser
simétricas o sesgadas.

Una medida de tendencia central: la media aritmética


Casi siempre, cuando nos referimos al “promedio” de algo, estamos hablando de la media
aritmética.

Las características de una muestra se conocen como estadísticos.

Las características de una población se llaman parámetros.

Por lo general, en estadística se usan letras del alfabeto latino para simbolizar la información de
las muestras y letras griegas para referirnos a la información de las poblaciones.

∑𝑥
𝜇=
𝑁
∑𝑥
𝑥̅ =
𝑛

1. El Child-Care Community Nursery es elegible para recibir recursos de un fondo especial de


servicios sociales del estado, siempre y cuando la edad promedio de sus niños esté por
debajo de los nueve años. Si los datos que se presentan a continuación representan la
edad de los niños que acuden normalmente al centro, ¿calificará éste para el apoyo del
fondo?

8 5 9 10 9 12 7 12 13 7 8

Respuesta: La media es de 9.09, por lo tanto no califica.

2. El dueño de Pets‘R Us está interesado en construir una nueva tienda. La construirá si el


número promedio de animales vendidos durante los primeros 6 meses de 1995 es al
menos 300 y si el promedio mensual global del año es al menos 285. Los datos para 1995
son los siguientes:
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
234 216 195 400 315 274 302 291 275 300 375 450

¿Qué decisión toma el dueño y por qué?

Para los primeros 6 meses, el promedio es 272.33 < 300, de manera que el dueño no
construirá la nueva tienda.

Una segunda medida de tendencia central: la media ponderada


La media ponderada nos permite calcular un promedio que toma en cuenta la importancia de cada
valor con respecto al total.

∑(𝒘 ∗ 𝒙)
̅=
𝒙
∑𝒘

Donde:

 ̅
𝒙 = símbolo para la media ponderada.
 𝒘 = peso asignada a cada observación.
 ∑(𝒘 ∗ 𝒙) = la suma de los productos de la ponderación de cada
elemento por el elemento correspondiente.
 ∑ 𝒘 = suma de todas las ponderaciones.

1. Un profesor decide utilizar un promedio ponderado para obtener las calificaciones


finales de los estudiantes que acuden a su seminario. El promedio de tareas tendrá
un valor del 20% de la calificación del estudiante; el examen semestral, 25%; el
examen final, 35%; el artículo de fin de semestre, 10%, y los exámenes parciales,
10%. A partir de los datos siguientes, calcule el promedio final para los cinco
estudiantes del seminario.
Estudiante Tareas Parciales Artículos Ex. Semestral Ex. Final
1 85 89 94 87 90
2 78 84 88 91 92
3 94 88 93 86 89
4 82 79 88 84 93
95 95 90 92 82 88

Procedimiento:
𝑃𝑟𝑜𝑚1
(𝑇𝑎𝑟𝑒𝑎𝑠 ∗ 𝑉𝑎𝑙𝑜𝑟) + (𝑃𝑎𝑟𝑐 ∗ 𝑉𝑎𝑙𝑜𝑟) + (𝐴𝑟𝑡.∗ 𝑉𝑎𝑙𝑜𝑟) + (𝐸𝑥. 𝑆𝑒𝑚 ∗ 100) + (𝐸𝑥. 𝐹𝑖𝑛 ∗ 𝑉𝑎𝑙𝑜𝑟)
=
100
Resultados:
Estudiante 1: 88.55
Estudiante 2: 87.75
Estudiante 3: 89.55
Estudiante 4: 86.65
Estudiante 5: 88.50

Una cuarta medida de tendencia central: la mediana


La mediana es un solo valor del conjunto de datos que mide la observación central del
conjunto. Esta sola observación es el elemento que está más al centro del conjunto de
números. La mitad de los elementos están por arriba de este punto y la otra mitad está
por debajo.

Para hallar la mediana de un conjunto de datos, primero se organizan en orden


descendente o ascendente. Si el conjunto de datos contiene un número impar de
elementos, el de en medio en el arreglo es la mediana; si hay un número par de
observaciones, la mediana es el promedio de los dos elementos de en medio.

𝑛+1
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = ( ) − 𝑒𝑠𝑖𝑚𝑜 𝑡𝑒𝑟𝑚𝑖𝑛𝑜 𝑑𝑒𝑙 𝑎𝑟𝑟𝑒𝑔𝑙𝑜 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠
2

1. La empresa Meridian Trucking lleva un registro del kilometraje de todos sus vehículos. A
continuación presentamos registros del kilometraje semanal:

810 450 756 789 210 657 589 488 876 689
1,450 560 469 890 987 559 788 943 447 775

a) Calcule la mediana del kilometraje que recorre un camión. 722.5 millas

b) Calcule la media para el kilometraje de los 20 camiones. 709.1 millas

c) Compare el resultado de los incisos a) y b) y explique cuál es la mejor medida de la


tendencia central de los datos. Ambas igualmente buenas

Una medida final de tendencia central: la moda


La moda es una medida de tendencia central diferente de la media, pero un tanto
parecida a la mediana, pues en realidad no se calcula mediante algún proceso aritmético
ordinario. La moda es el valor que más se repite en el conjunto de datos.

1. Las siguientes son las edades en años de los automóviles en los que trabajó Village
Autohaus la semana pasada: 5, 6, 3, 6, 11, 7, 9, 10, 2 4, 10, 6, 2, 1 5
a) Calcule la moda para este conjunto de datos.
Moda = 6
b) Calcule la media para este conjunto de datos.
Media = 5.8
c) Compare los incisos a) y b) y comente cuál es la mejor medida de tendencia central de
estos datos. Como la frecuencia modal es solo 3 y los datos son razonablemente
simétricos la media es mejor medida de tendencia central.

Rangos: medidas de dispersión útiles


El rango es la diferencia entre el más alto y el más pequeño de los valores observados. En forma
de ecuación.

Dispersión: medidas de desviación promedio


Las descripciones más completas de la dispersión son aquellas que manejan la desviación
promedio respecto a alguna medida de tendencia central. Dos de estas medidas son importantes
para nuestro estudio de la estadística: la varianza y la desviación estándar. Ambas medidas nos
dan una distancia promedio de cualquier observación del conjunto de datos respecto a la media
de la distribución.

Varianza de población
Cada población tiene una varianza, su símbolo es 𝜎 2 (sigma cuadrada). Para calcular la varianza de
una población, la suma de los cuadrados de las distancias entre la media y cada elemento de la
población se divide entre el número total de observaciones en población.
∑(𝒙 − 𝝁)𝟐
𝝈𝟐 =
𝑵

Desviación estándar de la población


La desviación estándar de la población, es simplemente la raíz cuadrada de la varianza de la
población.

La desviación estándar nos permite determinar, con un buen grado de precisión, dónde están
localizados los valores de una distribución de frecuencias con relación a la media.

Podemos medir aún con más precisión el porcentaje de observaciones que caen dentro de un
rango específico de una curva simétrica con forma de campana. En estos casos, podemos decir
que:

1. Aproximadamente 68% de los valores de la población cae dentro de ±1 desviación estándar a


partir de la media.

2. Aproximadamente 95% de los valores estará dentro de ±2 desviaciones estándar a partir de la


media.

3. Aproximadamente 99% de los valores estará en el intervalo que va desde 3 desviaciones


estándar a la izquierda de la media hasta 3 desviaciones estándar a la derecha de la media

Terminología básica en probabilidad


Un evento es uno o más de los posibles resultados de hacer algo. Al lanzar una moneda al aire, si
cae cruz es un evento, y si cae cara es otro.

En la teoría de probabilidad, la actividad que origina uno de dichos eventos se conoce como
experimento.

Se dice que los eventos son mutuamente excluyentes si uno y sólo uno de ellos puede tener lugar
a un tiempo. Considere de nuevo el ejemplo de la moneda. Tenemos dos resultados posibles, cara
y cruz. En cualquier lanzamiento obtendremos una cara o una cruz, nunca ambas.

Cuando una lista incluye todos los eventos que pueden resultar de un experimento, se dice que la
lista es colectivamente exhaustiva.

Tres tipos de probabilidad


El planteamiento clásico define la probabilidad de que un evento ocurra como:

𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑒𝑛 𝑙𝑜𝑠 𝑞𝑢𝑒 𝑠𝑒 𝑝𝑟𝑒𝑠𝑒𝑛𝑡𝑎 𝑒𝑙 𝑒𝑣𝑒𝑛𝑡𝑜


𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑢𝑛 𝑒𝑣𝑒𝑛𝑡𝑜 =
𝑛ú𝑚𝑒𝑟𝑜 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑟𝑒𝑠𝑢𝑙𝑡𝑎𝑑𝑜𝑠 𝑝𝑜𝑠𝑖𝑏𝑙𝑒𝑠
Frecuencia relativa de presentación de un evento y define la probabilidad como:

1. La frecuencia relativa observada de un evento durante un gran número de intentos o;

2. la fracción de veces que un evento se presenta a la larga, cuando las condiciones son
estables.

Este método utiliza la frecuencia relativa de las presentaciones pasadas de un evento


como probabilidad. Determinamos qué tan frecuentemente ha sucedido algo en el pasado
y usamos esa cifra para predecir la probabilidad de que suceda de nuevo en el futuro.

Las probabilidades subjetivas están basadas en las creencias de las personas que efectúan
la estimación de probabilidad.

1. Clasifique las siguientes estimaciones de probabilidad en cuanto a su tipo (clásica,


frecuencia relativa o subjetiva):

a) La probabilidad de lograr un tiro de penal en hockey sobre hielo es 0.47. Frecuencia


relativa

b) La probabilidad de que renuncie el gobernador actual es 0.85. Subjetiva

c) La probabilidad de sacar dos seises al lanzar dos dados es 1/36. Clásica

d) La probabilidad de que el presidente electo en un año que termina en cero muera


durante su cargo es 7/10. Frecuencia relativa

e) La probabilidad de que vaya a Europa este año es 0.14. Subjetiva

¿Qué es una distribución de probabilidad?


Indica toda la gama de valores que pueden representase como resultado de un experimento.

Describe la probabilidad de que un evento se realice a futuro, constituye una herramienta


fundamental para la prospectiva, puesto que se puede diseñar un escenario de acontecimientos
futuros considerando las tendencias actuales de diversos fenómenos naturales. Toda la
distribución de probabilidad es generada por una variable (porque toma diferentes valores)
aleatoria porque el valor tomado es totalmente al azar.

Variable aleatoria discreta


Puede tomar valores enteros y un número finito de ellos. Ejemplo:
X variable que nos define el nuero de alumnos aprobados en la materia de probabilidad en un
grupo de 40 alumnos (1, 2, 3,….., 40).

Propiedades: p(xi) < 1 Las probabilidades asociadas a cada uno de los valores que toma x deben
ser mayores o iguales a cero y menores o iguales a 1.

Ep (xi) = 1 La sumatoria de las probabilidades asociadas a cada una de los valores que toma x
deben ser igual a 1.

Variable aleatoria continua


Porque puede tomar tanto valores enteros como fraccionarios y número infinito de ellos dentro
de un mismo intervalo. Ejemplo:

X es la variables que nos define la concentración de gramos de plata de alguna muestra de mineral
(14.5gr, 12.1gr,….., n).

Tipos de distribuciones de probabilidad

Las distribuciones de probabilidad se clasifican como discretas y continuas. En la distribución de


probabilidad discreta está permitido considerar sólo un número limitado de valores. En una
distribución de probabilidad continua, por otro lado, la variable que se está considerando puede
tomar cualquier valor dentro de un intervalo dado.

Variables aleatorias
Una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio.
Esta variable aleatoria puede ser discreta o continua. Si puede tomar sólo un número limitado de
valores, entonces es una variable aleatoria discreta. En el otro extremo, si puede tomar cualquier
valor dentro de un intervalo dado, entonces se trata de una variable aleatoria continua.

El valor esperado es una idea fundamental en el estudio de las distribuciones de probabilidad.

Para obtener el valor esperado de una variable aleatoria discreta, multiplicamos cada valor que la
variable puede tomar por la probabilidad de ocurrencia de ese valor y luego sumamos los
productos.

1. Construya una distribución de probabilidad con base en la siguiente distribución de


frecuencias.

Resultado 102 105 108 111 114 117


Frecuencia 10 20 45 15 20 15

a) Trace una gráfica de la distribución de probabilidad hipotética.

b) Calcule el valor esperado del resultado.

Las variables discretas son aquellas cuyas observaciones se agrupan


‘inherentemente’ o ‘naturalmente’ en categorías, porque dichas variable por su
naturaleza sólo pueden tomar ciertos valores muy específicos. El “género” de
un sujeto es un buen ejemplo de una variable discreta: los seres humanos
pueden ser mujeres u hombres, se ajustan a una u otra categoría y no hay
continuidad ni puntos intermedios entre ellas. Los países o regiones del mundo
también son buenos ejemplos de variables discretas. Otro ejemplo son las
calificaciones o educación de los maestros.

La distribución binominal
Una distribución de probabilidad de variable aleatoria discreta utilizada ampliamente es la
distribución binomial. Por otra parte, describe datos discretos, no continuos, que son resultado de
un experimento conocido como proceso de Bernoulli

Características
1. Cada intento (cada lanzamiento, en este caso) tiene solamente dos resultados posibles:
cara o cruz, sí o no, éxito o fracaso.
2. La probabilidad del resultado de cualquier intento (lanzamiento) permanece fijo con
respecto al tiempo.
3. Los intentos son estadísticamente independientes, es decir, el resultado de un
lanzamiento no afecta el resultado de cualquier otro lanzamiento.

𝒏!
𝑷𝒓𝒐𝒃𝒂𝒃𝒊𝒍𝒊𝒅𝒂𝒅 𝒅𝒆 𝒙 𝒆𝒙𝒊𝒕𝒐𝒔 𝒆𝒏 𝒏 𝒊𝒏𝒕𝒆𝒏𝒕𝒐𝒔 = ∗ 𝒑𝒙 ∗ 𝒒𝒏−𝒙
𝒙! (𝒏 − 𝒙)!

Ejercicios

1. Considere el siguiente problema. ¿Cuál es la probabilidad de que ocho de los 15 votantes


demócratas empadronados de Prince Street no puedan votar en las elecciones preliminares, si la
probabilidad de que cualquier individuo no pueda votar es de 0.30, y si las personas deciden de
manera independiente si votan o no?

Primero representamos los elementos de este problema en notación de distribución binomial:

n 15 número de demócratas empadronados

p 0.30 probabilidad de que cualquier individuo no vote

r 8 número de individuos que no van a votar

2. El último sondeo político nacional indica que la probabilidad de que estadounidenses elegidos al
azar sean conservadores es de 0.55; de que sean liberales es de 0.30, y de que estén entre una y
otra orientación es 0.15. Suponga que estas probabilidades son exactas y responda a las siguientes
preguntas referidas a un grupo de 10 estadounidenses seleccionados de manera aleatoria.

a) ¿Cuál es la probabilidad de que cuatro sean liberales?


b) ¿Cuál es la probabilidad de que ninguno sea conservador?
c) ¿Cuál es la probabilidad de que dos estén entre una y otra orientación?
d) ¿Cuál es la probabilidad de que al menos ocho sean liberales?

4. En un estudio reciente acerca de cómo pasan los estadounidenses su tiempo libre se entrevistó
a trabajadores con más 5 años en su empleo. Se calculó en 0.45 la probabilidad de que un
empleado tuviera 2 semanas de vacaciones; en 0.10 que contara con 1 semana, y en 0.20 que
disfrutara de 3 semanas o más. Suponga que se seleccionan 20 empleados al azar. Responda a las
siguientes preguntas.

a) ¿Cuál es la probabilidad de que 8 empleados tengan 2 semanas de vacaciones?


P=0.1623
b) ¿Cuál es la probabilidad de que sólo 1 trabajador tenga 1 semana de vacaciones?

P=0.2701
c) ¿Cuál es la probabilidad de que cuando mucho 2 trabajadores tengan 3 semanas o más de
vacaciones?

P(2)=0.1369 + P(1)=0.05764 + P(0)=0.01152 = 0.20606

La distribución de Poisson
La distribución de Poisson se utiliza para describir ciertos tipos de procesos, entre los que se
encuentran la distribución de llamadas telefónicas que llegan a un conmutador, las solicitudes de
pacientes que requieren servicio en una institución de salud, las llegadas de camiones y
automóviles a una caseta de cobro, y el número de accidentes registrados en cierta intersección.

𝛌𝒙 ∗ 𝒆−𝛌
𝑷(𝒙) =
𝒙!

Ejercicios

Dado que λ=4.2, para una distribución de Poisson, encuentre

a) P(x ≤2).

b) P(x = 8).
2. Suponga que estamos investigando la seguridad de una peligrosa intersección. Los registros
policiacos indican una media de cinco accidentes mensuales en esta intersección. El número de
accidentes está distribuido de acuerdo con una distribución de Poisson, y el Departamento de
Seguridad de Tránsito desea que calculemos la probabilidad de que en cualquier mes ocurran
exactamente 0, 1, 2, 3 o 4 accidentes.

Quizá deseemos conocer la probabilidad de tener 0, 1 o 2 accidentes mensuales. Podemos


averiguar esto sumando la probabilidad de tener exactamente 0, 1 y 2 accidentes, de la siguiente
forma:
La distribución normal: distribución de una variable aleatoria
continua
Una distribución de probabilidad continua que es muy importante es la distribución normal.

Existen dos razones fundamentales por las cuales la distribución normal ocupa un lugar tan
prominente en la estadística. Primero, tiene algunas propiedades que la hacen aplicable a un gran
número de situaciones en las que es necesario hacer inferencias mediante la toma de muestras.

Segundo, la distribución normal casi se ajusta a las distribuciones de frecuencias reales observadas
en muchos fenómenos, incluyendo características humanas (peso, altura, coeficiente intelectual),
resultados de procesos físicos (dimensiones y rendimientos), y muchas otras medidas de interés
para los administradores, tanto en el sector público como en el privado.

Características de la distribución normal de probabilidad

1. La curva tiene un solo pico; por tanto, es unimodal. Tiene la forma de campana que
mencionamos anteriormente.

2. La media de una población distribuida normalmente cae en el centro de su curva normal.

3. Debido a la simetría de la distribución normal de probabilidad, la mediana y la moda de la


distribución se encuentran también en el centro; en consecuencia, para una curva normal, la
media, la mediana y la moda tienen el mismo valor.

4. Las dos colas de la distribución normal de probabilidad se extienden indefinidamente y nunca


tocan el eje horizontal.

Áreas bajo la curva normal

1. Aproximadamente el 68% de todos los valores de una población normalmente distribuida se


encuentra dentro de ± 1 desviación estándar de la media.

2. Aproximadamente el 95.5% de todos los valores de una población normalmente distribuida se


encuentra dentro de ± 2 desviaciones estándar de la media.

3. Aproximadamente el 99.7% de todos los valores de una población normalmente distribuida se


encuentra dentro de ± 3 desviaciones estándar de la media.
𝒙−𝝁
𝒛=
𝝈

• 𝒙 Valor de la variable aleatoria que nos preocupa

• 𝝁 Media de la distribución de la variable aleatoria

• 𝝈 Desviación estándar de la distribución

• 𝒛 Número de desviaciones estándar que hay desde x a la media de la distribución

Ejemplo 1 ¿Cuál es la probabilidad de que un participante elegido al azar requiera más de 500
horas para completar el programa?

Podemos ver que la mitad del área bajo la curva está localizada a ambos lados de la media de 500
horas. Por tanto, podemos deducir que la probabilidad de que la variable aleatoria tome un valor
mayor a 500 es el área sombreada, es decir, 0.5.