You are on page 1of 22

Universidad Autónoma de Querétaro

Escuela de Bachilleres

Matemáticas VI
Estadística y Probabilidad
Unidad I: Estadística

Primer Parcial
Semana 3
Medidas de Tendencia Central y Medidas de Dispersión
Autoridades
Dra. Margarita Teresa de Jesús García Gasca
Rectora

Dr. Javier Ávila Morales


Secretario Académico

M. en E.D. Jaime Nieves Medrano


Director de la Escuela de Bachilleres

M. en C. Rita Ochoa Cruz


Secretaria Académica de la EBA

M. en C. Lucero Canto Guerrero


Coordinadora del Plantel Sur

M. en C. Edgar Ulloa Hernández


Coordinador del Plantel Norte

Dra. Cypatly Rojas Miranda


Coordinadora del Plantel San Juan del Río

Lic. María Patricia Pérez Velázquez


Coordinadora del Plantel Colón

M. en D. Antonio Pérez Martínez


Coordinador del Plantel Pedro Escobedo

C.P. Gloria Inés Rendón García


Coordinadora del Plantel Pinal de Amoles

M. en A. Óscar Uriel Cárdenas Rosas


Coordinador del Plantel Bicentenario

M. en LIT. José Cupertino Ramírez Zúñiga


Coordinador del Plantel Amazcala

Ing. Juan Fernando Rocha Mier


Coordinador del Plantel Concá

M. en A. Hugo Enrique Suárez Camacho


Coordinador del Plantel Jalpan

Mtra. María de la Luz Ruiz Maqueda


Coordinadora del Plantel Amealco

M. en A. José Antonio Cárdenas Rosas


Coordinador del Bachillerato Semiescolarizado
Autores

EDICIÓN 2021 - 1

Ing. Dulce Gabriela Rivera Sánchez

Mtra. Georgina Infante Izaguirre

EDICIÓN 2022 - 1

Mtra. Georgina Infante Izaguirre


UNIDAD I. ESTADÍSTICA

¡ Hola !

El siguiente documento es un material especialmente diseñado para estudiar las


medidas de tendencia central y dispersión, con las cuales se puede obtener más
información de un conjunto de datos. La variable debe ser cuantitativa.
El estudio de estos temas es muy importante para tu formación académica, no importa
qué licenciatura o ingeniería vayas a elegir, seguro que utilizarás lo aprendido en estas
sesiones.

Espero lo disfrutes.
¡Comencemos!
Bloque 1

MEDIDAS DE TENDENCIA CENTRAL

Aunque una distribución de frecuencias y su representación gráfica son verdaderamente


muy útiles para tener una idea global del comportamiento que presentan los datos, es
también necesario resumirlos aún más calculando algunas medidas descriptivas. Estas
medidas son valores que se interpretan fácilmente y sirven para realizar un análisis más
profundo y detallado que el obtenido por los resúmenes tabulares y gráficos.

Adolphe Quetelet (Bélgica, 1796-1874) negaba el papel del azar y creía que la estadística
se podía aplicar a las ciencias sociales, lo que llamó physique sociale. Un concepto básico
de la física social de Quetelet es la del “hombre medio”, una persona con características
físicas e intelectuales que servía de promedio. Le llamaba la atención que, al considerar
algún atributo medible, como la altura o el peso, la mayoría de los miembros de una
población determinada arrojaba datos cercanos a la media. Asimismo, introdujo el
concepto de homme type, es decir, el hombre típico que caracteriza a un pueblo o una
nación. Y llegó a creer que las desviaciones con respecto a este promedio eran accidentes

(Cohen: 2005).

En esta sesión se determinará cómo es una distribución de forma numérica, a través de


las medidas de tendencia central y de dispersión. En el esquema siguiente se muestran los
temas que abordaremos.

Figura 1. Diagrama de medidas estadísticas.


MEDIDAS DE TENDENCIA CENTRAL: MEDIA, MEDIANA Y MODA

En la sesión pasada revisamos las distribuciones de frecuencias. Si las examinamos,


notaremos que en la mayoría de los conjuntos de datos se presenta cierta tendencia de
agrupamiento alrededor de un valor central.

Las medidas de tendencia central permiten obtener valores que representen el punto
central de los datos, es decir, determinar el valor más representativo de la variable
cuantitativa que estamos analizando.

Las medidas de tendencia central más utilizadas son la media, la mediana y la moda

La media

La media aritmética, también conocida como promedio o simplemente media de un


conjunto de “n” observaciones 𝑥! , 𝑥" , . . . , 𝑥# , se representa con el símbolo 𝑥̅ y se define
como la suma de todos los valores de la variable y dividido entre el número de datos, esto
es:

En la fórmula:

𝑋$ representa a cada uno de los datos.

Σ Significa sumatoria de todos los valores, desde el primero hasta el n-ésimo.

n es el número de datos en la muestra.


Ejemplo 1. Se preguntó a dos grupos de estudiantes de la escuela de Bachilleres, San
Juan del Río, cuántos libros leyeron el último año. Los resultados fueron los siguientes:

Calcula la media de cada una de las muestras, e interprétala.

Para la muestra 1:

3 + 4 + 6 + 3 + 5 + 5 26
𝑥̅ = = = 4.33
6 6

Un diagrama de puntos permite ver la distribución de los datos, donde cada punto en la
recta numérica representa cada uno de los valores de la muestra.

En promedio los estudiantes de la muestra 1 leen 4.3 libros al año.

Para la muestra 2:

3 + 6 + 4 + 5 + 7 + 56 81
𝑥̅ = = = 13.5
6 6

En promedio los estudiantes de la muestra 2 leen 13.5 libros al año.


Observa como la media es un valor representativo de todos los datos de la muestra 1, pero
puede estar afectado por un solo dato que no se parezca a los demás, como en la muestra
2, alejándose de la realidad de los datos.

Características de la Media:

1. En su cálculo están todos los valores del conjunto de datos por lo que cada uno
afecta a la media.
2. La suma de las desviaciones de los valores individuales respecto a la media es
cero.
3. Aunque es confiable porque refleja todos los valores del conjunto de datos, puede
ser afectada por los valores extremos, y de esa forma llega a ser una medida menos
representativa, por lo que, si la distribución es sesgada, la media aritmética no
constituye un valor representativo.

La mediana

La mediana de un conjunto de observaciones 𝑥! , 𝑥" , . . . , 𝑥# es el valor que divide el


conjunto de datos en dos partes iguales. La mediana no es necesariamente uno de los
datos observados, cuando se tiene una cantidad par de datos, la mediana será el promedio
de los datos de en medio. Se representa con el símbolo 𝑥1 . De lo anterior se deduce que
la mitad de las observaciones son menores o iguales a la mediana.

Para determinar el valor de la mediana, primero se ordenan los datos de menor a mayor o
viceversa. Para calcular la mediana debemos considerar dos casos:

• Si el número de datos (n) es impar, la mediana es el valor de en medio, es decir,


#%!
el lugar ocupado se determina por "

• Si el número de datos (n) es par, la mediana es el promedio de las dos


observaciones de en medio.
Ejemplo 2.a.Calcula la mediana de la muestra dos del ejemplo 7.1 e interprétala.

Primero ordenamos en forma ascendente los datos. Tomamos las posiciones de en medio.

Como n (el número de datos de la muestra) es par, los valores centrales son 5 y 6.
Entonces,

5 + 6 11
𝑥̅ = = = 5.5
2 2

El 50% de los estudiantes de la muestra 2 de la escuela de Bachilleres de San Juan del


río leen menos (0 más) de 5.5 libros al año.

Ejemplo 2.b. Calcula la mediana de los siguientes datos:

6 3 8 3 12 4 6 4 7

Primero ordenamos los datos:

3 3 4 4 6 6 7 8 12

Y podemos ver rápidamente que el valor que está al centro es el 6. Cuando se tiene una
cantidad grande de datos, y es impar, conviene ubicar la posición de la mediana, usando
#%!
"
. La fórmula funciona igual si se trata de una cantidad pequeña, en el ejemplo, son 9
&%!
datos, por lo que 𝑛 = 9, la posición que ocupa la mediana es "
= 5, el número que

ocupa la posición 5, es el número 6.


Características de la mediana:

1. Es una medida de posición que no es afectada por los valores extremos.

2. La mediana en caso de una distribución sesgada, no resulta desplazada del punto de


tendencia central.
Bloque 2

MEDIDAS DE TENDENCIA CENTRAL

La moda

La moda de un conjunto de n observaciones 𝑥! , 𝑥" , . . . , 𝑥# es el valor que se repite con


mayor frecuencia. Se puede simbolizar con 𝑥4. Se considera el valor típico de una serie de
datos.

La moda puede no existir o no ser única, las distribuciones que presentan dos o más
máximos relativos se designan de modo general como bimodales o multimodales.

Ejemplo 3 Calcula la moda de las siguientes muestras:

Para la muestra 1:

Observamos que el valor que más se repite es -5. Es una distribución unimodal. Por lo
tanto:

𝑥4 = −5

Para la muestra 2:

Al observar lo valores, advertimos que es una distribución multimodal, pues son tres
valores (−8, 8 y 13) los que tienen un mayor número de repeticiones (2). Por consiguiente,

𝑥4 = −8,8 𝑦 13
Características de la Moda:

1. Representa más elementos que cualquier otro valor


2. La moda nos permite conocer la mayor parte de los datos
3. Puede usarse para datos cuantitativos como cualitativos
4. La moda como estadístico, varía mucho de una muestra a otra
5. Cuando se tienen dos o más modas es difícil su interpretación

El sesgo

El sesgo describe cómo es la distribución de los datos, ya que indica hacia dónde tienden
a concentrarse éstos. Una distribución puede ser:

• Simétrica, si la mayor concentración de datos se localiza en el centro de la


distribución. Mediana=Media=Moda.
• Sesgada a la derecha, si la mayor concentración de datos está a la izquierda de la
distribución. Media> Mediana> Moda
• Sesgada a la izquierda, si la mayoría de los datos están concentrados a la derecha.
Media < Mediana < Moda

Esto se puede determinar gráficamente, o bien, comparando la media, la moda y la


mediana, de allí la importancia de estas tres medidas de tendencia central:
Ejemplo 4. Siete jóvenes compitieron en la carrera de 100 metros planos. Los siguientes
datos representan los tiempos, en segundos, que necesitaron para realizar el recorrido:

Calcula las medidas de tendencia central e interprétalas.

La media.

La moda.

Como el valor de variable 12 es el de mayor frecuencia, debido a que se repite dos veces, la
moda es:

𝑥" = 12𝑠
La mediana.

Para obtener la mediana primero se deben ordenar los datos, ya sea en orden creciente o
decreciente de magnitud, es decir, ordenando de menor a mayor o viceversa como se
muestra a continuación:
La mediana es el valor que ocupa el lugar de en medio, al ser un número impar. En este
caso es

𝑥1 = 13𝑠

Interpretación

Los jóvenes corren 100 metros en un promedio de 13.28 segundos.

La cantidad típica de tiempo del recorrido de los jóvenes es de 12 segundos.

La media > mediana > moda por lo tanto la muestra está sesgada a la derecha.
Bloque 3

MEDIDAS DE DISPERSIÓN

MEDIDAS DE DISPERSIÓN

Los estadísticos de tendencia central indican dónde se sitúa un grupo de datos; los de
variabilidad o dispersión indican si esas puntuaciones o valores están próximas entre sí,
o, al contrario, están muy dispersas. Es importante también analizar cuán cercanos o
lejanos están los datos respecto, por ejemplo, al valor medio. Entre las medidas de
dispersión o variación se abordará: el rango, la varianza y la desviación estándar.

De esta manera, si dos grupos de datos tienen el mismo centro, este centro es más
descriptivo para el grupo que presente menor variabilidad.

El Rango

Una medida razonable de la variabilidad es la amplitud o rango de variación, que se


obtiene de la resta del dato mayor y el dato menor. El rango se simboliza con R.

Características del rango

1. Es fácil de calcular y sus unidades son las mismas que las de la variable

2. No utiliza todas las observaciones (sólo dos de ellas)

3. Se puede ver muy afectado por alguna observación extrema

4. Ignora la distribución de los datos, es decir, no considera si es unimodal o multimodal,


o cuál es el sesgo
La varianza

La varianza es la medida de dispersión más importante, pues tiene como base el promedio
aritmético de las desviaciones (distancia de un valor con respecto a la media) elevado al
cuadrado. En otras palabras, muestra cuán alejados o cuán cercanos están los datos
respecto a la media.

Varianza poblacional

Para calcular la varianza de la población o poblacional se utiliza la siguiente fórmula:

donde 𝜎 " es la varianza poblacional.

𝑥$ es el valor i del conjunto de datos.


μ es la media poblacional.
N es el tamaño de la población (número de observaciones).

La mayor parte de las veces no se conoce información sobre la población, sobre todo si
es muy grande. Por lo que se recurre a obtener una muestra.

Varianza muestral

Si se desea calcular la varianza de la muestra o muestral, entonces se usa:

donde 𝑠 " es la varianza muestral.

𝑥! es el valor i del conjunto de datos.

𝑥̅ es la media muestral.
n es el tamaño de la muestra (número de observaciones).
Características de la varianza.

1. Si un dato está muy cerca de la media, al elevar esa distancia al cuadrado se hará más
pequeña. Si el dato está muy lejos de la media, la distancia al cuadrado entre ese dato y
la media se hará mayor. De esta manera hace más evidente si una distribución tiene una
dispersión alta o baja.

2. Esta varianza se obtiene como la suma de las diferencias de los cuadrados y por tanto
tiene unidades de medida el cuadrado de las unidades de medida en que se mide la
variable estudiada

La desviación estándar

La desviación estándar es la medida de dispersión más utilizada, ya que el resultado se


expresa en las mismas unidades que los datos originales. La desviación estándar es la raíz
cuadrada de la varianza, así las unidades corresponden a la de la variable estudiada.

Desviación estándar poblacional

Para calcular la desviación estándar de la población se utiliza:

Desviación estándar muestral

Si se desea calcular la desviación estándar de la muestra o muestral, entonces se usa:


En el cálculo de la desviación estándar muestral se divide entre n – 1, y no entre N, como
en el caso del cálculo de la desviación estándar poblacional, porque la media que se utiliza
es la de la muestra; por tanto, hay que realizar un pequeño ajuste.

Bloque 4

EJEMPLOS

Ejemplo 1. Las calderas de una planta de energía de vapor a alta presión tuvieron las
siguientes eficiencias en porcentajes: 90.3, 91.6, 90.9, 90.4, 90.3, 91.0, 87.9, 89.4.

Calcula las medidas de dispersión e interprétalas.

El Rango.

Ordenando los datos:

87.9, 89.4, 90.3, 90.3, 90.4, 90.9, 91.0, 91.6.

𝑥'() = 91.6 𝑥'$# = 87.9 𝑅 = 91.6 − 87.9 𝑅 = 3.7%

La varianza.

La media aritmética para este conjunto de datos será:

&*.,%&!.-%&*.&%&*..%&*.,%&!%/0.&%/&.. 0"!./
𝑥̅ = /
; 𝑥
<= /
𝑥̅ = 90.23%

Por lo tanto la varianza será.

".$%&
𝑠! = %
𝑠 ! = 1.2965 (sin unidades)
La desviación estándar.

Se calcula como la raíz cuadrada de la varianza:

𝑠 = √1.2965

𝑠 = 1.13%

Como la unidad es en porcentajes, el cálculo con dos decimales está bien.

Interpretación:
La diferencia entre el porcentaje máximo y mínimo de eficiencia de las calderas es 3.7%.
El promedio del porcentaje de eficiencias es de 90.23%.
La varianza de los porcentajes de eficiencias de las calderas de la planta de energía de
vapor a alta presión es de 1.2965.
La dispersión de los porcentajes de eficiencia con respecto a la media es de +-
1.13%.
Matemáticas VI
Actividad Semana 3 – Primer Parcial

En cada uno de los ejercicios calcula las medidas de tendencia central e interprétalas.

1. Las edades de las diez personas que acuden a solicitar empleo a una Institución
Bancaria son las siguientes:

Interpreta numéricamente los datos.

2. Los habitantes de la Ciudad de México destinan mucho tiempo a desplazarse de


su casa a su lugar de trabajo. Una persona registró durante 13 días el tiempo (en
minutos) que hacía en auto de la zona de Cuemanco a Santa Fe, si salía a las
6:15 am. Los resultados son los siguientes:

Interpreta numéricamente los datos.

3. Se entrevistó a 20 jóvenes para conocer qué cantidad (en litros) de refresco de


cola beben al día. Los resultados son éstos:

Describe la distribución de los datos, analizando tanto las medidas de tendencia


central como las de dispersión.
¡Muy bien!

Has llegado al final de la sesión, recuerda que las medidas estadísticas nos dan una mejor
idea sobre el comportamiento de los datos, y datos hay por todos lados, por eso es
importante que no las olvides y tengas una noción de su uso e interpretaciones.
Ahora estás list@ para probar lo que has aprendido con el Quiz.

¡Hasta Pronto!

Si quieres saber más sobre este tema puedes ver estos videos:
https://www.youtube.com/watch?v=-YRy-O3LhGo

https://www.youtube.com/watch?v=oZRaDwnpXkY
Bibliografía

Banegas, A. L. (2012). Probabilidad y estadística. Enfoque por competencias. México: MCGRAW


HILL; INTERAMERICANA EDITORES S.A. DE C.V.

Colegio de Bachilleres del Estado de Sonora . (2016). Probabilidad y estadística 1. México:


Reforma Integral de la Educación Media Superior.

Matemáticas profe Alex. (12 de Junio de 2017). Varianza y desviación estándar | Introducción.
Obtenido de https://www.youtube.com/watch?v=oZRaDwnpXkY

math2me. (14 de Octubre de 2018). MEDIA, MEDIANA y MODA - Medidas de Tendencia


Central. Obtenido de https://www.youtube.com/watch?v=-YRy-O3LhGo

Alonso, A. L. (2012). Probabilidad y estadística. Enfoque por competencias. México: MCGRAW


HILL; INTERAMERICANA EDITORES S.A. DE C.V.

You might also like