You are on page 1of 25

Universidad Autónoma de Querétaro

Escuela de Bachilleres

Matemáticas VI
Estadística y Probabilidad
Unidad I: Estadística

Primer Parcial
Semana 5
Autoridades
Dra. Margarita Teresa de Jesús García Gasca
Rectora

Dr. Javier Ávila Morales


Secretario Académico

M. en E.D. Jaime Nieves Medrano


Director de la Escuela de Bachilleres

M. en C. Rita Ochoa Cruz


Secretaria Académica de la EBA

M. en C. Lucero Canto Guerrero


Coordinadora del Plantel Sur

M. en C. Edgar Ulloa Hernández


Coordinador del Plantel Norte

Dra. Cypatly Rojas Miranda


Coordinadora del Plantel San Juan del Río

Lic. María Patricia Pérez Velázquez


Coordinadora del Plantel Colón

M. en D. Antonio Pérez Martínez


Coordinador del Plantel Pedro Escobedo

C.P. Gloria Inés Rendón García


Coordinadora del Plantel Pinal de Amoles

M. en A. Óscar Uriel Cárdenas Rosas


Coordinador del Plantel Bicentenario

M. en LIT. José Cupertino Ramírez Zúñiga


Coordinador del Plantel Amazcala

Ing. Juan Fernando Rocha Mier


Coordinador del Plantel Concá

M. en A. Hugo Enrique Suárez Camacho


Coordinador del Plantel Jalpan

Mtra. María de la Luz Ruiz Maqueda


Coordinadora del Plantel Amealco

M. en A. José Antonio Cárdenas Rosas


Coordinador del Bachillerato Semiescolarizado
Autores

EDICIÓN 2021-1 :

Mtro. José Luis Perea Pacheco

Mtro. Edgar Ulloa Hernández

EDICIÓN 2022-1

Mtra. Maribel Villegas Villegas


UNIDAD I. ESTADÍSTICA

¡ Hola !

¡Bienvenid@s!
Es momento de repasar y utilizar lo aprendido en la semana por medio de gráficas,
medidas de tendencia central y/ o dispersión, en esta sesión veremos ejercicios de
aplicación de todo lo estudiado hasta ahora.
Podrás relacionar actividades cotidianas que utilizan los conceptos ya vistos, en
contextos tan diversos como, en una empresa en su línea de producción, en un hospital
con algún virus, bacteria o enfermedad que se necesita observar o en cualquier tipo de
industria.
Analiza y comenta.
¡Comencemos!
UNIDAD I. ESTADÍSTICA
Bloque 1

Tanto las gráficas como las medidas de tendencia central y dispersión son una
herramienta útil de la estadística para la presentación y estudio de datos. Existe mucha
información que contiene datos, por lo que también hay mus ejercicios que podemos
realizar.

Recuerda que los tipos de gráficos se pueden clasificar de acuerdo a la variable que
estamos estudiando y las medidas de tendencia central, que solo se obtienen de variable
cuantitativas se pueden obtener de datos agrupados o no agrupados.

Así para realizar nuestros ejercicios primero repasemos:


Ejercicios de Aplicación

Tipos de gráficos Datos no agrupados Datos agrupados

Vables cuan8ta8vas
Medidas de tendencia Medidas de tendencia
con8nuas: Histograma,
central: Media, Mediana, central: Media, Mediana,
Polígono de Fecuencias,
Moda, Sesgo Moda aproximadas, Sesgo
Ojiva

Variables cualita8vas y Medidas de dispresión:


Medidas de dispresión:
con8nuas: Diagrama de Rango, varianza aproximada,
Rango, varianza, desviación
Barras, Diagrama de pastel, desviación estándar
estándar
Diagrama de puntos. aproximada
1. EJERCICIOS DE APLICACIÓN DE GRÁFICAS Y MEDIDAS DE
TENDENCIA CENTRAL.

Siempre que vamos a realizar ejercicios conviene tener un formulario


general del tema. Aquí resumimos las fórmulas.

Fórmulas para datos NO agrupados Datos agrupados


Media Media

Mediana Mediana
Si el número de datos (n) es impar, la mediana es el La mediana para datos agrupados sigue el mismo concepto
valor de en medio. que para datos no agrupados, es decir, se hace referencia a
Si el número de datos (n) es par, la mediana es el la ubicación del valor que se encuentra en la posición
promedio de las dos observaciones de en medio. central del conjunto de datos. Al tener datos ubicados en
Medidas de intervalos o clases, se hace una aproximación mediante la
tendencia fórmula que se muestra. Para utilizarla adecuadamente, es
central necesario ubicar la clase mediana, así se denomina, a la
clase que puede contener al valor central.

Moda Moda
El valor que se repite con mayor frecuencia. La moda para datos agrupados, esta ubicada en la clase (o
clases) con el mayor conjunto de datos. Para utilizar
adecuadamente la fórmula que se presenta, es necesario,
ubicar la clase modal, que resulta ser la clase (o clases) con
el mayor número de datos.
Sesgo
Simétrica, si la mayor concentración de datos se localiza en el centro de la distribución. Mediana=Media=Moda.
Sesgada a la derecha, si la mayor concentración de datos está a la izquierda de la distribución. Media> Mediana>
Moda
Sesgada a la izquierda, si la mayoría de los datos están concentrados a la derecha. Media < Mediana < Moda
Rango

Varianza poblacional Varianza aproximada


Medidas de
Dispersión
Varianza muestral
Fórmula alternativa

𝑠! " =
𝑛−1
Desviación estándar:
Raíz cuadrada de la varianza
Medidas de tendencia central y dispersión
Ejemplo 11.1 Se entrevistó a 20 jóvenes para conocer cuántos refrescos de cola se beben
en un día. La distribución de frecuencias se presenta en la tabla siguiente.

Tipo de variable: cuantitativa discreta

Diagrama que se propone para presentar la información: barras

Medidas de tendencia central que pueden ser calculadas: media, mediana, moda y sesgo

Medidas de dispersión que pueden ser calculadas: rango, varianza, desviación estándar

Solución:

Tomamos la frecuencia absoluta para graficar. El diagrama de barras queda así:


Interpretación: de acuerdo con el diagrama de barras podemos afirmar que cuatro
personas consumen un refresco al día y que también cuatro beben dos o cinco refrescos
de cola al día. Además, podemos decir que dos personas no consumen refrescos de cola.

Se completa la tabla para calcular las medidas de tendencia central y dispersión:

Xi fi fixi Fac Fi(Xi^2)


0 2 0 2 0
1 4 4 6 4
2 4 8 10 16
3 3 9 13 27
4 3 12 16 48
5 4 20 20 100
Total 20 53 195

Medidas de tendencia central


Media Moda Mediana
53 𝑥0! = 1 Posición 10 y 11
𝑥! =
20 𝑥0! = 2
𝑥0! = 5 𝑥2! = 3 𝑟𝑒𝑓𝑟𝑒𝑠𝑐𝑜𝑠
𝑥! = 2.7 𝑟𝑒𝑓𝑟𝑒𝑠𝑐𝑜𝑠
Multimodal
Sesgo a la izquierda

Medidas de dispersión
Rango Varianza Deviación estándar
R=5-0=5 195 − 20 ∗ ( 2.7 )" 𝑠! = √2.871
𝑠! " =
20 − 1

𝑠! = 1.6
55.55
𝑠! " =
19

𝑠! " = 2.871
Interpretación:

• La cantidad promedio de refrescos de cola que beben en un día es de 2.7.


• No existe una cantidad típica, pues se beben 1, 2 y 5 refrescos por igual.
• El 50% de los jóvenes beben 3 o más refrescos en un día.
• Es una distribución sesgada a la izquierda.
• La diferencia entre la persona que bebe más refresco y la que menos bebe es de
5.
• La dispersión del salario respecto a la media es de +- 1.6 refrescos.

Bloque 2

Continuación y análisis de las medidas de tendencia central y


de variabilidad
Ejemplo 2 En una empresa de nombre Electronic Industries Inc. se tiene el porcentaje de
todas las personas que trabajan en ella de acuerdo a su grado de estudio:

Porcentaje de
Grado de estudio
empleados
Secundaria 13%
Bachillerato 29%
Carrera Técnica 13%
Licenciatura 3%
Ingeniería 37%
Con Posgrado 5%

La población de estudio: Empleados de la empresa Electronic Industries

Tipo de variable: cualitativa ordinal

Diagrama que se propone para presentar la información: circular o de pastel

Medidas de tendencia central que pueden ser calculadas: moda

Medidas de dispersión que pueden ser calculadas: ninguna

Solución:

Tomamos la frecuencia relativa para graficar. El diagrama de sector circular queda así:

Moda

𝑥; = 𝐼𝑛𝑔𝑒𝑛𝑖𝑒𝑟í𝑎

Ejemplo 3 Se preguntó a un grupo de alumnos de primer semestre del Plantel


Bicentenario, por la asignatura de su preferencia, arrojándose los siguientes resultados:
La población de estudio: Alumnos de un grupo de primer semestre del Plantel Bicentenario

Tipo de variable: cualitativa nominal

Diagrama que se propone para presentar la información: Barras

Medidas de tendencia central que pueden ser calculadas: moda

Medidas de dispersión que pueden ser calculadas: ninguna

Solución:

Realizamos la tabla de distribución de frecuencias y queda así:

Tomamos la frecuencia absoluta para graficar. El diagrama de barras queda así:


Moda

𝑥; = 𝐼𝑛𝑔𝑙é𝑠
Bloque 3

Medidas de tendencia central y dispersión (interpretaciones)

Ejemplo 4 Los siguientes datos representan las edades de 20 profesores de la Escuela de


Bachilleres de la UAQ que fueron elegidos aleatoriamente:36, 25, 37, 42, 39, 30, 36, 31,
31, 39, 34, 29, 41, 40, 33, 44, 34, 43, 45 y 40.

Sin agrupar encuentra las medidas de tendencia central y dispersión. Interprétalas.

Primero se ordenan los datos y quedan así:

25 , 29 , 30 , 31 , 31 , 33 , 34 , 34 , 36 , 36 , 37 , 39 , 39 , 40 , 40 , 41 , 42 , 43 , 44 , 45

Media
25 + 29 + 30 + 31 + 31 + 33 + 34 + 34 + 36 + 36 + 37 + 39 + 39 + 40 + 40 + 41 + 42 + 43 + 44 + 45
𝑥̅ =
20

729
𝑥̅ =
20

𝑥̅ = 36.45 𝑎ñ𝑜𝑠

Modas

Observando los valores, casi todos se repiten una vez y los siguientes se repitieron 2
veces

𝑥
0# = 31 𝑥
0" = 34 𝑥
0$ = 36 𝑥
0% = 39 𝑥
0& = 40

Mediana

Promediando las posiciones 10 y 11

25 , 29 , 30 , 31 , 31 , 33 , 34 , 34 , 36 , 36 , 37 , 39 , 39 , 40 , 40 , 41 , 42 , 43 , 44 , 45

36 + 37
𝑥2! =
2

𝑥2! = 36.5 𝑎ñ𝑜𝑠


Sesgo simétrico

Rango

𝑅 = 45 − 25 ; 𝑅 = 20 𝑎ñ𝑜𝑠

Varianza

Aplicando la fórmula tenemos:

574.9
𝑠" = = 30.25
19

Nota: En el primer y segundo paso no se escribieron todos los valores y se ponen puntos
suspensivos debido a la que es muy largo y repetitivo el cálculo.

Desviación estándar

Sacando la raíz cuadrada de la varianza

𝑠 = √30.25 = 5.5 𝑎ñ𝑜𝑠

Interpretación:

• La cantidad promedio de edad de los docentes de la Escuela de Bachilleres es


36.5 años
• No existe una cantidad típica, pues las edades de 31, 34, 36. 39 y 40 se repiten
por igual 2 veces.
• El 50% de los docentes tienen más (menos) 36.5 años
• Es una distribución simétrica
• La diferencia entre la persona de mayor edad y el de menor edad es de 20 años
• La dispersión de la edad respecto a la media es de +- 5.5 años.
Bloque 4

Datos agrupados

Ejemplo 5 Al Director del Departamento de Nómina de la empresa “CONDUMEX” le


interesa efectuar un estudio de la antigüedad laboral de sus cuarenta y ocho trabajadores,
para rendir un informe de forma resumida, por lo cual requiere efectuar un análisis del
problema. Para esto recabó, de los expedientes de cada empleado, la siguiente
información sobre los años de antigüedad:

Agrupa los datos en una tabla de distribución de frecuencias absolutas.

Primero se debe determinar el número de intervalos o clases necesarios para resumir esta
información.

Número de intervalos 𝐾 = 1 + 3.322 𝑙𝑜𝑔 𝑛

𝐾 = 1 + 3.322𝑙𝑜𝑔(48) 𝐾 = 1 + 3.322(1.68) 𝐾 = 1 + 5.58


𝐾 = 6.58

Valor que se redondea a 7 puesto que el número de intervalos siempre debe ser entero.

Enseguida se calcula el número de unidades de variación en los datos a esto se le llama


Rango, simbolizado con R y es la diferencia entre el dato mayor y el menor.

𝑅 = 29 – 10
𝑅 = 19

A continuación se requiere calcular la anchura o amplitud que deberá tener cada intervalo,
la cual deberá ser la misma para cada uno, para obtenerla se divide el rango entre el
número de intervalos.

A=2.7
Se recomienda que la amplitud tenga igual partes decimales que las que los datos
presentan, como en este ejemplo son valores enteros, entonces la amplitud la ajustamos
al número entero inmediato mayor; es decir a 3; no hacerlo de esta manera, se corre el
riesgo de que se pierda información; es decir que haya datos que no pertenezcan a ningún
intervalo.

Ahora se construyen los intervalos, el primero de los cuales iniciará con el dato menores
decir con 10 y como debe contener tres valores discretos estos son 10, 11 y 12, entonces
el intervalo termina en 12; el siguiente intervalo inicia en 13 y termina 15, y así
sucesivamente hasta llegar al séptimo intervalo de 28 a 30. Todos los intervalos se
registran en la primera columna de la tabla, acto seguido, se contabiliza el número de
datos que le corresponden a cada intervalo, y esta será la interpretación de frecuencia
absoluta, en este contexto de agrupamiento de datos. Se está en condiciones de elaborar
la distribución de frecuencias absolutas para los años de antigüedad laboral.

Ejemplo 6 El ácido úrico es un compuesto orgánico de carbono, nitrógeno, oxígeno e


hidrógeno, éste es un desecho del metabolismo del cuerpo humano y se encuentra en la
orina en pequeñas cantidades. También se puede decir que el ácido úrico son sustancias
que se forman principalmente en el hígado a partir de los núcleos celulares animales como
la carne o el pescado, y que se eliminan a través de la orina. Los valores normales en el
caso de las hombres adultos, se encuentran en el intervalo es de 3.0 a 8.5 mg/dl.

Los siguientes datos representan los niveles de ácido úrico de 20 pacientes varones
adultos:

6.8, 7.2, 3.9, 1.4, 4.1, 5.2, 5.8, 2.7, 3.0, 3.5,2.4, 5.3, 5.7, 7.4, 4.8, 5.8, 5.4, 4.0 ,5.5 ,4.4
Construcción de la distribución de las diferentes distribuciones de frecuencias.

Ante todo la variable de estudio es continua, por tal motivo, los límites reales coincidirán
con los límites de los intervalos.

Primero se debe determinar el número de intervalos o clases necesarios para resumir esta
información.

𝑘 = 1 + 3.322 𝑙𝑜𝑔 ( 20 ); 𝑘 = 1 + 3.322( 1.30 ); 𝑘 = 1 + 4.322 ; 𝑘 = 5.322

y redondeando al entero más próximo., 𝑘 = 5

Se encuentra el Rango. Recuerda que es la diferencia entre el dato mayor y el menor.

R = 7.4 – 1.4 R=6

Determinar la amplitud. 𝐴 = 𝑅/𝑘 , 𝐴 = 6/5 𝐴 = 1.2

En este caso no es necesario ajustar a la alza el resultado puesto que los datos contienen
hasta décimas, por lo tanto nuestra amplitud queda tal y cual se obtuvo.

Ahora se construirán los intervalos de la siguiente manera: El primero de ellos inicia con
el dato menor 1.4 y como la amplitud es de 1.2, la sumamos al límite inferior y obtenemos
al límite superior, es decir 1.4 + 1.2= 2.6, este número es el límite superior del primer
intervalo. Para garantizar la continuidad de la variable, se recurre a los intervalos semi
cerrados por la izquierda los cuales se representan con los símbolos [ Li, Ls) el corchete
o paréntesis rectangular implica que el extremo inferior se incluye en el intervalo o que
forma parte de él y si uno o más datos coinciden con él, contabilizarán para este intervalo.
El paréntesis implica la exclusión del extremo superior del intervalo, y si uno o más datos
coinciden con él, no se contabilizan en este intervalo, pero si en su intervalo sucesor.

El último intervalo debe ser cerrado por ambos lados, puesto que ya no existen más
intervalos y para evitar que un valor extremo quede fuera de la contabilización.
Ahora se construyen las distribuciones de frecuencias:

Con los datos anteriores realiza un histograma.

Niveles de ácido úrico de 20 pacientes varones


8
7
7
Frecuencia absoluta

6
5
5
4
3 3
3
2
2
1
0
2 4.2 4.2 5.6 6.8
Valores de ácido úrico
Actividad Semana 5

A) Completa la siguiente tabla e incluye las variables abajo descritas según


correspondan.

Cualitativas Cuantitativas discretas Cuantitativas continuas


Gráficos posibles a Gráficos posibles a Gráficos posibles a
utilizar:__________ utilizar:__________ utilizar:__________

Área de construcción Número de Autos Idioma que estudio


Número de hijos Estatura de mi papá Colonia donde vivo
Marca de auto Número de dormitorios Área de patios y jardines
Servicios básicos en una Número de infracciones Longitud de la barda
vivienda Estado civil

B) La estadística se utiliza en varios sectores (sector gubernamental, educativo, salud,


etc...) para la toma de decisiones o análisis de algo en particular, relaciona el enunciado
con el sector al que le aplique e incluye tres posibles aplicaciones más.

Caso /situación donde se utiliza la estadística Sector al que pertenece


Conocer el impacto de un nuevo método de
enseñanza en la UAQ
Calcular el éxito de un nuevo medicamento y
establecer protocolos de uso.
Analizar condiciones de una población o sector
específico para establecer políticas públicas

C) En cada uno de los siguientes ejercicios obtén de forma ordenada lo que te solicitan.

1. Completar la siguiente tabla y encontrar la media aritmética, si los datos


mostrados corresponden al valor de las acciones de determinadas empresas en la
bolsa de valores durante el 2020.
Precio de las acciones Número de Marca de clase
x*f
($ miles) acciones (f) (x)
0 5 310
5 10 430
10 15 480
… … 520
… … 500
… … 490
… … 420
… … 370
40 45 260
45 50 110
Totales: Totales:

2. La producción diaria de una fábrica de mesas fue de: lunes 15, martes 18,
miércoles 19, jueves 21 y viernes 16, si se considera a estas observaciones como una
unidad poblacional, realiza lo siguiente:

a) calcularla varianza y la desviación estándar poblacional, interpreta tus


resultados.
b) utiliza un gráfico para presentar los datos, de acuerdo al tipo de variable,
argumenta la selección de tu gráfico.

3. El peso de los mexicanos representa un problema de salud pública, los


siguientes datos son de una muestra de 50 estudiantes de nivel media superior,
realiza el histograma, polígono de frecuencias y ojiva.

Además, de acuerdo a tus resultados responde lo siguiente:


¿Los datos podrían corresponder a la situación de México? ¿Por qué?
¿Qué recomendaciones harías en tu plantel, por esa problemática?
¿Consideras que el problema existe en tu plantel? ¿Por qué?
Marca de Marca de Frecuencia
Frecuencia
clase (libras) clase (Kg) acumulada
102.5 4
114.5 10
126.5 3
138.5 3
150.5 7
162.5 8
174.5 5
186.5 6
198.5 2
210.5 2

¡No olvides repasar para tu primer parcial!

¡Muy bien!
Has llegado al final de la sesión, de la semana y el parcial. Esperando hayas
comprendido todo estás list@ para realizar el examen.

¡Mucha suerte!
Si quieres repasar el parcial y saber más, se aconseja ver los siguientes videos:

https://www.youtube.com/watch?v=Tb3sgUSd2SQ

https://www.youtube.com/watch?v=JwsfkIy6B_o

https://www.youtube.com/watch?v=W1_eCwuYkAI&t=218s

https://www.youtube.com/watch?v=5XKf9vguOJE
Bibliografía
Banegas, A. L. (2012). Probabilidad y estadística. Enfoque por competencias. México: MCGRAW
HILL; INTERAMERICANA EDITORES S.A. DE C.V.

Colegio de Bachilleres del Estado de Sonora . (2016). Probabilidad y estadística 1. México:


Reforma Integral de la Educación Media Superior.

Matemáticas profe Alex. (7 de Marzo de 2017). Tabla de frecuencias agrupada en intervalos |


Ejemplo 2. Obtenido de Recuperado de
https://www.youtube.com/watch?v=5XKf9vguOJE

Matemáticas profe Alex. (5 de Noviembre de 2018). Interpretar las medidas de tendencia


central | Media, Mediana y Moda. Obtenido de
https://www.youtube.com/watch?v=JwsfkIy6B_o

Matemóvil. (13 de Agosto de 2018). Variables Estadísticas Cualitativas y Cuantitativas,


Nominales y Ordinales, Discretas y Continuas. Obtenido de Recuperado de
https://www.youtube.com/watch?v=Tb3sgUSd2SQ

Psico Facil. (19 de Mayo de 2018). TODO LO QUE DEBES SABER DE ESTADÍSTICA DESCRIPTIVA
EN 10 MINUTOS FACIL! Obtenido de Recuperado de
https://www.youtube.com/watch?v=W1_eCwuYkAI&t=218s

You might also like