You are on page 1of 25

Estadística Matemática I

Semana 1.
Introducción a la estadística.
Competencias

1. Conoce los conceptos y usos de la estadística para la solución de


problemas aplicados.

2. Explica las medidas de tendencia central y de dispersión.

3. Comprende la distribución de frecuencias y gráficos importantes.


Definición de estadística

La estadística es la rama de las matemáticas que


examina las formas de procesar y analizar datos. La
estadística ofrece los procedimientos para recolectar y
transformar los datos de manera que sean útiles a
quienes toman decisiones en la ingeniería, negocios,
medio ambiente, etc.

Clasificación de la estadística:

Descriptiva
Inferencial
Conceptos básicos de la estadística
Tipos de datos
Medidas de tendencia central: Las medidas de
localización están diseñadas para brindar al analista algunos valores
cuantitativos de la ubicación central o de otro tipo de los datos en una
muestra.

Moda: Representada por es el dato que más se repite


Ejemplo Ilustrativo 1
Moda

La moda es el dato que más se repite en el conjunto de


datos, se simboliza por , un conjunto de datos, puede o
no tener moda, en el caso de que dos dato se repitan el
mismo número de veces, diremos que ambos son
modas y que el conjunto de datos en bimodal, este
razonamiento puede extenderse a más de dos modas.
Medidas de dispersión o variabilidad

La variabilidad de una muestra desempeña un papel importante en


el análisis de datos. La variabilidad de procesos y productos es un
hecho real en los sistemas científicos y de ingeniería: el control o la
reducción de la variabilidad de un proceso a menudo es una fuente
de mayores dificultades.

Rango: Valor máximo – Valor mínimo ()


Ejemplo: Encuentre la desviación estándar del ejemplo ilustrativo # 1

Haga lo mismo en Microsoft Excel.


Distribución de frecuencias absolutas y relativas

Considere el siguiente conjunto de datos que contiene la


duración en años de 40 baterias de carros:
A partir de los datos anteriores podemos construir una
distribución de frecuencias, agrupando en intervalos o
clases los diferentes tiempos de vida de las 40 baterias,
veamos:
Graficos estadísticos

Histograma: El histograma es una gráfica de barras para


datos numéricos agrupados en los que las frecuencias o los
porcentajes de cada grupo de datos numéricos están
representados por barras individuales. En un histograma, no
hay brechas entre las barras adyacentes como en la gráfica de
barras de los datos categóricos.

Polígono de frecuencias: Es difícil y confuso realizar múltiples


histogramas en la misma gráfica cuando comparamos dos o
más conjuntos de datos. Al sobreponer las barras verticales de
un histograma en otro se dificulta la interpretación. Cuando hay
dos o más grupos, es conveniente utilizar un polígono.
Veamos el histograma de frecuencias relativas del ejemplo anterior:
Considere la siguiente distribución de frecuencias:
Se recopiló información sobre los ingresos semanales de un grupo de
hondureños inmigrantes que envían remesas desde los Estados Unidos de
Norte América, a sus familiares en Honduras, los resultados se muestran en la
siguiente tabla de distribución de frecuencias:

Frecuencia
Ingresos Frecuencia Frecuencia
Límites Reales Frecuencia Marca de clase relativa
semanales US relativa acumulada
LRI - LRS F Xi porcentual
$ Fr Fa
Fr%

       
20-59   70

       
60-99   50

       
100-139   40

       
140-179   35

       
180-219   25

Totales            
Se pide:
a. Complete los espacios en la tabla

b. Identifique la variable de estudio

c. ¿Qué tipo de variable es?

d. ¿Cuál es la anchura de intervalo?

e. ¿Cuál es la proporción de inmigrantes que gana más de US$ 179

semanales?

f. ¿Qué porcentaje de los entrevistados gana menos de US$100 semanales?


h. Construya un histograma y un polígono de frecuencias.
Gráfica de caja y bigote o gráfica de caja

Otra presentación que es útil para reflejar propiedades de


una muestra es la gráfica de caja y bigote, la cual
encierra el rango intercuartil de los datos en una caja que
contiene la mediana representada.

El rango intercuartil tiene como extremos el percentil 75


(cuartil superior) y el percentil 25 (cuartil inferior). Además
de la caja se prolongan “bigotes”, que indican las
observaciones alejadas en la muestra. Para muestras
razonablemente grandes la presentación indica el centro
de localización, la variabilidad y el grado de asimetría.
Además, una variación denominada gráfica de caja puede
ofrecer al observador información respecto de cuáles
observaciones son valores extremos.

Los valores extremos son observaciones que se consideran


inusualmente alejadas de la masa de datos. Existen
muchas pruebas estadísticas diseñadas para detectar este
tipo de valores. Técnicamente se puede considerar que un
valor extremo es una observación que representa un
“evento raro” (existe una probabilidad pequeña de obtener
un valor que esté lejos de la masa de datos).
Ejemplo: Se midió el contenido de nicotina en una muestra
aleatoria de 40 cigarrillos. Los datos se presentan en la
siguiente tabla:
Diagramas de dispersión y series de tiempo
El diagrama de dispersión se utiliza para examinar las
posibles relaciones entre dos variables numéricas.
Coloque una variable en el eje horizontal X y la otra
variable en el eje vertical Y.

El diagrama de series de tiempo se usa para estudiar


patrones en las variables a través del tiempo. Cada
valor se traza como un punto de dos dimensiones. Un
diagrama de series de tiempo muestra el periodo de
tiempo en el eje horizontal X y la variable de interés en
el eje vertical Y.
Ejemplo # 1: Se toma una muestra de 10 carros, se
calcula su peso miles de libras y la cantidad de
gasolina (galones) que necesitan para recorrer 160
km.

Veamos en excel el diagrama de dispersión


Ejemplo # 2: Una empresa de fabricación de jabón se
plantea cambiar la composición de uno de sus productos
utilizando una nueva materia prima. Antes de tomar una
decisión, la empresa decide realizar un ensayo para
estudiar la posible relación entre la utilización dicha materia
prima y el número de no conformidades. Para ello analiza
lotes con diferentes porcentajes de la nueva materia prima y
toma los siguientes datos:

Veamolos en Excel.
Ejemplo # 3: Se presentan datos de forma mensual y anual
del indice de precios del consumidor, realicemos algunas
series de tiempo
Grafica de pastel
La gráfica de pastel es un círculo que se divide en partes para
representar las categorías. El tamaño de cada rebanada varía
de acuerdo con el porcentaje de cada categoría.

Ejemplo: considere las tallas de uniformes de 60 jugadoras de


baloncesto en una universidad:

Se pide realizar un grafico de pastel.

You might also like