You are on page 1of 55

Karen Yamile Linares Zarate

• Ana Belem Morales Villanueva


• Alfonso De Anda Aldana
• Carla Romero Alvarado
• Clara Del Carmen Santiago Suriano
CONJUNTOS DE DATOS
14/Febrero/2022

POBLACIÓN : Una población estadística es el total de individuos o conjunto de ellos que o .


presentan o podrían presentar el rasgo característico que se desea estudiar..
Empezaremos por la palabra población. ¿En qué piensas cuando lees o escuchas la palabra
población? Muy probablemente en un número de personas. Por ejemplo, la población de
Argentina, la población de Chile, la población de Nueva York o la población mundial. Y dirás,
¿qué tiene que ver la población con la estadística? Pues tiene que ver mucho. Todo se remonta
a los orígenes de la palabra estadística.
Con esto en mente, seguiremos la siguiente secuencia para entender el concepto: origen de la
palabra, principales tipos de población y un ejemplo de población estadística.
Tal como indicamos en nuestro diccionario económico, la estadística nace con el objetivo de
medir y cuantificar características de la vida cotidiana. Así, los gobiernos comienzan a elaborar
censos de población, tablas de mortalidad y natalidad e incluso en Roma se registraban las
tierras y propiedades que tenían los ciudadanos.
De ahí que la palabra que se utilizase y se utilice sea la de población. Pues, incialmente, se
cuantifican cosas sobre la población de un territorio.

TIPOS DE POBLACIÓN
Dentro de las poblaciones estadísticas, fundamentalemente dos tipos de poblaciones:
Población estadística finita: Es aquella en la que el número de valores que la
componen tiene un fin. Por ejemplo, la población estadística que nos indica la cantidad
de árboles de una ciudad es finita. Es cierto que puede variar con el tiempo, pero en un
instante determinado es finita, tiene fin.
Población estadística infinita: Se trata de aquella población que no tiene fin. Por
ejemplo, el número de planetas que existen en el universo. Aunque puede que sea finito,
el número es tan grande y desconocido que estadísticamente se asume como infinito.

Adicionalmente, dentro de esta gran clasificación, existen otros tipos de poblaciones.


Poblaciones según la distribución de los datos, según el tipo de dato (cualitativo o cuantitativo),
Etc.
14/Febrero/2022
A continuación, vamos a ver un ejemplo gráfico de una población estadística. No hay mejor
manera que entender algo de una manera gráfica y aplicable a la práctica.

MUESTRA: Una muestra estadística es un subconjunto de datos perteneciente a una


población de datos. Estadísticamente hablando, debe estar constituido por un cierto número
de observaciones que representen adecuadamente el total de los datos.

TIPOS DE MUESTRA
A continuación te explicamos los diferentes tipos de muestra estadística que hay. Antes de
nada cabe destacar que se pueden dividir en dos grandes grupos, muestra probabilística y
muestra no probabilística:

Muestra probabilística: En este tipo de muestras todos los sujetos disponibles tienen
las mismas probabilidades de ser incluidos.
Muestra aleatoria simple: Es un conjunto de variables aleatorias independientes e
idénticamente distribuidas, obtenidas a partir de la variable aleatoria X y que se
distribuyen igual que la misma..
14/Febrero/2022
Muestra aleatoria sistemática: En este caso la población se enumera y se agrupa en grupos de 10
personas. Posteriormente, se selecciona a un miembro de cada grupo para elaborar la muestra.

Muestra aleatoria por conglomerados: La población se encuentra ya agrupada previamente y


de estos grupos se extraen los individuos para conformar la muestra.

Muestra estratificada: En este caso la población se divide en subgrupos o estratos con base en las
variables de estratificación.

Muestra no probabilística: En este tipo de selección de muestra todos los elementos no tienen
la misma probabilidad de ser elegidos, ya que depende del procedimiento escogido para
seleccionarlos

Bola de nieve: En primer lugar se seleccionan a diferentes sujetos. . A partir de ahí estos sujetos
colaboran para encontrar a más sujetos que tengan relación con ellos.

Muestra por cuotas: La población es elegida en función a unas características determinadas.

Muestra discrecional: La selección de la población la realizan los investigadores en función


a su propio criterio.

Muestra por conveniencia : Es una muestra elegida por los propios investigadores según
según su interés o cercanía.

Inferencia estadística: Una vez obtenidos tenemos la muestra representativa, entonces toca inferir
ciertas métricas. A menudo, lo que nos interesa es saber cierta medida de una variable. En el
ejemplo inicial, la variable sería el salario de los ciudadanos de un país.
En este sentido, la métrica que queremos analizar es la media del salario de los ciudadanos de un
país
14/Febrero/2022

Es decir, tenemos una población de datos formada por todos los trabajadores de México. De
dicha población obtenemos una variable, es decir, el salario anual. Utilizando las técnicas
adecuadas obtenemos una muestra representativa. Y, por último, una vez tenemos un
conjunto de datos con el que podemos trabajar utilizamos técnicas de inferencia estadística
para calcular el salario medio.

Por supuesto, una vez tenemos el conjunto de datos, podríamos inferir otras medidas. Por
ejemplo, cómo se distribuye el salario, qué porcentaje de trabajadores se encuentra por
debajo de cierto salario o de qué tamaño es la brecha salarial.

DATO: El término dato refiere a la información que brinda acceso a un conocimiento preciso .
y concreto. Los datos estadísticos, en este marco, son los valores que se obtienen a llevar a
cabo un estudio de tipo estadístico. Se trata del producto de la observación de aquel fenómeno
que se pretende analizar.

Supongamos que un periodista deportivo desea estudiar el rendimiento de un tenista a partir


de los resultados que logró en el último año. En dicho plazo, el jugador disputó15 encuentros,
de los cuales ganó 5 y perdió 10. Los datos estadísticos obtenidos de la observación de los
partidos son los siguientes:
derrota – derrota – derrota – victoria – derrota – victoria – victoria
derrota – derrota – derrota – derrota- derrota – victoria – derrota – victoria.
14/Febrero/2022
PARÁMETRO: Un parámetro estadístico, en estadística, es un valor que intenta resumir en un solo
número una determinada característica de una variable estadística.
En estadística, el parámetro estadístico es un valor, un número, que resume y permite
interpretar los datos extraídos en el estudio de una muestra estadística. Imaginemos que
hablamos de una población determinada que queremos analizar. En este caso, el parámetro
estadístico podría ser la edad media de la población en cuestión.

También, es conveniente señalar que a los parámetros estadísticos también se les conoce
como estadísticos descriptivos.
El cálculo de este parámetro, está definido mediante una fórmula aritmética. En el caso de la
población, la media presenta una fórmula que se utiliza para calcular y extraer dicho parámetro.

El parámetro estadístico es un pilar fundamental de la estadística. Gracias a los parámetros


podemos conocer la situación de la realidad, pues permite interpretar y resumir un gran
número de datos que se extraen al analizar una determinada muestra estadística.

La media, la moda, la mediana, así como las principales medidas de tendencia central, por
ejemplo, son parámetros estadísticos. Permiten interpretar unos datos que se extraen de una
determinada población. Así mismo, las medidas de posición no central, como serían los deciles,
los percentiles o los cuartiles, también son parámetros estadísticos. Clasificando a la población
en grupos, nos permite interpretar datos y analizar la población.

En resumen, hablamos de un valor que representa la realidad sobre un determinado estudio


estadístico, resumiendo y exponiendo esa gran cantidad de datos en un solo valor. Ello,
mediante el uso de fórmulas previamente definidas que permiten su cálculo.
DIVISIÓN DE LA ESTADÍSTICA
16/Feb./2022
Apunte en adicionales

Descriptiva: Describe ciertas medidas


o parámetros.

ESTADÍSTICA Inferencial: Infiere análisis a partir


PARAMETRICA de una muestra sobre la población
Se basa en parámetros

de la población

ESTADÍSTICA

ESTADÍSTICA NO
PARAMETRICA
Se basa en medidas
de la población

Parámetro: Medidas principales de la población y las medidas son medidas generales de la


población.(Medidas más importantes de la población
Muestra: Una parte de la población , con algunos elementos

*Medida de la muestra
*Medida de una población
MEDIDAS DE TENDENCIA CENTRAL
16/Feb./2022
MEDIDAS DE VARIACIÓN
16/Feb./2022
Las medidas de dispersión tratan, a través del cálculo de diferentes fórmulas, de arrojar
un valor numérico que ofrezca información sobre el grado de variabilidad de una variable.

En otras palabras, las medidas de dispersión son números que indican si una variable se mueve
mucho, poco, más o menos que otra. La razón de ser de este tipo de medidas es conocer
de manera resumida una característica de la variable estudiada. En este sentido, deben
acompañar a las medidas dede tendencia central. Juntas, ofrecen información de un sólo
vistazo que luego podremos utilizar para comparar y, si fuera preciso, tomar decisiones.

Principales medidas de dispersión


Las medidas de dispersión más conocidas son: el rango, la varianza, la desviación típica
el coeficiente de variación (no confundir con coeficiente de determinación). A continuación
veremos estas cuatro medidas.

RANGO: El rango es un valor numérico que indica la diferencia entre el valor máximo y el mínimo
y el mínimo de una población o muestra estadística. Su fórmula es:
R = Máxx – Mínx
Donde:
R → Es el rango.
Máx → Es el valor máximo de la muestra o población.
Mín → Es el valor mínimo de la muestra o población estadística.
x → Es la variable sobre la que se pretende calcular esta medida.

VARIANZA: La varianza es una medida de dispersión que representa la variabilidad de una


serie de datos respecto a su media. Formalmente se calcula como la suma de los residuos
al cuadrado divididos entre el total de observaciones. Su fórmula es la siguiente:

X → Variable sobre la que se pretenden calcular la varianza


xi → Observación número i de la variable X. i
puede tomará valores entre 1 y n.

x̄ → Es la media de la variable X.
N → Número de observacione
16/Feb./2022
Desviación típica: La desviación típica es otra medida que ofrece información
de la dispersión respecto a la media. Su cálculo es exactamente el mismo que la varianza,
pero realizando la raíz cuadrada de su resultado.
Es decir, la desviación típica es la raíz cuadrada de la varianza.

X → Variable sobre la que se pretenden calcular la varianza


xi → Observación número i de la variable X. i puede tomará valores entre 1 y n.
N → Número de observaciones.
x̄ → Es la media de la variable X.

Coeficiente de variación: Su cálculo se obtiene de dividir la desviación típica entre el


valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para su
mejor comprensión.

X → Variable sobre la que se pretenden calcular la varianza


σx → Desviación típica de la variable X.
| x̄ | → Es la media de la variable X en valor absoluto con x̄ ≠ 0

Parámetro de la población y muestra


Medida de una muestra
Medida de una población
APUNTES ADICIONALES
7/Mar./2022
Elemento Variables
¿A quien estamos observando? ¿ A que se hace referencia?
Ejemplo; a los proveedores Ejemplo; van en las columnas
Datos
¿Qué vas a investigar?(Cantidades / información)
Ejemplo; Sub total , IVA , retención del IVA y total

Identificar
1. Unidad a observar / Elemeto / Unidad a investigar
2. Variable
3. Dato

14/ Marzo / 2022


Datos NO agrupados
Frecuencia absoluta (fi) = Las veces que se repite Suma total se la frecuencia absoluta (N)
Frecuencia absoluta acumulada (Fi) = Suma de la frecuencia absoluta anterior

Frecuencia relativa (ni) = ni= fi / N = Frecuencia Total


La suma de frecuencia relativa es igual a 1
Frecuencia relativa acumulada (Ni)= Suma de la frecuencia relativa anterio
La suma de frecuencia relativa es igual a 1

Límites de clases
EJERCICIOS EN CLASES

Realizar las tablas de frecuencia de los siguientes datos no agrupados

30 37 29 33 29 29 33 42 40
23 43 42 42 42 28 42 30 37

Frecuencia Frecuencia
Frecuencia Frecuencia
Dato absoluta relativa
absoluta (fi) relativa (ni)
acumulada (FI) acumulada (Ni)
23 1 1 0.06 0.06
28 1 2 0.06 0.11
29 3 5 0.17 0.28
30 2 7 0.11 0.39
33 2 9 0.11 0.50
37 2 11 0.11 0.61
40 1 12 0.06 0.67
2.45
42 3.7 5 2.78 2.7817 2.78 3.2
0.28 3.2 0.944.2
4.2
43 2.45 1 3.7 3.218 3.7 3.2
0.06 4.2 1 2.45
18 1

Frecuencia Frecuencia
Frecuencia
absoluta Frecuencia relativa
Dato absoluta
acumulada relativa (ni) acumulada
(fi)
(FI) (Ni)

2.45 3 3 0.19 0.19


2.78 3 6 0.19 0.38
3.2 4 10 0.25 0.63
EJERCICIO EN CLASE
14/Marzo/2022

Venta de calzado
180000
160000
140000
120000
100000
80000
60000
40000
20000
0
ro ro zo il o io io to e e e e
e re ar br ay n l s br br br br
En A M Ju Ju go m u
em m
F eb M A t ie ct i ie
p O ov D
ic
Se N

Venta de calzado
Venta de calzado 8
Mensual Promedio millones $
7
Enero 123450
6
Febrero 75210
5
Marzo 38212
Abril 13430 4
Mayo 11210 3
Ventas Fx
Junio 24601 2
(10-40) 7
Julio 32419 1
(40-70) 1
Agosto 11380
(70-100) 2 0
Septiembre 43560 (10-40) (40-70) (70-100) (100-130) (130-160)
(100-130) 1
Octubre 21324
(130-160) 1
Noviembre 77910
12
Diciembre 156290
TRABAJO EN CLASE
23 / Marzo /2022
1.- Los siguientes datos son los puntajes obtenidos por 50 estudiantes en un examen de
admisión en una Universidad en España

33 50 61 69 80 35 52 64 71 81
35 53 65 73 84 39 54 65 73 85
41 55 65 74 85 41 55 66 74 88
42 57 66 76 86 45 59 66 77 91
47 48 60 68 78 97 60 67 77 94
a) TABLA DE FRECUENCIAS

Frecuencia
Frecuencia Frecuencia Frecuencia Marca de
Intervalo relativa
Absoluta acumulada relativa clases
acumulada
33 -44 7 7 0.14 0.14 38.5
44-55 9 16 0.18 0.32 49.5
55-66 12 28 0.24 0.56 60.5
b) MEDIDAS DE TENDENCIA CENTRAL
66-77 11 39 0.22 0.78 71.5
77-88Moda 7 7 46 0.14 0.92 82.5
88-99Mediana 4 8 50 0.08 1 93.5
50 1
Media 7.8435

c) MEDIDAS DE VARIACIÓN

Rango
Varianza
Desviación típica
Coeficiente de variación
23 / Marzo /2022
d) GRAFICO CORRESPONDIENTE

Ejercicio 1
14

12

10

0
33 -44 44-55 55-66 66-77 77-88 88-99

2.- Opinión sobre el crecimiento del 14% del IVA Y nivel socioeconómico de los moradores
del barrio Miguel Concha ÁlvarezDe la ciudad deSanta Rosa

Si esta de No está de
Neutro Total
acuerdo acuerdo

Bajo 4 9 2 15
Medio 9 21 10 40
Alto 1 4 0 5
Total 14 34 12 60

a) MEDIDAS DE TENDENCIA CENTRAL


Si esta de acuerdo No está de acuerdo Neutro
Moda #N/D #N/D #N/D
Mediana 4 9 2
Media 3.3019 7.3398
23 / Marzo /2022
b) MEDIDAS DE VARIACIÓN

Rango
Varianza
Desviación típica
Coeficiente de variación

c) GRAFICO CORRESPONDIENTE

Ejercicio 2
25

20

15

10

0
Bajo Medio Alto

3.- Se realizó una encuesta para saber el precio de un plato de desayuno en 50 restaurantes

3.1- Precio del plato en 50 restaurantes de la ciudad


14 22 23 25 26 27 30 31 31 32
33 34 34 35 35 35 36 36 37 37
38 38 38 39 39 39 39 40 41 42
43 44 44 44 44 45 45 48 48 49
50 20 50 50 51 51 53 53 56 63
23 / Marzo /2022
a) TABLA DE FRECUENCIA ABSOLUTA Y GRAFICO CORRESPONDIENTE

Restaurante de la ciudad
25

20
Frecuencia
Intervalo 15
Absoluta
(10-20) 2 10
(20-30) 6
5
(30-40) 21
(40-50) 13 0
(50-60) 7 (10-20) (20-30) (30-40) (40-50) (50-60) (60-70)

(60-70) 1 Restaurante de la ciudad


50

3.2- Precio del plato en 50 restaurantes fuera de la ciudad

23 23 24 24 25 25 26 26 26 26
27 27 28 28 29 29 29 30 30 30
30 31 31 32 32 32 33 33 34 34
36 37 37 37 38 38 38 38 38 38
39 39 41 43 44 44 48 51 51 55

a) TABLA DE FRECUENCIA ABSOLUTA Y GRAFICO CORRESPONDIENTE

Restaurante fuera de la ciudad


25

20
Frecuencia
Intervalo 15
Absoluta
(10-20) 0 10
(20-30) 21
5
(30-40) 21
(40-50) 5 0
(10-20) (20-30) (30-40) (40-50) (50-60) (60-70)
(50-60) 3
(60-70) 0 Restaurante fuera de la ciudad
50
23 / Marzo /2022
b) COMPARAMOS TABLAS

Restaurante de la Restaurante fuera de


Intervalos
ciudad la ciudad
(10-20) 2 0
(20-30) 6 21
(30-40) 20 21
(40-50) 16 5
(50-60) 5 3
(60-70)
Ejercicio
1
3 0
25

20

15

10

0
(10-20) (20-30) (30-40) (40-50) (50-60) (60-70)

Restaurante de la ciudad Restaurante fuera de la ciudad

c) MEDIDAS DE TENDENCIA CENTRAL

MODA
MEDIA
MEDIANA
23 / Marzo /2022
d) MEDIDAS DE VARIACIÓN

Rango
Varianza
Desviación típica
Coeficiente de variación

You might also like