Professional Documents
Culture Documents
procesar, analizar e interpretar datos con el fin de deducir las características de una población
objetivo, pero esta sería solo una visión estrecha de lo que comprende esta rama del saber. A
continuación se hace una muy breve introducción teórica al amplio concepto de la estadística.
¿Qué es estadística?
La estadística es la ciencia que estudia cómo debe emplearse la información y cómo dar una
(Ángel, p. 28)
La estadística es la rama del conocimiento humano que tiene como objeto el estudio de ciertos
p.1)
La estadística es el arte de aprender a partir de los datos. Está relacionada con la recopilación
(Ross, p.3)
La estadística es una ciencia exacta cuyo objetivo fundamental es el estudio de diversas forma
p.10)
ordenada de los datos observados en tablas y gráficos estadísticos, reduciendo los datos
entre diferentes series de datos y estimando la probabilidad de éxito que tiene cada una de
Objetivo de la estadística
p.267)
El principal objetivo de la estadística es hacer inferencias acerca de una población, con base
Estadística descriptiva
Se puede definir como un método para describir numéricamente conjuntos numerosos. Por
tratarse de un método de descripción numérica, utiliza el número como medio para describir
un conjunto, que debe ser numeroso, ya que las permanencias estadísticas no se dan en los
casos raros. No es posible sacar conclusiones concretas y precisas de los datos estadísticos.
(Vargas, p.33)
recuento: la frecuencia, medida empírica de la ocurrencia de los distintos estados que puede
diferentes ciencias en las que se aplica y para ello utiliza los datos observados en una o varias
ciertas relaciones que se toman como hipótesis. Esta toma de decisiones va acompañada de
La estadística inferencial tiene dos objetivos básicos; a) obtener conclusiones válidas acerca
de una población sobre la base de una muestra, es decir, que las conclusiones que obtengamos
de una muestra se puedan extrapolar a la población que dio origen a esa muestra y b) poder
(Díaz, p.287)
Otras definiciones
Población finita. Es aquella que indica que es posible alcanzarse o sobrepasarse al contar. Es
existe límite en cuanto al número de observaciones que cada uno de ellos puede generar.
Es un subconjunto de la población.
cual se obtuvo.
mayoría de los estadísticos muestrales se encuentran por medio de una fórmula y suelen
características: a) Que sean comparables entre sí. b) Que tengan alguna relación.
Clases de datos
Será una variable cuando pueda asumir sus resultados en medidas numéricas.
Es aquella que puede asumir sólo ciertos valores, números enteros. Ejemplo: El número de
estudiantes (1,2,3,4)
Es aquella que teóricamente puede tomar cualquier valor en una escala de medidas, ya sea
Experimento
Histograma
gráfica de barras que despliega la variabilidad dentro de un proceso. Un Histograma toma datos
variables (tales como alturas, pesos, densidades, tiempo, temperaturas, etc.) y despliega su
distribución. Los patrones inusuales o sospechosos pueden indicar que un proceso necesita
Se utilizan cuando se interesa conocer el número de individuos que hay antes de un cierto valor de la
variable.
La media aritmética
La media aritmética es el valor obtenido por la suma de todos sus valores dividida entre el número de
sumadores.
Niño nota
4 7,0 27,6/5=5,52
5 6,1
La media aritmética es, probablemente, uno de los parámetros estadísticos más extendidos. Se le
Definición formal
Dado un conjunto numérico de datos, x1, x2, ..., xn, se define su media aritmética como
Esta definición varía, aunque no sustancialmente, cuando se trata de variables continuas, esto es,
Propiedades
Se usa con frecuencia para comparar poblaciones, aunque es más apropiado acompañarla de una
medida de dispersión.
Se interpreta como "punto de equilibrio" o "centro de masas" del conjunto de datos, ya que tiene la
Este resultado se conoce como Teorema de König. Esta propiedad permite interpretar uno de los
Es poco sensible a fluctuaciones muéstrales, por lo que es un parámetro muy útil en inferencia
estadística.
Inconvenientes de su uso
Este parámetro, aun teniendo múltiples propiedades que aconsejan su uso en situaciones muy
Para datos agrupados en intervalos (variables continuas) su valor oscila en función de la cantidad y
La estatura media como resumen de una población homogénea (abajo) o heterogénea (arriba).
Es una medida a cuyo significado afecta sobremanera la dispersión, de modo que cuanto menos
homogéneos sean los datos, menos información proporciona. Dicho de otro modo, poblaciones muy
distintas en su composición pueden tener la misma media.4 Por ejemplo, un equipo de baloncesto con
cinco jugadores de igual estatura, 1,95 m, evidentemente, tendría una estatura media de 1,95 m, valor
que representa fielmente a esta población homogénea. Sin embargo, un equipo de jugadores de
estaturas más heterogéneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo, tendría también,
como puede comprobarse, una estatura media de 1,95 m, valor que no representa a casi ninguno de
sus componentes.
En el cálculo de la media no todos los valores contribuyen de la misma manera. Los valores altos
tienen más peso que los valores cercanos a cero. Por ejemplo, en el cálculo del salario medio de una
empresa, el salario de un alto directivo que gane 10.000 € tiene tanto peso como el de diez empleados
"normales" que ganen 1.000 €. En otras palabras, se ve muy afectada por valores extremos.
A veces puede ser útil otorgar pesos o valores a los datos dependiendo de su relevancia para
Si son nuestros datos y son sus "pesos" respectivos, la media ponderada se define de la siguiente
forma:
Media muestral
"muestral" se aplica a aquellas situaciones en las que la media aritmética se calcula para
Moda
La moda es el dato más repetido de la encuesta, el valor de la variable con mayor frecuencia absoluta.5
En cierto sentido la definición matemática corresponde con la locución "estar de moda", esto es, ser
Hablaremos de una distribución bimodal de los datos, cuando encontremos dos modas, es decir, dos
datos que tengan la misma frecuencia absoluta máxima. Cuando en una distribución de datos se
encuentran tres o más modas, entonces es multimodal. Por último, si todas las variables tienen la
Cuando tratamos con datos agrupados en intervalos, antes de calcular la moda, se ha de definir el
La moda, cuando los datos están agrupados, es un punto que divide el intervalo modal en dos partes
Siendo la frecuencia absoluta del intervalo modal y las frecuencias absolutas de los intervalos
Las calificaciones en la asignatura de Matemáticas de 39 alumnos de una clase vienen dada por la
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 8 9 3 4 2
Propiedades
Cálculo sencillo.
Al depender solo de las frecuencias, puede calcularse para variables cualitativas. Es por ello el
parámetro más utilizado cuando al resumir una población no es posible realizar otros cálculos, por
ejemplo, cuando se enumeran en medios periodísticos las características más frecuentes de
Inconvenientes
Su valor es independiente de la mayor parte de los datos, lo que la hace muy sensible a variaciones
muestrales. Por otra parte, en variables agrupadas en intervalos, su valor depende excesivamente del
Usa muy pocas observaciones, de tal modo que grandes variaciones en los datos fuera de la moda, no
Puede haber más de una moda en el caso en que dos o más valores de la variable presenten la misma
Mediana
La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que
éstos están ordenados de menor a mayor.7 Por ejemplo, la mediana del número de hijos de un conjunto
En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por
lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por
Existen métodos de cálculo más rápidos para datos más numerosos (véase el artículo
principal dedicado a este parámetro). Del mismo modo, para valores agrupados en intervalos, se halla
derecho).
1 2 2
Así, aplicando la fórmula asociada a la mediana para n impar, obtenemos X(39+1)/2
2 2 4
= X20 y basándonos en la fórmula que hace referencia a las frecuencias absolutas:
Por tanto la mediana será el valor de la variable que ocupe el vigésimo lugar. En 4 5 13
Ejemplo (N par) 8 4 36
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 6 9 4 4 2
Cálculo de la Mediana:
Primero hallamos las frecuencias absolutas acumuladas Fi (ver tabla margen derecho).
Si volvemos a utilizar la fórmula asociada a la mediana para n par, obtenemos X(38/2) = X19 y
basándonos en la fórmula que hace referencia a las frecuencias absolutas --> Ni-1< n/2 < Ni = N18 <
19 < N19
Con lo cual la mediana será la media aritmética de los valores de la variable que ocupen el
el vigésimo octavo)
con lo que Me = (5+6)/2 = 5,5 puntos.
Es menos sensible que la media a oscilaciones de los valores de la variable. Un error de transcripción
en la serie del ejemplo anterior en, pongamos por caso, el último número, deja a la mediana inalterada.
Como se ha comentado, puede calcularse para datos agrupados en intervalos, incluso cuando alguno
No se ve afectada por la dispersión. De hecho, es más representativa que la media aritmética cuando
la población es bastante heterogénea. Suele darse esta circunstancia cuando se resume la información
sobre los salarios de un país o una empresa. Hay unos pocos salarios muy altos que elevan la media
aritmética haciendo que pierda representatividad respecto al grueso de la población. Sin embargo,
alguien con el salario "mediano" sabría que hay tanta gente que gana más dinero que él, como que
gana menos.
Sus principales inconvenientes son que en el caso de datos agrupados en intervalos, su valor varía en
función de la amplitud de estos. Por otra parte, no se presta a cálculos algebraicos tan bien como la
media aritmética
oda
La moda de un conjunto de datos es el dato que más veces se repite, es decir, aquel que tiene
mayor frecuencia absoluta. Se denota por Mo. En caso de existir dos valores de la variable
que tengan la mayor frecuencia absoluta, habría dos modas. Si no se repite ningún valor, no
existe moda.
- Ejemplo1:
¿Cuál es el dato que más se repite en el ejemplo anterior?
El dato que más se repite es el 1, es el que tiene mayor frecuencia absoluta (4 veces).
- Ejemplo 2:
2, 3, 4, 5 , 6 , 9
En este conjunto de datos no existe ningún valor que se repita, por lo tanto, este conjunto de
- Ejemplo 3:
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la
- Ejemplo 4:
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
3- La mediana
La mediana es el valor que ocupa el lugar central entre todos los valores del conjunto de
Calculo de la mediana:
1° Ordenamos los datos de menor a mayor.
- La mediana de un conjunto con un número impar de datos es, una vez ordenados los datos,
Ejemplo:
mediana_aritmetica_impar.jpg (386×426)
- También podemos usar la siguiente fórmula para determinar la posición del dato central:
- La mediana de un conjunto con un número par de datos es, una vez ordenados, la media de
Ejemplo:
Calcular la mediana del conjunto de datos:
mediana_aritmetica_par.jpg (392×505)
4- Rango
El rango da la idea de proximidad de los datos a la media. Se calcula restando el dato menor
al dato mayor.
Este dato permite obtener una idea de la dispersión de los datos, cuanto mayor es el rango,
Ejemplo:
Se preguntó a 9 familias cuántas bicicletas tenían en total, dieron las respuestas ordenadas en
la siguiente tabla:
rango_estadistico_1.jpg (384×67)
- ¿Cómo hallarías el rango?
Se resta el dato mayor al dato menor: 3 - 0 = 3; Por lo tanto el rango sería 3 en este caso.
Si el conjunto de datos que se recolecta es muy numeroso, o bien, si el rango es muy amplio,
La amplitud o tamaño de cada intervalo se puede calcular dividiendo el valor del rango por
4- Ejercicios:
es:
a) 2 b) 3 c) 4 d) 5 e) 9
2- Halla la mediana de las siguientes series estadísticas.
a) 1, 7, 3, 2, 4, 6, 2, 5, 6
b) 4, 2, 1, 3, 8, 5, 3, 1, 6, 7
Distribución A: 9, 5, 3, 2, 1, 2, 6, 4, 9, 8, 1, 3, 5, 4, 2, 6, 3, 2, 5, 6, 7
Distribución B: 1, 1, 3, 2, 5, 6, 7, 2, 5, 4, 3, 1, 2, 1, 5, 7, 8, 9, 9, 2, 1
10, 13, 4, 7, 8, 11, 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18
a) Obtén la mediana