Professional Documents
Culture Documents
1 Conceptos de estadística y su
clasificación.
1.3.1 Histograma
En estadística, un histograma es una representación
gráfica de una variable en forma de barras, donde la
superficie de cada barra es proporcional a la frecuencia
de los valores representados. En el eje vertical se
representan las frecuencias, y en el eje horizontal los
valores de las variables, normalmente señalando las
marcas de clase, es decir, la mitad del intervalo en el que
están agrupados los datos.
Se utiliza cuando se estudia una variable continua, como
franjas de edades o altura de la muestra, y, por
comodidad, sus valores se agrupan en clases, es decir,
valores continuos. En los casos en los que los datos son
cualitativos (no-numéricos), como sexto grado de
acuerdo o nivel de estudios, es preferible un diagrama de
sectores.
Los histogramas son más frecuentes en ciencias
sociales, humanas y económicas que en ciencias
naturales y exactas. Y permite la comparación de los
resultados de un proceso.
Tipos de histograma
Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa)
mediante la altura de la barra la cual es proporcional a la
frecuencia simple de la categoría que representa.
Diagramas de barras compuesta
Se usa para representar la información de una tabla de
doble entrada o sea a partir de dos variables, las cuales
se representan así; la altura de la barra representa la
frecuencia simple de las modalidades o categorías de la
variable y esta altura es proporcional a la frecuencia
simple de cada modalidad.
Diagramas de barras agrupadas
Se usa para representar la información de una tabla de
doble entrada o sea a partir de dos variables, el cual es
representado mediante un conjunto de barras como se
clasifican respecto a las diferentes modalidades.
Polígono de frecuencias
Es un gráfico de líneas que se usa para presentar las
frecuencias absolutas de los valores de una distribución
en el cual la altura del punto asociado a un valor de las
variables es proporcional a la frecuencia de dicho valor.
Ojiva porcentual
Es un gráfico acumulativos, el cual es muy útil cuando se
quiere representar el rango porcentual de cada valor en
una distribución de frecuencias.
En los gráficos las barras se encuentran juntas y en la
tabla los números poseen en el primer miembro un
corchete y en el segundo un paréntesis, por ejemplo: (10–
20]
1.4.2 Mediana
En Estadística una mediana es el valor de la variable que
deja el mismo número de datos antes y después que él.
De acuerdo con esta definición el conjunto de datos
menores o iguales que la mediana representarán el 50%
de los datos, y los que sean mayores que la mediana
representarán el otro 50% del total de datos de la
muestra. Un intervalo mediano será el intervalo que
contiene dicho dato
1.5.2 Desviacion Media
La desviacion media es la media de las diferencias en
valor absoluto de los valores a la media.
Este valor estad¨ªstico no es de mucha utilidad en
estad¨ªstica debido a que no es f¨¢cil manipular dicha
funci¨®n al no ser derivable.
Siendo m¨¢s formales, la desviaci¨®n media deber¨ªa
llamarse desviaci¨®n absoluta respecto a la media, para
evitar confusiones con otra medida de dispersi¨®n, la
desviaci¨®n absoluta respecto a la mediana, DM , cuya
f¨®rmula es la misma, sustituyendo la media aritm¨¦tica
por la mediana M. Pero tal precisi¨®n no es relevante,
porque la desviaci¨®n absoluta respecto a la mediana es
de uso todav¨ªa menos frecuente.
La desviaci¨®n absoluta respecto a la media, Dm, la
desviaci¨®n absoluta respecto a la mediana, DM, y la
desviaci¨®n t¨ªpica, ¦Ò, de un mismo conjunto de valores
verifican la desigualdad:
Siempre ocurre que
donde el Rango es igual a
Rango = valor m¨¢ximo − valor m¨ªnimo
Dm = 0 cuando los datos son exactamente iguales (e
iguales a la media aritm¨¦tica)
1.5.3 Varianza
Varianza (S2 o 2): Es el resultado de la división de la
sumatoria de las distancias existentes entre cada dato y
su media aritmética elevadas al cuadrado, y el número
total de datos.
Distinguimos dos símbolos para identificar la varianza:
S2 para datos muestrales, y σ2 para datos poblacionales.
Note que la fórmula para la varianza muestral presenta en
su denominador al tamaño de la muestra menos uno,
tendencia adoptada por los estadísticos para denotar una
varianza más conservadora.
1.5.4 Desviacion Estandar
La desviación estándar (o desviación típica) es una
medida de dispersión para variables de razón (ratio o
cociente) y de intervalo, de gran utilidad en la estadística
descriptiva. Es una medida (cuadrática) de lo que se
apartan los datos de su media, y por tanto, se mide en las
mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta
con conocer las medidas de tendencia central, sino que
necesitamos conocer también la desviación que
representan los datos en su distribución, con objeto de
tener una visión de los mismos más acorde con la
realidad a la hora de describirlos e interpretarlos para la
toma de decisiones.
1.6 Coeficiente de Variacion
El coeficiente de dispersión es útil para comparar
dispersiones a escalas distintas pues es una medida
invariante ante cambios de escala. Por otro lado presenta
problemas ya que a diferencia de la desviación típica este
coeficiente es variable ante cambios de origen. Por ello
es importante que todos los valores sean positivos y su
media de por tanto un valor positivo.
Exigimos que:
Se calcula:
Donde S es la desviación típica. Se puede dar en tanto
por ciento calculando: