POBLACIÓN Y MUESTRA

Población es el conjunto de medidas, individuos u objetos que comparten una
característica en común. La población se basa en cuatro características:
contenido, tipo de unidades y elementos, ubicación espacial y ubicación temporal.
De la población es extraída la muestra.
Muestra es un conjunto de elementos extraídos de la población. Los resultados
obtenidos en la muestra sirven para estimar los resultados que se obtendrían con
el estudio completo de la población. Para que los resultados de la muestra puedan
generalizarse a la población, es necesaria que la muestra sea seleccionada
adecuadamente, es decir, de modo que cualquiera de los elementos de la
población tenga la misma posibilidad de ser seleccionados. A este tipo de muestra
se le denomina muestra aleatoria.
La unidad estadística es el elemento de la población que reporta la información y
sobre el cual se realiza un determinado análisis.

VARIABLE
Variable es una característica susceptible de tener distintos valores en los
elementos de un grupo o conjunto.
Si la variable tiene la capacidad de tomar cualquier valor que exista entre dos
magnitudes dadas, entonces esta variable será continua.
Si por el contrario, sólo puede tener un valor de entre cierta cantidad de valores
dados, entonces será discreta.
PLANEACIÓN


La planeación de una investigación estadística debe abarcar el conjunto de
lineamientos, procedimientos y acciones que conlleven a la resolución satisfactoria
para la cual se estableció la investigación. Es por ello que el plan de investigación
debe fijar concretamente su objeto, el fin que persigue, la fuente o fuentes de
información, los procedimientos a seguir y resolver los aspectos logísticos, físicos
y humanos siguiendo un presupuesto de costos establecido.
La investigación estadística puede ser tan sencilla y poco compleja como la
recopilación ordenada y coherente de datos que se encuentren en instituciones
estatales o privadas que las suministren, o bien pueden ser tan elaboradas y
complejas como lo son los censos poblacionales, los censos agrícolas o
industriales que tengan importancia estratégica para una región, o inclusive para
un país. Pero, sea como fuere, la investigación debe seguir una orientación en su
planteamiento y resolución.
Los aspectos básicos que se deben seguir para desarrollar un trabajo son:

Definición del objeto de investigación.
Unidad de investigación.
Clase de investigación.
Las fuentes de información.

RECOLECCIÓN DE LA INFORMACIÓN

Después de planeada la investigación, comienza la recolección de los datos. Esta
consiste en un conjunto de operaciones de toma de datos que puede ser por
observación, por encuesta o tomada de publicaciones y/o fuentes confiables que
han efectuado investigaciones estadísticas. Para esto se selecciona el método de
recolección de la información acorde a las necesidades de la investigación, que se
clasifican según su cobertura y según su forma de observación.



ORGANIZACIÓN DE LA INFORMACIÓN

Luego de tomar la información necesaria en la investigación que se sigue, se
obtiene una gran cantidad de datos que requieren ser interpretados y sobre los
cuales se busca concluir algo específico. Para esto se debe depurar y clasificar la
información aplicando técnicas adecuadas.
La organización y el resumen de la información son dos procesos distintos que se
desarrollan por separado. La organización hace referencia al arreglo de los datos
en un formato lógico para su interpretación. En cambio, el resumen implica la
condensación de varias mediciones en una forma compacta, ya sea gráfica o
numéricamente. De ahí que se tome primero la forma de organizar la información
tomada en una investigación estadística.
La información estadística puede organizarse de diversas maneras: ordenando el
conjunto de datos como una combinación ordenada o en un arreglo de tallo y
hojas, otro de los métodos usados es el uso de tablas y más específicamente la
tabla de frecuencias.

PRESENTACIÓN DE LA INFORMACIÓN

Cuando se diseña una gráfica, sea esta cual fuere, deben tenerse en cuenta
ciertos aspectos con el fin de mejorar su apariencia y mostrar con claridad lo que
se quiera que ella refleje.
Una gráfica siempre debe poseer un título que indique la descripción del contenido
de ella. En muchas ocasiones, es importante indicar la escala con la que se
trabaja. Es decir, identificar los ejes coordenados (X y Y) e indicar sus magnitudes
correspondientes. La escala se aplica para saber la dimensión del fenómeno
graficado. Otro aspecto importante a tener en cuenta es la fuente de información,
que indique de dónde han sido tomados los datos incluyendo el tipo de
publicación, el año del registro y otros indicadores que resulten importantes para la
investigación.
TIPOS DE GRÁFICAS

Los distintos tipos de gráficas usadas más comúnmente en estadística son:
•Diagrama de frecuencias: se representan por medio de líneas verticales, cuya
altura está dada por los valores de las frecuencias, ya sean absolutas o relativas.
•Histograma de frecuencias: se construyen representando los intervalos de clase
en la escala horizontal y las frecuencias de clase (absolutas o relativas) en la
escala vertical y trazando rectángulos cuyas bases equivalen a la amplitud de los
intervalos de clase y sus alturas corresponden a las frecuencias de cada clase.
•Polígono de frecuencias: describe también la información de la distribución de
frecuencias absolutas o relativas. Pero se grafican las marcas de clase de cada
intervalo, generando una secuencia de puntos que se unen en segmentos de recta
para formar un polígono.
•Ojiva: es el gráfico de una distribución de frecuencias acumuladas (relativas o
absolutas) y puede ser descendente o ascendente. Ella permite presentar en un
mismo gráfico, diferentes curvas lo que no permite el histograma de frecuencias.
•Diagramas de barra: son rectángulos con alturas proporcionales a las frecuencias
o magnitudes correspondientes, pueden construirse en forma vertical u horizontal,
sin embargo son más comunes las verticales; en este tipo de gráficos se ubica la
variable o atributo en el eje horizontal y la altura está dada por los valores o
cantidades que toma dicha variable.
•Diagramas circulares: permite observar los componentes de un total, como
sectores de un círculo. Se utiliza para representaciones gráficas de distribuciones
porcentuales. Es una forma efectiva de representar distribuciones de frecuencias
en las que la característica es cualitativa.
•Pictogramas: es una forma de representar los datos por medio de símbolos o
dibujos donde cada uno representa la misma información con un valor fijo. Los
pictogramas son usados comúnmente en el diseño publicitario, ya que se
consideran más expresivos.
•Cartogramas: muestra la información cuantitativa o cualitativa sobre bases
geográficas dentro de las cuales se ubican símbolos o figuras como puntos,
barras, círculos, colores, etc.
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE TENDENCIA CENTRAL


Al ver la forma de representar los conjuntos de datos en histogramas y polígonos
de frecuencia se mostró una tendencia a agruparse alrededor de los datos más
frecuentes, haciendo de esta forma que estas representaciones adquieran una
forma de campana.
Esta tendencia al agrupamiento de los datos hacia la parte central de los gráficos
que los representan da lugar a lo que se conoce como medidas de tendencia
central, correspondientes a la media, mediana y moda. Existen otras medidas de
tendencia central, menos usadas, como son: Media Geométrica, Media Armónica,
Cuartiles, Deciles y Percentiles.
La Media Aritmética es la medida más conocida y la más fácil de calcular. Se
define como la suma de los valores de una cantidad dada de números dividido
entre la cantidad de números.
Un caso similar al anterior consiste en la Media de una distribución de frecuencias
agrupadas, donde los pesos o ponderaciones corresponderían a las frecuencias
de los valores de las marcas de clase, recordando que la marca de clase es el
valor promedio de un intervalo de clase.

MEDIANA

Se define como el valor que divide una distribución de datos ordenados en dos
mitades, es decir, se encuentra en el centro de la distribución.
La mediana se simboliza como Me. Es menos usada que la media aritmética. Para
su cálculo es necesario que los datos estén ordenados.
Cuando la cantidad de datos es impar, fácilmente se identifica la mediana; pero
cuando el número de datos es par, la mediana se calcula hallando el valor medio
entre los dos valores centrales y no coincidirá con ninguno de los valores del
conjunto de datos.
Cuando los datos se encuentran agrupados, se calcula el valor de n/2y con él se
busca, en las frecuencias acumuladas, el intervalo de clase en donde este se
encuentra o se aproxime mejor. Esta clase recibe el nombre de clase de la
mediana.

MODA

Se trata del valor más frecuente en un conjunto de datos. Se considera como el
valor más representativo o típico de una serie de valores. Es simbolizada como
Mo.
Si dos valores tienen la misma frecuencia se dice que el conjunto es bimodal.
Cuando más de dos valores ocurren con la misma frecuencia y ésta es la más
alta, todos los valores son modas, por lo que el conjunto de datos recibe el nombre
de multimodal o polimodal.
Cuando los datos se encuentran agrupados la moda es la marca de clase del
intervalo de clase que contiene la mayor frecuencia.
COMPARACIONES

En resumen, se puede entender la media aritmética como el punto de equilibrio del
conjunto de datos (como el centro de gravedad de un cuerpo); la mediana como la
medida que permite dividir el área bajo la curva de distribución en dos parte
iguales y la moda como el pico más alto de la curva de distribución.
El cuadro siguiente [1] resume y compara de una manera didáctica y práctica la
media, mediana y moda en términos de ventajas y desventajas para su cálculo y
uso en la investigación estadística. Ellas tres son las medidas de tendencia central
más comúnmente usadas.
Tabla
Comparación de la media, mediana y moda