You are on page 1of 20

Trminos Bsicos

Glosario de Trminos Bsicos


Estadstica

AMPLITUD DE UN INTERVALO
Conocido tambin como amplitud de clase, es la diferencia entre los dos extremos de un
intervalo.
ANLISIS DE CORRELACIN
Es el estudio que se realiza para medir la intensidad o grado de la asociacin que existe

entre variables numricas.


ANLISIS DE REGRESIN
Es el estudio que se realiza con el propsito de hacer predicciones. El objetivo es el
desarrollo de un modelo estadstico que pueda ser utilizado para predecir valores de una
variable dependiente, basado en los valores de la variable independiente.
ANLISIS DE VARIANZA
Es un mtodo para comparar dos o ms medias (Ver media) de n grupos analizando la
varianza de los datos, tanto entre n grupos como dentro de ellos.
ASIMETRA
Es la falta de simetra entre los datos de una distribucin. El concepto de asimetra se
refiere a si la curva que forman los valores de la serie presenta la misma forma a la
izquierda y derecha de un valor central (media aritmtica).
AUTOCORRELACIN
Se denomina as a la correlacin de una variable consigo misma cuando se desfasa uno
o ms periodos de tiempo. Se determina calculando el coeficiente de autocorrelacin.

BASE DEL NDICE


Es la magnitud utilizada como unidad de referencia, contra la cual se hacen todas las
comparaciones de la variable en estudio. Esta base puede corresponder a un ao, un
trimestre, un mes, etc.

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica
BONDAD DE AJUSTE
Es un indicador que permite discernir acerca de qu tan buena es la ecuacin obtenida.
Para determinar la bondad de un ajuste se utilizan diferentes criterios en la regresin
lineal. Unos se refieren a los residuales como son el valor de la sumatoria de residuales
al cuadrado, la varianza, la desviacin estndar del ajuste y el coeficiente de correlacin
al cuadrado. Otro indicador de la bondad de ajuste es el realizado mediante el test de
bondad de ajuste utilizando la prueba Ji-Cuadrada (X 2 ), Kolgomorov -Smirnov (K-S)
entre otras.

CARTOGRAMAS
Es un tipo de grfico mediante el cual se muestra datos estadsticos sobre una base
geogrfica como mapas.
CENSO
Es una investigacin estadstica que consiste en el recuento de la totalidad de los
elementos que componen la poblacin por investigar. Es necesario que se especifique el
espacio y el tiempo al que se refiere el recuento.

CLASE MEDIANA
En una tabla de datos agrupados, es la clase o intervalo al que pertenece el valor de la
mediana.
CLASE MODAL
En una tabla de datos agrupados, es la clase o intervalo que tiene la mayor frecuencia.
CLASE O CATEGORA
Se denomina as a la caracterstica o a los intervalos construidos convenientemente para
agrupar la informacin. Est conformada por el nmero de particiones que se realiza al
conjunto de informacin.

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica
CODIFICACIN
Es asignar nmeros o claves a la informacin para facilitar el procesamiento.
Generalmente se realiza sobre las respuestas de un cuestionario, para poder
identificarlas con mayor eficacia al momento del procesamiento de datos.
COEFICIENTE DE ASIMETRA DE FISHER

Es un valor que indica la asimetra. Simblicamente se representa por


COEFICIENTE DE ASIMETRA DE PEARSON
Es un valor que indica la asimetra. Simblicamente se representa por As, y se obtiene
mediante la siguiente frmula:

COEFICIENTE DE CONFIANZA
Se representa por (1- ) y es la probabilidad de que la hiptesis nula Ho no sea
rechazada cuando de hecho es verdadera y debera ser aceptada.

COEFICIENTE DE CORRELACIN LINEAL DE PEARSON


Es un nmero que mide la intensidad de la asociacin lineal entre dos variables.
El coeficiente de correlacin se representa simblicamente por "r".

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica
Este coeficiente se aplica cuando la relacin que puede existir entre las variables es
lineal (es decir, si representramos en un grfico los pares de valores de las dos
variables, la nube de puntos se aproximara a una recta).

No obstante, puede que exista una relacin que no sea lineal, sino exponencial,
parablica, etc. En estos casos, el coeficiente de correlacin lineal medira mal la
intensidad de la relacin de las variables, por lo que convendra utilizar un tipo de
coeficiente ms apropiado.
Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1
Si "r" > 0 La correlacin lineal es positiva (si sube el valor de una variable sube el de la
otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Si "r" < 0 La correlacin lineal es negativa (si sube el valor de una variable disminuye el
de la otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a -1.
Si "r" = 0 No existe correlacin lineal entre las variables, aunque podra existir otro tipo
de correlacin (parablica, exponencial, etc.)
De todos modos, aunque el valor de "r" fuera prximo a 1 -1, tampoco esto quiere decir
obligatoriamente que existe una relacin de causa-efecto entre las dos variables, ya que
este resultado podra haberse debido al puro azar.
COEFICIENTE DE CURTOSIS
Es una medida de forma. Se conoce como coeficiente de curtosis de Fisher, en honor al
matemtico britnico Ronald Fisher (1890-1962).
El valor se obtiene mediante la siguiente frmula:

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica

COEFICIENTE DE VARIACIN DE PEARSON


Es una medida de dispersin relativa y se calcula dividiendo la desviacin tpica entre la
media aritmtica:

La ventaja de este coeficiente es que no lleva asociado ninguna unidad de medida. Se


Interpreta como porcentaje, por lo que nos permitir decidir entre dos muestras, cul es
la que presenta mayor dispersin. Simblicamente se denota por CV.
COEFICIENTES DE REGRESIN
Son los valores constantes de una ecuacin de regresin lineal. En el modelo de
regresin lineal siguiente los coeficientes son a y b.
y = a + bx

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica

COVARIANZA
Es una medida de la asociacin lineal entre dos variables.

CUESTIONARIO
Es el instrumento ms utilizado para recolectar datos. Consiste en un conjunto de
preguntas respecto a una o ms variables a medir. La esencia de los cuestionarios son
las preguntas que permiten alcanzar los objetivos de la investigacin. Las respuestas a
estas preguntas constituyen los datos estadsticos que sern utilizados para conocer las
caractersticas de la poblacin o muestra bajo estudio.
CURTOSIS
Es una medida de forma. Tambin se conoce como medida de apuntamiento mide si los
valores de la distribucin estn ms o menos concentrados alrededor de los valores
medios de la muestra. Se definen 3 tipos de distribuciones segn su grado de curtosis:
Distribucin mesocrtica, distribucin leptocrtica y distribucin platicrtica. (Ver grfico
en coeficiente de curtosis).

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica
CUARTIL
Es una medida de posicin no central o de localizacin. Los cuartiles son los tres valores
que dividen la distribucin en cuatro partes iguales, es decir, en cuatro intervalos dentro
de cada cual estn incluidos el 25% de los datos de la distribucin:
lQ 1 Representa el primer cuartil y se interpreta como que el 25% de la
distribucin es menor que el Q 1 obtenido.
lQ 2 Representa el segundo cuartil y se interpreta como que el 50% de la
distribucin, es menor que el Q 2 obtenido. Este valor es igual a la
mediana.
lQ 3 Representa el tercer cuartil y se interpreta como que el 75% de la
distribucin, es menor que el Q 3 obtenido..

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica

DATO
Conocido tambin como informacin, es el valor de la variable asociada a un elemento
de una poblacin o una muestra.
DATO CUALITATIVO
Es aquel que representa alguna caracterstica de los elementos de una muestra o una
poblacin que presentan, atributos, actitudes o son opiniones. Son datos NO
NUMRICOS.
DESVIACIN ESTNDAR
Conocida tambin como desviacin tpica, es una medida de dispersin que se obtiene
como la raz cuadrada de la varianza.

DESVIACIN MEDIA

Es una medida de dispersin. Es un nmero que representa la media de los valores


absolutos de las desviaciones respecto a su media aritmtica. Se expresa en la misma
unidad en la que se presentan los datos. Se la denota como DM.

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica
DIAGRAMA
Es un dibujo o representacin grfica que sirve para representar un objeto, indicar la
relacin entre elementos o mostrar el valor de una magnitud.
DIAGRAMA DE BARRAS
Es un grfico utilizado para representar la distribucin de frecuencias de una variable
cualitativa y cuantitativa discreta. Puede graficarse en forma horizontal o vertical.

DIAGRAMA DE DISPERSIN
Es un grfico utilizado para representar la relacin entre los valores observados de dos
variables numricas. Tambin se conoce como nube de puntos.

DIAGRAMA DE SECTORES
Es un grfico utilizado para representar la distribucin de frecuencias relativas de una
variable cualitativa.

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica

DISTRIBUCIN NORMAL O CURVA NORMAL


Llamada tambin como distribucin de Gauss, es la distribucin de probabilidad ms
utilizada en estadstica y teora de probabiliad. Esto se debe a dos razones:
- Su funcin de densidad es simtrica y con forma de campana lo que favorece su
aplicacin como modelo a gran nmero de variables.
- Es adems lmite de otras distribuciones y aparece relacionada con resultados ligados
a la teora de las probabilidades gracias a sus propiedades matemticas. La funcin de
densidad est dada por:

ENCUESTA
Es un mtodo de recoleccin de datos. Es llevada a cabo generalmente a travs de
algn cuestionario que puede o no ser diligenciado por el encuestado y/o encuestador.

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica
ERROR DE MUESTREO
Conocido tambin como error muestral, es la diferencia que existe entre el valor real
(parmetro) obtenido con los valores de la poblacin y el valor estimado en base a los
valores de una muestra (estimacin).
ESPACIO MUESTRAL
Es el conjunto de todos los resultados posibles de un experimento aleatorio. Cada

experimento aleatorio tiene definido su espacio muestral (es decir, un conjunto con todas
las soluciones posibles).
Ejemplo: si tiramos una moneda al aire una sola vez, el espacio muestral ser
cara o sello.
Si el experimento consiste en lanzar una moneda al aire dos veces, entonces el
espacio muestral estara formado por (cara-cara), (carasello), (sello-cara) y

(sello-sello).
ESTADSTICA
Es la ciencia que comprende una serie de mtodos y procedimientos destinados a la
recopilacin, tabulacin, procesamiento, anlisis e interpretacin de datos cuantitativos y
cualitativos. Un objetivo de la estadstica es describir "la poblacin del estudio" en base a
informacin obtenida de elementos individuales. Se divide en dos ramas: Estadstica
descriptiva y Estadstica inferencial

ESTADSTICA DESCRIPTIVA
Rama de la ciencia estadstica que se encarga desde la recopilacin, procesamiento y
anlisis de la informacin siendo sus conclusiones vlidas slo para el grupo analizado.
ESTADSTICA INFERENCIAL
Rama de la ciencia estadstica que proporciona mtodos y procedimientos que permiten
obtener conclusiones para una poblacin a partir del estudio de una o ms muestras
representativas.

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica
ESTADSTICO
Conocido tambin como estadgrafo, es el valor calculado en base a los datos que se
obtienen sobre una muestra y por lo tanto es una estimacin de los parmetros. Entre los
ms usados se tiene la media muestral y la desviacin estndar muestral.
ESTRATIFICACIN
Es un procedimiento por medio del cual una poblacin se divide en grupos llamados

estratos, con el propsito de seleccionar una muestra separada en cada grupo. Cada
uno de estos grupos o estratos debe ser internamente lo ms homogneo posible.
ESTRATO
Es una subpoblacin o parte de una poblacin que rene caractersticas comunes que le
hacen ser homognea. Los estratos son mutuamente excluyentes. Ello significa que los

elementos que pertenecen a un estrato no pueden pertenecer a otro.


EXPERIMENTO
Es un mtodo de investigacin mediante el cual se determina la incidencia de variables
independientes sobre la variable dependiente.

FRECUENCIA ABSOLUTA
Es el nmero de veces que la variable asume un valor dado o pertenece a una clase
dada.
FRECUENCIA ABSOLUTA ACUMULADA
Es el nmero de observaciones hasta (inclusive) un valor dado de una variable numrica.

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica
FRECUENCIA RELATIVA
Es un valor que se obtiene como el cociente de la frecuencia absoluta (n i ) sobre el
tamao de la muestra (N). Simblicamente se representa por hi.

FRECUENCIA RELATIVA ACUMULADA


Es una cantidad que se obtiene como el cociente de la frecuencia absoluta acumulada (N

i ) sobre el tamao de la muestra (N). Simblicamente se representa por Hi .

HISTOGRAMA
Grfico utilizado para representar la distribucin de frecuencias de una variable continua.
Describe el comportamiento de un conjunto de datos en cuanto a su tendencia central,
forma y dispersin. Est formado por un conjunto de rectngulos unidos, cuya base es
igual a la amplitud del intervalo, y la longitud proporcional a la frecuencia.

INDEPENDENCIA ESTADSTICA
Se dice que dos variables X e Y son independientes, estadsticamente, cuando la
frecuencia relativa conjunta es igual al producto de las frecuencias relativas marginales
en todos los casos, es decir:

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica
INFERENCIA ESTADSTICA
Es una parte de la estadstica cuya finalidad es obtener conclusiones respecto a la
poblacin a partir de datos observados en muestras. Es el proceso por medio del cual se
hacen aseveraciones o estimaciones de un todo, a partir de sus partes o elementos.
INTERVALO DE CLASE

Es el conjunto de datos cuantitativos comprendido entre dos valores. Generalmente se


ubican en la primera columna en una tabla de distribucin de frecuencias.
Se conoce intervalos abiertos, semiabiertos, cerrados y semicerrados, en funcin a la
inclusin de los valores extremos.

MARCA DE CLASE
Es la denominacin que se le da al punto medio de un intervalo en una tabla de
frecuencias de datos agrupados. Hay tantas marcas de clase como intervalos tenga la
variable. Simblicamente se representa por xi.
MEDIA ARITMTICA PARA DATOS SIMPLES
Es una medida de tendencia central que denota el promedio de un conjunto de datos. Se
calcula dividiendo la suma del conjunto de datos entre el total de ellos. Simblicamente
se representa por: X

MEDIA ARITMTICA PARA DATOS AGRUPADOS


Es una medida de tendencia central. La media aritmtica de una variable se define como
la suma ponderada de los valores de la variable por sus frecuencias relativas. Se denota
por y se calcula mediante la expresin: X

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica

MEDIANA
Es una medida de tendencia central. Es el valor que divide al conjunto de datos

ordenados, en aproximadamente dos partes: 50% de valores son inferiores y otro 50%
son superiores.
MEDIDAS DE DISPERSIN
Son aquellas medidas de resumen que, de acuerdo a algn criterio, reflejan la

heterogeneidad de las observaciones. Dan una idea sobre la representatividad de las


medidas de tendencia central, a mayor dispersin menor representatividad. Entre ellas:
desviacin media, varianza, desviacin tpica, coeficiente de variacin, entre otros.
MODA
Es una medida de tendencia central es el valor de la variable que tiene mayor frecuencia
absoluta, la que ms se repite es la nica medida de centralizacin que tiene sentido
estudiar en una variable cualitativa, pues no precisa la realizacin de ningn clculo. Por
su propia definicin, la moda no es nica, pues puede haber dos o ms valores de la
variable que tengan la misma frecuencia siendo esta mxima.
MUESTRA
Es un subconjunto representantivo de la poblacin a partir del cual se pretende realizar
inferencias respecto a la poblacin de donde procede. Los elementos seleccionados con
cierta tcnica rene ciertas caractersticas que la hacen ser representativa, significativa y

confiable y que en base a ella se pueden hacer inferencias respecto a la poblacin. La


muestra puede ser probabilstica y no probabilstica.

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica
MUESTRA NO PROBABILSTICA
Es aquella que se obtiene mediante juicio de la persona que selecciona los elementos de
la muestra que usualmente es un experto en la materia.
MUESTRA PROBABILSTICA
Es aquella muestra obtenida por un mecanismo de probabilidades, en el cual cada

elemento de la poblacin total o universo tiene una probabilidad conocida de seleccin.


MUESTREO
Es un conjunto de mtodos y procedimientos estadsticos destinados a la seleccin de
una o mas muestras es la tcnica seguida para elegir muestras. El objetivo principal de
un diseo de muestreo es proporcionar procedimientos para la seleccin de muestras
que sean representativas de la poblacin en estudio.
MUESTREO ALETORIO SIMPLE

Tambin llamado irrestrictamente aleatorio. Es un mtodo de muestreo donde una


muestra aleatoria simple es seleccionada de tal manera que cada muestra posible del
mismo tamao tiene igual probabilidad de ser seleccionada de la poblacin.
MUESTREO ESTRATIFICADO ALEATORIO

Es un mtodo de muestreo que se aplica cuando se divide la poblacin en grupos,


llamados estratos, donde los datos son ms homogneos pero un estrato frente al otro
muy distintos. Para extraer la muestra aleatoria se aplica el muestreo aleatorio simple a
cada estrato y el tamao es la suma de los tamaos de todos los estratos.
MUESTREO ESTRATIFICADO ALEATORIO
Es un mtodo de muestreo que se aplica cuando se divide la poblacin en grupos,
llamados estratos, donde los datos son ms homogneos pero un estrato frente al otro
muy distintos. Para extraer la muestra aleatoria se aplica el muestreo aleatorio simple a
cada estrato y el tamao es la suma de los tamaos de todos los estratos.

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica

PARMETRO
Es cualquier valor caracterstico de la poblacin. Ejemplo: la media de la poblacin, la
desviacin tpica de la poblacin. Sin embargo estos valores son desconocidos porque
no siempre podemos tener todos los datos de la poblacin para calcularlos.
PERCENTIL
Es el valor que resulta de dividir el conjunto de datos en 100 partes iguales.
POBLACIN
Es cualquier conjunto de unidades o elementos claramente definido, en el espacio y el
tiempo, donde los elementos pueden ser personas, granjas, hogares, manzanas,
condados, escuelas, hospitales, empresas, y cualquier otro. Las poblaciones pueden ser
finitas e infinitas.
POBLACIN FINITA
Es aquella en la que es posible enumerar (contar) fsicamente los elementos que
pertenecen a la poblacin.
POBLACIN INFINITA
Es aquella en la que no es posible enumerar (contar) fsicamente los elementos que
pertenecen a la poblacin. Dicho de otra manera, cuando los elementos de la poblacin
son ilimitados.
PROBABILIDAD
Es un nmero que se le asigna a un suceso como una medida de su incertidumbre. Este
nmero puede tomar valores entre cero y uno inclusive.
PROBABILIDAD DE SELECCIN
Es la oportunidad que tiene cada elemento de la poblacin o universo de ser incluida en
una muestra.

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica

RANGO
Conocido tambin como recorrido, es un nmero que mide la amplitud de los valores de
un conjunto de datos y se calcula por diferencia entre el valor mayor y el valor menor. Lo
notaremos como R. No constituye una medida muy significativa en la mayora de los
casos, pero es muy fcil
de calcular.
REDONDEO
Es el procedimiento para expresar un nmero de acuerdo a una precisin establecida.
REGRESIN
Es una tcnia de anlisis para poner de manifiesto la estructura de dependencia que
mejor explique el comportamiento de la variable dependiente o explicada a travs de un
conjunto de variables independientes o explicativas, con las que se supone est
relacionada.

TABLA DE DATOS AGRUPADOS


Es un arreglo matricial que contiene el nmero de veces (frecuencia) que aparece un
dato, de acuerdo a las clases de inters especificadas (puede ser intervalos).
TENDENCIA
Es un componente del anlisis clsico de series temporales. Refleja el movimiento de la
serie en el largo plazo (crecimiento, decrecimiento o estancamiento). Es necesario un
nmero suficientemente grande de observaciones para determinar una tendencia.

Maestrante: Heczobeth Pia

Glosario de Trminos Bsicos


Estadstica

UNIDAD DE MUESTREO
Es la unidad estadstica que se selecciona para constituir la muestra. La eleccin de la
unidad de muestreo ms eficiente es una consideracin importante en el diseo de una
muestra.
UNIDAD ESTADSTICA
Conocido tambin como unidad elemental. Es el elemento o unidad base de la poblacin
o de la muestra que permite obtener informacin o datos referidos a ciertas
caractersticas o variables, que nos interesan para explicar un determinado fenmeno.

VARIABLE
Es una caracterstica de la poblacin o de la muestra cuya medida puede cambiar de
valor. Se representa simblicamente mediante las letras del alfabeto. Segn su

naturaleza puede ser cualitativa y cuantitativa.


VARIABLE NOMINAL
Es una variable cualitativa la cual slo permite asignar nombres a los datos y no implica
ningn orden. Ej. el idioma de los habitantes de la tierra.
VARIABLE ORDINAL
Es una variable cualitativa cuyos valores solamente pueden ser ordenados con algn
criterio.
VARIANZA
Conocida tambin como variancia, es una medida de dispersin de la informacin. Se

obtiene como el promedio de los cuadrados de las desviaciones de los valores de la


variable respecto de su media aritmtica.

Maestrante: Heczobeth Pia