You are on page 1of 21

CONCEPTOS Y

DEFINICIONES ESPECIALES
Es el estudio cientfico de los La estadstica posee tres campos
bien definidos:
mtodos para recoger, organizar,
resumir y analizar los datos de una
informacin, as como para obtener
Descriptiva
conclusiones vlidas con rigor y
tomar decisiones razonables
Inferencial
apoyadas en tal anlisis.
Con esta herramienta es posible
Teora de Probabilidades.
trabajar en forma objetiva, permite
vincular causas y efectos, presentar
resultados con claridad y orden. Es
un insumo esencial para interpretar
informacin numrica y luego
construir diseos curriculares.
Estadstica Descriptiva
Trata de los estudios que se hacen sobre el total de individuos de una poblacin con el fin de
establecer las principales caractersticas de inters para el investigador.
Estadstica Inferencial
Se refiere a los estudios que se hacen sobre una parte de la poblacin (muestra), con el fin
de obtener (inferir) conclusiones sobre las caractersticas de inters de toda la poblacin. Es
un camino de deduccin con riesgo, con probabilidad de error.
Teora de Probabilidades
Es una rama de la matemtica de gran importancia en los estudios inferenciales, dado que
los valores que se obtienen sobre el anlisis de una muestra no son exactamente iguales a
los correspondientes parmetros de toda la poblacin. Estudia el comportamiento
matemtico del azar con un control de los fenmenos aleatorios.
Carcter
Valor o forma que asume una variable para un individuo determinado
Poblacin
Grupo completo de individuos u objetos que constituyen la base de inters para un estudio
estadstico. Es el conjunto de todos los elementos que cumplen una determinada caracterstica que
deseamos medir y estudiar.
Muestra
Parte representativa de una poblacin. Es todo subconjunto de una poblacin sobre el que se va a
realizar el estudio. El nmero de elementos de la muestra se denomina tamao de la muestra.
Individuo
En estadstica se considera individuo (objeto) a cada uno de los elementos de la poblacin.
Carcter
Cada uno de los aspectos o propiedades que se pueden estudiar en los individuos de una poblacin
recibe el nombre de carcter o estadstico. Esto permite clasificar a los individuos.
El carcter puede ser cuantitativo si se puede medir o bien cualitativo si no se puede medir pero se
puede comparar.
Dato
Valor o forma que asume una variable para un individuo determinado.
Distribuciones
uno a otro
Estimadores
Caractersticas cuantificables que posee una muestra, y que se utilizan para calcular los
parmetros de la poblacin.
Distribuciones
Formas de organizacin y representacin tabular de los datos.
Experimento Estadstico
Cualquier proceso que genera un conjunto de datos numricos.
Espacio Muestral
Conjunto de todos los posibles resultados de un experimento estadstico.
Variable
El conjunto de valores que puede tomar un carcter estadstico se llama variable estadstica. Son
atributos que poseen o se le pueden asignar a los individuos de una poblacin y que difieren de
uno a otro.
Clasificacin de Variables
Cualitativas: Las que definen cualidades de los individuos; usualmente pueden subdividirse en
categoras.
Ejemplo: Variable: Sexo. Categoras: M. F.
Indicadoras: Valores numricos que se le asignan a las categoras de una Variable Cualitativa.
Cuantitativas: Cuando los atributos que las definen son cuantificables o medibles numricamente.
Las Variables Cuantitativas pueden ser Discretas o Continuas.
Discretas: Cuando las variables slo pueden tomar determinados valores, (asumen valores de uno en
uno); es decir pueden tomar un nmero finito o bien infinito numerable de valores.
Continuas: Cuando pueden asumir cualquier valor entre dos enteros consecutivos, es decir pueden
tomar todos los valores de un intervalo y tan prximos como se quiera.
E i t it i l i i t d i
Intervalos de Clase
Se le denomina intervalo de clase a cada uno de los intervalos en que pueden
agruparse los datos de una variable estadstica. Permiten obtener una idea ms
clara y concreta de la realidad. Al agrupar los valores de una variable estadstica
y clasificarla por intervalos, la variable pasa a ser considerada continua.
Existen situaciones como las siguientes que pueden ocurrir:
Hay demasiados datos, para una sola variable.
Pueden ser pocos datos, pero sus valores muy dispersos.
Interesa una clasificacin particular de los resultados.
En estos casos el agrupamiento de los datos resulta una buena tcnica para el
anlisis de las variables dentro de un estudio estadstico.
4 2 Con la amplitud anterior y el nmero de intervalos ( ) hallo un nuevo rango( )
Intervalos de Clase Mtodo de Trabajo I
1.Aplicar una tcnica de recoleccin de datos, por ejemplo: Tronco y Hoja
R = D
M
D
m
2.Determinar el Rango de la informacin: .
D
M
= DatoMayor
D
m
= DatoMenor
Donde y
3.Determinar la Amplitud de los intervalos: Se divide el rango obtenido en
R
A =
dos por el Nmero de intervalos en los que deseo agrupar
I
Donde: A: Amplitud; R:Rango e I:Cantidad de intervalos en los que deseo agrupar
4.Si la amplitud no me da un nmero entero, se puede realizar el siguiente ajuste:
4.1.Ajusto la amplitud obtenida al entero siguiente.
4.2.Con la amplitud anterior y el nmero de intervalos (I), hallo un nuevo rango(NR).
4.3.Establezco la diferencia: NR-VR; donde VR es el viejo rango.+
4.4.Ajusto los datos originales de acuerdo con la diferencia anterior.
sumando la amplitud hasta cubrir el nmero de intervalos previamente definidos
Intervalos de Clase
Mtodo de Trabajo II
5.Establezco los intervalos, partiendo del primer dato (o del primer dato ajustado), y
sumando la amplitud hasta cubrir el nmero de intervalos previamente definidos
L
inf
+ L
sup

6.Se calcula la Marca de Clase para cada intervalo
Mc =
i
2
donde
Mc
i
= Marca de Clase del intervalo i;

L
inf

= Lmite inferior del intervalo i;
L
sup
= Lmite superior del intervalo

i.
La Marca de Clase es un valor que representa a todos los del intervalo o clase.
Es el punto medio entre los extremos de cada intervalo.
7.Se realiza la distribucin de frecuencias
Observaciones:
El nmero de intervalos, puede definirse previamente a criterio de los investigadores, o aplicando algunas tcnicas
sugeridas para ello de acuerdo con el tipo de estudio; una frmula empleada con frecuencia es la de Sturges: I= 1 +
(3.3 log N), donde N= Total de datos.
En cualquier caso se recomienda que el nmero de intervalos no sea inferior a 5, ni superior a 20.
Siempre que se realiza este agrupamiento hay una prdida de informacin, se tiene en cuenta la pertenencia o no
de cada dato al intervalo pero no su valor exacto.
Asimismo se produce un error en el clculo posterior de los parmetros estadsticos. Los valores que pertenecen al
intervalo se ven representados por su marca de clase, y ellos pueden ser mayores o menores que sta

l ti d l l i l l id d T bi d l l
Definiciones
f
i

Frecuencia Absoluta ( )
Es la cantidad de veces que aparece y se repite el valor dato.
Frecuencia Absoluta Acumulada ( F
A
)

Se denomina frecuencia absoluta acumulada de un valor a la suma de todas las frecuencias absolutas
F
A
=

f
i

de los valores menores o iguales hasta el valor considerado.
Distribucin de frecuencias
Representacin tabular de los datos correspondientes a una variable, que incluye:
f
r

Frecuencia Relativa ( )
Se denomina frecuencia relativa de un valor al cociente entre su frecuencia absoluta y el nmero total
de datos que intervienen en el experimento .
Frecuencia Relativa Acumulada (
F
R
)

Se denomina frecuencia relativa acumulada de un valor a la suma de todas las frecuencias
F
A

F = relativas de los valores menores o iguales al considerado. Tambin puede calcularse como:
R
N
Presentacin de datos: Tablas, Grficos y
Diagramas
Existen muy diversos tipos y estilos de herramientas utilizadas para representar los datos
correspondientes a una variable estadstica. Es fundamental que sean claros, fcil de
entender e interpretar, deben ajustarse estrictamente a la realidad que representan.
Hay dos tipos de grficas para representar Distribuciones Agrupadas por intervalos:
Histograma: Grfico de barras verticales pegadas con igual amplitud y centradas en la marca
de clase. Asocian a cada intervalo un rectngulo de superficie proporcional a la frecuencia
correspondiente a dicho intervalo. Las alturas de esos rectngulos son los cocientes entre las
frecuencias absolutas y las longitudes de los intervalos que le corresponden. A intervalos de
clase iguales, las alturas son directamente proporcionales a las frecuencias.
Polgono de frecuencias: Grfico de trazos o lneas, cerrado, que se construye uniendo los
puntos extremos medios superiores de un histograma, es decir los puntos correspondientes
a las frecuencias de cada valor.
id
Grfico de Trazos o Lneas
Son utilizados para una o varias variables cuantitativas discretas.
Grfico de barras (Verticales y horizontales)
Es un grfico que asocia a cada valor de la variable una barra (vertical u horizontal), proporcional a la
frecuencia que le corresponde. Es apropiado para variables cualitativas solas o en comparacin.
Dentro de la representacin en barras, se encuentran las Barras en Porcentaje por componente, muy
tiles cuando se trata de poblaciones con tamaos muy diferentes.
Sectores Circulares o de Pastel
Para una sola variable cualitativa o cuantitativa. Son tiles para representar las distintas partes de un todo,
los diversos componentes de un carcter. Cada suceso se representa por un sector circular de una
amplitud proporcional a su frecuencia
Pictogramas
Representaciones usualmente de barras, que se apoyan en las facilidades que brindan los grficos por
computador. Junto al grfico de los datos se puede ver una imagen relativa o referida a los objetos que se
miden.
Cartogramas
Son representaciones de los datos sobre un mapa.
Di t ib i M lti d l E l d i bl ti t l d tid
M di X
Parmetros Estadsticos
Caractersticas numricas cuantificables que posee una poblacin. Se obtienen mediante un proceso de
clculo a partir de datos medibles. Son nmeros que describen el comportamiento y las caractersticas
generales de un conjunto de datos estadsticos. Se los agrupa en dos categoras: centralizacin y
dispersin.
Medidas de Tendencia Central
Valores numricos que se pueden obtener de la distribucin de una variable cuantitativa, y cuyos
resultados se ubican por el centro de la misma distribucin; ellas son:
La Moda (M
o
), la Mediana ( M
ed
), y la Media ( X ).
Moda (
M
o )
Es el dato que se presenta con mayor frecuencia absoluta dentro de una distribucin. Si en una
distribucin aparecen dos Modas, se habla de una Distribucin. Bimodal; si son ms de dos modas se dir
una Distribucin Multimodal. En el caso de una variable continua este valor carece de sentido.
Mediana ( M
ed
)
Se denomina mediana al valor central de los datos cuando stos se han organizado ordenadamente de
menor a mayor. Es un valor que divide a la distribucin en dos partes iguales, cada una de las cuales
contiene el 50% de los datos por debajo y el otro 50% por encima.
Media ( X )
Se define como la suma de todos los valores (datos) que asume una variable, dividida por el nmero total
de datos.
de Tendencia Central
1 Para distribuciones no agrupadas
n
Frmulas de clculo de las Medidas
de Tendencia Central
1. Para distribuciones no agrupadas
* Moda: Basta con observar la distribucin, e identificar el dato que se presenta
con la mayor frecuencia absoluta.
*Mediana: Dependiendo si el total de datos es impar o par:
n + 1
* Si el total de datos es impar, la mediana ser aquel dato que ocupe el lugar
2
* Si el total de datos es par, la mediana ser el promedio de los datos que ocupen las
| n
| | n
+ 1
|

posiciones y
|
, es decir los valores que ocupan las posiciones centrales.
|
\
2
. \
2 .
*Media: La definicin conduce a la siguiente frmula, que es la ms utilizada en
el clculo de la media:
n n

x
i
=
i =1


x
i
f
i
=
i =1

; si los datos estn agrupados se puede calcular como:
X X
n n
donde
x
i : Dato isimo;
f
: frecuencia absoluta del dato isimo;
n
: total de datos
de la informacin.
2
i
2. Para distribuciones agrupadas
(Con intervalos de igual amplitud)
L
inf
:Lmite inferior del intervalo de clase
:Amplitud de los intervalos
:Marca de clase del intervalo i.
Se emplean las siguientes frmulas:
A
M
ci
| | A
1

+ | A
MODA M
o

= L
inf

\
A
1
+ A

2 .
:Diferencia entre la frecuencia
absoluta del intervalo modal y la
frecuencia absoluta del intervalo
A
1

n



| |
2


f |
|
A
ant
+ M
ed
= L
inf
MEDIANA
f
abs
|
anterior
:Diferencia entre la frecuencia
absoluta del intervalo modal y la
frecuencia absoluta del intervalo
siguiente
:Marca de clase arbitraria
:Nmero de veces la amplitud de
los intervalos, a partir de la marca
de clase arbitraria.
|
\ .
A
2

MEDIA
ci
M f

X =
i
*Mtodo largo
n
M
ca


+


|

. f

|

X = M
i
|
A *Mtodo corto
|
ca
n
\ .
t d i f i i f i b l 90% t l d l
Medidas de dispersin
Son valores numricos que nos dan informacin sobre los esparcidos o aglutinados,
donde se encuentran los datos correspondientes a una variable cuantitativa dentro de
un estudio estadstico. Permiten obtener una imagen del alejamiento de los datos
respecto de las medidas de centralizacin. Pueden existir series de datos con iguales
medidas de centralizacin pero con aspecto muy diverso, segn sea la dispersin de
sus datos.
Las medidas de dispersin ms usadas son:
*Los Rangos:
Comn o amplitud: Se define como la diferencia entre los datos
extremos de una variable cuantitativa, as: Dato Mayor-Dato Menor
Intercuartil: Q3-Q1; proporciona informacin sobre el 50% central de la
variable.
Percentil: P90-P10; se utiliza cuando se quieren excluir algunos datos
extremos de informacin; recoge informacion sobre el 90% central de los
datos.
*La Varianza:
(o
2
)

*Las desviaciaciones: La Desviacin Media y la Desviacin Tpica o Standard (S.D.)
Coeficiente de variacin
Es un valor que da informacin global sobre el grado de dispersin de la medida
estadstica utilizada; cuando la medida empleada es la media aritmtica se define
como:
SD
cv =

x
Es muy til para comparar estadsticamente dos poblaciones o dos muestras
diferentes. Nos muestra la variacin relativa de cada poblacin. Quien posea el
coeficiente de variacin mayor ser la ms heterognea.
Medidas de posicin: Los Cuantiles
Se denominan as a ciertos valores dentro de una informacin, que permiten dividirla
en partes iguales. Hemos visto que la Mediana es el valor que divide al conjunto de
datos en dos partes iguales, pues bien a las medianas de cada una de estas dos
partes iguales que nos han quedado, los denominamos Cuartiles.
Los cuantiles ms usados son
Los Cuartiles (Q):
Se utilizan para dividir la informacin en cuatro (4) partes iguales, cada una de las
cuales contiene un 25 % del total de los datos. Son 4 cuartiles notados como: Q
l
- Q
2
-
Q
3
- y - Q
4
.
Los Deciles (D):
Se usan para dividir una informacin en diez (10) partes iguales, cada una de las
cuales contiene un 10 % de los datos. Son 10 Deciles notados como: D
1
- D
2
- - -

D
10

Los Percentiles (P):
Se usan para dividir una informacin en cien partes iguales, cada una de las cuales
contiene un 1 % de los datos. Son cien percentiles notados como: P
1
- P
2
- P
3
- - -P
100

|
(o
2
)
La Varianza
Brinda informacin global sobre la forma en cmo varan los datos; juega un papel
trascendental en la estadstica inferencial cuando de hacer estimaciones se trata; ya
que del anlisis de la varianza de una informacin cuantitativa se pueden deducir
muchos resultados sobre el comportamiento general de los parmetros de una
poblacin. Se define como la media de los cuadrados de las desviaciones medias.
Permite descubrir la variacin que existe entre dos muestras de la misma o de
diferentes poblaciones.
La varianza se define como:

i
( x x)
2
f
i
I)
Var ( x) = o
2
= ; para datos sin agrupar.
n


(M
ci
x) f
i
2
II)
Var ( x) = o
2
=
; para datos agrupados.
n
III) Como frmula alterna de la varianza, la que se emplea comnmente es la siguiente:
2
2

|

x
2
f

|

x f


2

|
x
|


i


i i
|
Var ( x) = =
|
|
n n \ .
\ .
Las Desviaciones
Una desviacin se define como la diferencia entre el valor del dato y alguna
medida estadstica; las desviaciones ms comunes se toman con respecto a la
media aritmtica, pero se pueden tomar desviaciones respecto a la moda, a la
mediana, a uno de los cuantiles,
La Desviacin Media
Se define como el promedio - la media aritmtica - de las desviaciones absolutas
de una variable, tomadas en valor absoluto,
la variable; en frmulas ser:
con respecto a la media aritmtica de

x
i
x


x
i
x


f
i

DM = DM =
n n
i
Desviacin Tpica o Estndar
Se define como la raz cuadrada de la varianza; en frmula ser:

i
( x x)
2
f
SD = o
,para datos sin agrupar.
=
n


(Mc x)
2

f
,para datos agrupados.
i i
SD = o =
n
Observacin:
La media es el valor del promedio, fsicamente puede pensarse como el centro de gravedad del
conjunto de datos. Se puede imaginar como el valor equitativo que se obtendra al repartir el todo
entre sus elementos.
La desviacin tpica es una medida de lo equitativo que se ha realizado la distribucin. Hay menor
equilibrio cuando hay mayor desviacin tpica
GLOSARIO ESTADSTICO:
Fuente: Murray R. Spiegel,
Estadstica, McGrawHill.