You are on page 1of 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales

Bloque 0.- REPASO CONCEPTOS BSICOS DE ESTADSTICA.


Generalidades:
Iniciaremos el curso, repasando los conceptos y procedimientos estadsticos ya estudiados en E.S.O. y
en el primer curso de Bachillerato. Insistiendo sobre todo en el manejo de tablas, y el clculo de
medidas estadsticas de centralizacin, dispersin y localizacin.
As mismo es importante el uso de herramientas como la calculadora, para realizar clculos estadsticos
con relativa facilidad y rapidez.
Contenidos:
Tema 1 Distribuciones Unidimensionales
1.1 Introduccin:
1.1.1 Conceptos de: Poblacin, muestra, subpoblacin,
1.1.2 Variables estadsticas, clasificacin:
1.2 Tablas Estadsticas: Tipos
1.3 Tcnicas de recuento,
1.4 Distintos tipos de frecuencia
1.5 Medidas estadsticas:
1.5.1 Centralizacin: Moda, Mediana y Media
1.5.2 Dispersin: Desviacin, desviacin media, desviacin tpica, varianza.
1.5.3 Localizacin: Cuartiles, deciles, percentiles
1.5.4 Simetra.
1.5.5 Curtosis.
Tema 2: Distribuciones Bidimensionales
2.1 Introduccin a la Dependencia estadstica.
2.2 Variables cuantitativas:
2.2.1 Anlisis de la correlacin.
2.2.2 Rectas de regresin.

D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De


Conceptos Basicos De Estadistica.DOC
Pgina 1 de 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales

TEMA 1 Distribuciones unidimensionales:


1.1 Introduccin:
La palabra estadstica suele utilizarse bajo dos significados distintos, a saber:
1 Como coleccin de datos numricos.- Esto es el significado ms vulgar de la palabra estadstica. Se sobrentiende que
dichos datos numricos han de estar presentados de manera ordenada y sistemtica. Una informacin numrica cualquiera
puede no constituir una estadstica, para merecer este apelativo, los datos han de constituir un conjunto coherente,
establecido de forma sistemtica y siguiendo un criterio de ordenacin.
Tenemos muchos ejemplos de este tipo de estadsticas. El Anuario Estadstico publicado por el Instituto Nacional de
Estadstica, El Anuario de Estadsticas del Trabajo,
2 Como ciencia.- En este significado, La Estadstica estudia el comportamiento de los fenmenos de masas. Como todas las
ciencias, busca las caractersticas generales de un colectivo y prescinde de las particulares de cada elemento. As por
ejemplo al investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo numeroso de nacimientos y
obtener despus la proporcin de varones. Es muy frecuente enfrentarnos con fenmenos en los que es muy difcil predecir
el resultado; as, no podemos dar una lista ,con las personas que van a morir con una cierta edad, o el sexo de un nuevo ser
hasta que transcurra un determinado tiempo de embarazo,
Por tanto, el objetivo de la estadstica es hallar las regularidades que se encuentran en los fenmenos de masa.

1.1.1 Poblacin, elementos y caracteres.


Es obvio que todo estudio estadstico ha de estar referido a un conjunto o coleccin de personas o cosas. Este conjunto de
personas o cosas es lo que denominaremos poblacin.
Las personas o cosas que forman parte de la poblacin se denominan elementos. En sentido estadstico un elemento puede
ser algo con existencia real, como un automvil o una casa, o algo ms abstracto como la temperatura, un voto, o un
intervalo de tiempo.
A su vez, cada elemento de la poblacin tiene una serie de caractersticas que pueden ser objeto del estudio estadstico. As
por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres:
- Sexo
- Edad
- Nivel de estudios
- Profesin
- Peso
- Altura
- Color de pelo
- Etc.
Luego o tanto de cada elemento de la poblacin podremos estudiar uno o ms aspectos cualidades o caracteres.
La poblacin puede ser segn su tamao de dos tipos:
Poblacin finita: cuando el nmero de elementos que la forman es finito, por ejemplo el nmero de alumnos de un
centro de enseanza, o grupo clase.
Poblacin infinita: cuando el nmero de elementos que la forman es infinito, o tan grande que pudiesen
considerarse infinitos.. Como por ejemplo si se realizase un estudio sobre los productos que hay en el mercado.
Hay tantos y de tantas calidades que esta poblacin podra considerarse infinita.

Ahora bien, normalmente en un estudio estadstico, no se puede trabajar con todos los elementos de la poblacin sino que se
realiza sobre un subconjunto de la misma. Este subconjunto puede ser una muestra, cuando se toman un determinado
nmero de elementos de la poblacin, sin que en principio tengan nada en comn; o una subpoblacin, que es el
D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De
Conceptos Basicos De Estadistica.DOC
Pgina 2 de 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales


subconjunto de la poblacin formado por los elementos de la poblacin que comparten una determinada caracterstica, por
ejemplo de los alumnos del centro la subpoblacin formada por los alumnos de 3 ESO, o la subpoblacin de los varones.

1.1.2 Variables y atributos.


Como hemos visto, los caracteres de un elemento pueden ser de muy diversos tipos, por lo que los podemos clasificar en:
dos grandes clases:
- Variables Cuantitativas.
- Variables Cualitativas o Atributos.
Las variables cuantitativas son las que se describen por medio de nmeros, como por ejemplo el peso, Altura, Edad,
Nmero de Suspensos
A su vez este tipo de variables se puede dividir en dos subclases:
-

Cuantitativas discretas. Aquellas a las que se les puede asociar un nmero entero, es decir, aquellas que por
su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo nmero de hermanos, pginas de un
libro, etc.
Cuantitativas continuas: Aquellas que no se pueden expresar mediante un nmero entero, es decir, aquellas
que por su naturaleza admiten que entre dos valores cualesquiera la variable pueda tomar cualquier valor
intermedio, por ejemplo peso, tiempo. etc.

No obstante en muchos casos el tratamiento estadstico hace que a variables discretas las trabajemos como si fuesen
continuas y viceversa.
Los atributos son aquellos caracteres que para su definicin precisan de palabras, es decir, no le podemos asignar un
nmero. Por ejemplo Sexo Profesin, Estado Civil, etc.
A su vez las podemos clasificar en:
-

Ordenables: Aquellas que sugieren una ordenacin, por ejemplo la graduacin militar, El nivel de estudios,
etc.
No ordenables: Aquellas que slo admiten una mera ordenacin alfabtica pero no establece orden por su
naturaleza, por ejemplo el color de pelo, seco, estado civil, etc.

1.2. Tablas Estadsticas:


A partir de este momento nos vamos a ocupar de las estadsticas de una sola variable, Estadsticas Unidimensionales.
Las tablas estadsticas segn el nmero de observaciones y segn el recorrido de la variable estadstica, as tenemos los
siguientes tipos de tablas estadsticas:
Tablas tipo I:
Cuando el tamao de la muestra y el recorrido de la variable son pequeos, por ejemplo si tenemos una muestra de las
edades de 5 personas, por lo que no hay que hacer nada especial simplemente anotarlas de manera ordenada en filas o
columnas.
Edad de los 5 miembros de una familia:
5, 8, 16, 38, 45
Tablas tipo II:
Cuando el tamao de la muestra es grande y el recorrido de la variable es pequeo, por lo que hay valores de la variable que
se repiten. Por ejemplo, si preguntamos el nmero de personas activas que hay en 50 familias obtenemos la siguiente tabla:
Personas Activas en 50 familias
2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De
Conceptos Basicos De Estadistica.DOC
Pgina 3 de 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales


1

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una tabla en la que
resumamos estos datos quedando la siguiente tabla:

Personas Activas
1
2
3
4
Total

Nmero de Familias
16
20
9
5
50

Tablas tipo III:


Cuando el tamao de la muestra y el recorrido de la variable son grandes, por lo que ser necesario agrupar en intervalos los
valores de la variable. Por ejemplo si a un grupo de 30 alumnos les preguntamos el dinero que en ese momento llevan
encima, nos encontramos con los siguientes datos:
450
5

1152
180

250
200

300
675

175
500

80
375

25 2680
1500 205

605
985

785
185

1595 2300 5000 1200 100


125 315 425 560 1100

Evidentemente, la variable estadstica tiene un recorrido muy grande, 4998 pesetas, por lo que s queremos hacer una tabla
con estos datos tendremos que tomar intervalos. Para decidir la amplitud de los intervalos, necesitaremos decidir cuntos
intervalos queremos?. Normalmente se suele trabajar con no ms de 10 o 12 intervalos.
Amplitud =4998/10 = 499,8 Por lo que tomaremos intervalos de amplitud 500
Debemos tener en cuenta las siguientes consideraciones:
Tomar pocos intervalos implica que la prdida de informacin sea mayor.
Los intervalos sern siempre Cerrados por la izquierda y Abiertos por la Derecha [ Li-1 , Li )
Procuraremos que en la decisin de intervalos los valores observados no coincidan con los valores de los extremos del
intervalo y si esto ocurre que no sea en ms de un 5% del total de observaciones.
Con estas recomendaciones tendremos la siguiente tabla:
[ Li-1 , Li )
[ 0,500)
[ 500, 1000)
[ 1000,1500)
[ 1500, 2000)
[ 2000, 2500)
[ 2500, 3000)
[ 3000, 3500)
[ 3500, 4000)
[ 4000, 4500)
[ 4500, 5000)
[ 5000,5500)

Frecuencia
16
6
3
2
1
1
0
0
0
0
1

1.3. Tcnicas de recuento.


Aunque hoy en da, si se realiza un estudio estadstico importante esta tarea la realiza el ordenador, ya sea por medio de
programas de estadstica especficos BMDP, SPSS, o bien utilizando herramientas informticas de propsito general como
Bases de Datos u Hojas de Clculo
A lo largo del curso, veremos como mediante hojas de clculo o bases de datos podemos realizar este recuento.

D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De


Conceptos Basicos De Estadistica.DOC
Pgina 4 de 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales


Veamos como realizaramos este proceso manualmente, para ello veremos diversas tcnicas de ir anotando puntuaciones:

Aunque el mtodo ms utilizado o conocido sea el primero, quizs el ms cmodo de utilizar es el 2 en la mayora de los
casos.

1.4. Distintos Tipos de Frecuencia:


Una de los primeros pasos que se realizan en cualquier estudio estadstico es la tabulacin de resultados, es decir, recoger la
informacin de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian determinados nmeros
que representan el nmero de veces que ha aparecido, su proporcin con respecto a otros valores de la variable, etc. Estos
nmeros se denominan frecuencias:
As tenemos los siguientes tipos de frecuencia:
Frecuencia absoluta:
La frecuencia absoluta de una variable estadstica es el nmero de veces que aparece en la muestra dicho valor de la
variable, la representaremos por ni
Frecuencia relativa:
La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al aumentar el tamao de la muestra
aumentar tambin el tamao de la frecuencia absoluta. Esto hace que no sea una medida til para poder comparar. Para
esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia absoluta y el tamao de
la muestra. La denotaremos por fi

n
N

Donde N = Tamao de la muestra

Porcentaje:
La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante frecuente hablar siempre en trminos de tantos
por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.

p= f
i

100 %

Frecuencia Absoluta Acunulada:


Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadstica ha de ser cuantitativa o
cualitativa ordenable. En otro caso no tiene mucho sentido el clculo de esta frecuencia. La frecuencia absoluta acumulada
de un valor de la variable, es el nmero de veces que ha aparecido en la muestra un valor menor o igual que el de la variable
y lo representaremos por Ni.
Frecuencia Relativa Acunulada:
Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el
tamao de la muestra, y la denotaremos por Fi

N
F=N

Porcentaje Acumulado:
D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De
Conceptos Basicos De Estadistica.DOC
Pgina 5 de 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales


Anlogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la frecuencia relativa acumulada por
100.

P = F 100 %
i

Veamos esto con un ejemplo: Tomamos para ello los datos relativos a las personas activas.
Personas Activas Nmero Familias
Xi
ni
1
16
2
20
3
9
4
5
Total
50

Fi
16/50
20/50
9/50
5/50

pi
32%
40%
18%
10%

Ni
16
36
45
50

Fi
Pi
16/50 32%
36/50 72%
45/50 90%
50/50 100%

En este ejemplo se puede ver fcilmente como se calculan estas frecuencias.

1.5 Medidas Estadsticas:


En el resto del tema nos ocuparemos exclusivamente de las variable cuantitativas, puesto que con los atributos no se pueden
realizar operaciones aritmticas. Como hemos estudiado, las variables estadsticas cuantitativas se dividen o clasifican en
discretas o continuas, por lo que necesitaremos precisar cmo se calculan dichas medidas en cada caso.
En las variables cuantitativas continuas, dado que la tabulacin de los datos se hace mediante intervalos, necesitaremos
tomar un valor del intervalo para poder operar. Este valor se denomina marca de clase y es el punto medio del intervalo.
Las medidas estadsticas pretenden resumir la informacin de la muestra para poder tener as un mejor conocimiento de
la poblacin. Se clasifican en:
Medidas de Centralizacin:
Que nos sirven para ver sobre que valores se concentra la variable.
Medidas de Dispersin:
Nos van a dar una idea sobre la representatividad de las medidas centrales, a mayor dispersin menor
representatividad.
Medidas de Localizacin:
tiles para encontrar determinados valores importantes, para una clasificacin de los elementos de la muestra.
Medidas de la Simetra:
Sirven para ver si la distribucin tiene el mismo comportamiento por encima y por debajo de los valores
centrales.
Medidas de la Forma:
Comparan la forma de la distribucin con la forma de la distribucin Normal, que es la distribucin que se toma
como referencia.
Por otra parte el Estadstico Yule ha definido algunas propiedades deseables para una medida estadstica:
1 Debe definirse de manera objetiva: dos observadores distintos deben llegar al mismo resultado numrico.
2 Usar todas las observaciones y no algunas de ellas solamente, de manera que si varia alguna observacin la
medida considerada debe reflejar esta variacin.
3 Tener un significado concreto: la interpretacin debe ser inmediata y sencilla
4 Ser sencilla de calcular.
5 Prestarse fcilmente al clculo algebraico: Lo que permitir demostraciones mas elegantes.
6 Ser poco sensible a las fluctuaciones muestrales. Esta condicin es imprescindible en la Estadstica Matemtica
y en la Teora de Sondeos.

1.5.1. Medidas de Centralizacin: Media, Mediana y Moda:


Media:
D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De
Conceptos Basicos De Estadistica.DOC
Pgina 6 de 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales


Media aritmtica:
La media aritmtica de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias
relativas y lo denotaremos por
n

x = xi
i=1

f = = x n
N
n

xi representa el valor de la variable o en su caso la marca de clase.

i=1

Propiedades:
Si multiplicamos o dividimos todas las observaciones por un mismo nmero, la media queda multiplicada o dividida por
dicho numero.
Si le sumamos a todas las observaciones un mismo nmero, la media aumentar en dicha cantidad.
Adems de la media aritmtica existen otros conceptos de media, como son la media geomtrica y la media armnica.
Media geomtrica:
La media geomtrica de N observaciones es la raz de ndice N del producto de todas las observaciones. La representaremos
por G.

G=N

x n x n . .... x n
1

Solo se puede calcular si no hay observaciones negativas. Es una medida estadstica poco o nada usual.
Media armnica:
La media armnica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por
H

H=

i=1

1
1

x n

Al igual que en el caso de la media geomtrica su utilizacin es bastante poco frecuente.

Mediana:
La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el
valor que divide en dos partes la muestra.
Para calcular la mediana debemos tener en cuenta si la variable es discreta o continua.
Clculo de la mediana en el caso discreto:
Tendremos en cuenta el tamao de la muestra.

X
Si N es Par, hay dos trminos centrales, X , X

Si N es Impar, hay un trmino central, el trmino


N
2

N +1
2

N
+1
2

que ser el valor de la mediana.

la mediana ser la media de esos dos valores

Veamos un ejemplo.
N par
1,4,6,7,8,9,12,16,20, 24,25,27 N=12
Trminos Centrales el 6 y 7 9 y 12

N Impar
1,4,6,7,8,9,12,16,20, 24,25,27,30 N=13
Trmino Central el 7 , 12

Me=

Me=12

9 + 12
= 10,5
2

Clculo de la mediana en el caso continuo:


Si la variable es continua, la tabla vendr en intervalos, por lo que se calcula de la siguiente forma:
Nos vamos a apoyar en un grfico de un histograma de frecuencias acumuladas.
LA MEDIANA SER Me =

i 1

+x

COMO LOS TRIANGULOS ABC Y ADE SON


SEMEJANTES

AD

DE

=
SE
TIENE QUE J A\ALVAREZ J A - Repaso De
D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com
-Ar\A\Alvarez
AB BC
Conceptos Basicos De Estadistica.DOC
Pgina 7 de 15
AD = x
AB = Li Li.1 = a i

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales

N
De donde la mediana vale: Me =

i 1

2 N
N N
i

i . 1

i 1

a i donde ay es la amplitud del intervalo

Vemoslo por medio de un ejemplo.


Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente forma:
Li-1
Li
ni Ni Como el tamao de la muestra es N=50, buscamos el intervalo en el que
45
55
6 6 la Frecuencia acumulada es mayor que 50/2=25, que en este caso es el
55
65
10 16 3 y aplicamos la frmula anterior. Luego la Mediana ser
50 16
65
75
19 35
2
10 = 69.74
Me= 65 +
75
85
11 46
35 16
85
95
4 50

Moda:
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que ms se repite, es la nica medida de
centralizacin que tiene sentido estudiar en una variable cualitativa, pues no precisa la realizacin de ningn clculo.
Por su propia definicin, la moda no es nica, pues puede haber dos o ms valores de la variable que tengan la misma
frecuencia siendo esta mxima. En cuyo caso tendremos una distribucin bimodal o polimodal segn el caso.
Por lo tanto el clculo de la moda en distribuciones discretas o cualitativas no precisa de una explicacin mayor; sin
embargo, debemos detenernos un poco en el clculo de la moda para distribuciones cuantitativas continuas.
Para ello veamos como se obtiene de modo grfico y posteriormente llegaremos a su determinacin analtica
Para ello vamos a utilizar el siguiente sistema de referencia: Como Origen el Punto Li-1 Como eje horizontal la recta

horizontal que contiene al punto Li-1 y como eje vertical la recta AB.
Segn este sistema de referencia las coordenadas de los puntos ABCD son las siguientes:
A(0,ni-1), B(0,ni), C(ay, ni) y D(ay, ni+1) . Queremos calcula el valor de x, que es la abscisa del punto P interseccin de las
rectas AC y BD.
Recta AC
Recta BD
D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De
Conceptos Basicos De Estadistica.DOC
Pgina 8 de 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales

x
a
=

y n
n n

x
a

i 1

=
i

x .( n n
a
i

i 1

Despejando y en ambas ecuaciones


i 1

+ ni1

=
i

y n
n n
i

i+1

x .( n n
a
i

i+1

+ ni

Igualando, queda una ecuacin lineal en x cuya solucin es:

n n
x = ( n )( n ) a
n
n
i

Luego la expresin definitiva para la Moda ser:

i+1

i+1

i 1

Mo = L

+
i 1

n n

( n n )( n n ) a
i

i+1

i+1
i

i 1

Otros autores dan una expresin aproximada para la moda que viene dada por la siguiente expresin:

Mo = L

i 1

i+1

i+1

+ ni1

ai

Veamos su clculo mediante un ejemplo, para ello usaremos los datos del apartado anterior
.
Li-1
Li
ni Ni
19 10
Mo = 65 +
10 = 70,29
45
55
6 6
(19 10 ) + (19 11)
55
65
10 16
Utilizando la frmula aproximada
65
75
19 35
11
75
85
11 46
Mo = 65 +
10 = 70,24
10 + 11
85
95
4 50

1.5.2. Medidas de Dispersin:


Rango: Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor
de la distribucin,. Lo notaremos como R. Realmente no es una medida muy significativa e la mayora de los casos, pero
indudablemente es muy fcil de calcular.
Hasta el momento hemos estudiado los valores centrales de la distribucin, pero tambin es importante conocer si los
valores en general estn cerca o alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas de
dispersin.

Hemos estudiado varias medidas de centralizacin, por lo que podemos hablar de desviacin con respecto a cualquiera de
ellas, sin embargo, la mas utilizada es con respecto a la media.

Desviacin: Es la diferencia que se observa entre el valor de la variable y la media aritmtica. La denotaremos por di .
No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviacin, por
lo que precisaremos una medida que resuma dicha informacin.
La primera solucin puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de
todas las desviaciones y calculamos su media. Pero esta solucin es mala pues como veremos siempre va a ser 0.

D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De


Conceptos Basicos De Estadistica.DOC
Pgina 9 de 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales

d n = (x x ) n = x n n =
N
N
N
N x x x

D=

i=1

i=1

i=1

=0

i=1

Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se contrarrestan con las negativas.
Para resolver este problema, tenemos dos caminos:
Tomar el valor absoluto de las desviaciones. Desviacin media
Elevar al cuadrado las desviaciones. Varianza.
Desviacin media:
Es la media de los valores absolutos de las desviaciones, y la denotaremos por dm.
n

dm =
i=1

d n = x x n
N
N
n

i=1

Varianza:
Es la media de los cuadrados de las desviaciones, y la denotaremos por

d n = ( xi x) n
=

2
x

o tambin por

2
x

S =
2

i=1

i=1

Veamos que tambin es posible calcularlo como:

Sx = x

x n
=
n

i=1

x Para ello basta con trabajar con el binomio.

( x i x ) = x 2x x + x De donde
2

n =x n
x n 2 = x n 2 + 2
se obtiene: ( x i x )

2
2x x
x
x
N
N
N
N
2

i=1

i=1

i=1

Luego queda

i=1

probado.
Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por
ejemplo, si la variable viene dada en cm. La varianza vendr en cm2.
Desviacin tpica:
Es la raz cuadrada de la varianza, se denota por Sx o x.

S =
x

d n
n

i=1

x n
n

i=1

Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor.
Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica, que como veremos cuando estudiemos el
tema de estimacin estadstica, son los estimadores de la varianza y desviacin tpica poblacionales respectivamente.
Cuasivarianza:
Es una medida de dispersin, cuya nica diferencia con la varianza es que dividimos por N-1, la representaremos por
o

2
N 1

y la calcularemos de la siguiente forma:

(
xi x) n
n
d
x n
=
=
=
N 1
N 1
N 1
2

2
N 1

= N 1
2

i=1

i=1

i=1

2
N
N
2
x =
S
N 1
N 1 x

Cuasidesviacin tpica:
La raz cuadrada de la cuasivarianza y la denotaremos por SN1 o N-1.

N 1

= N 1 =

N 1 x

D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De


Conceptos Basicos De Estadistica.DOC
Pgina 10 de 15

2
N 1

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales


Todas estas medidas de dispersin vienen influidas por la unidad en la que se mide la variable, esto implica que si
cambiamos de unidad de medida, los valores de estos estadsticos se vean a su vez modificados. Adems, no permite
comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan mas dispersin. Pues no es posible
comparar unidades de distinto tipo.
Precisamos por lo tanto, una medida escalar, es decir, que no lleve asociado ninguna unidad de medida.
Coeficiente de Variacin:
Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitir decir
entre dos muestras, cual es la que presenta mayor dispersin. La denotaremos por C.V.

C.V . =

100 %

Veamos por ltimo un ejemplo de cmo se calculan todas estas medidas.

L L n N
i 1

45
55
65
75
85

55
65
75
85
95
N=

6
10
19
11
4
50

6
16
35
46
50

n x

50
60
70
80
90

d n d n d
i

300 -19,4
600 -9,4
1330
0,6
880 10,6
360 20,6
3470

2
i

n x

116,4 2258,16
94
883,6
11,4
6,84
116,6 1235,96
82,4 1697,44
420,8
6082

2
i

15000
36000
93100
70400
32400
246900

x = 3470 = 69.4
50
Dm= 420.8
= 8.416
50
2
246900
x = 6082 = 12164
. =
69.42 = 12164
.
50
50
. = 11029
.
x = 12164
2
N 1 = 50 12164
. = 124122
.
49
.
= 11141
.
N 1 = 124122
11029
.
100 = 15.892 %
C.V.=
69.4

1.5.3. Medidas de Localizacin: Cuartiles, deciles y percentiles.


Las medidas de localizacin dividen la distribucin en partes iguales, sirven para clasificar a un individuo o elemento dentro
de una determinada poblacin o muestra. As en psicologa los resultados de los Test o pruebas que realizan a un
determinado individuo, se clasifican segn el percentil correspondiente a la puntuacin obtenida por el sujeto.

Cuartiles
Medida de localizacin que divide la poblacin o muestra en cuatro partes iguales.
Q1= Valor de la variable que deja a la izquierda el 25% de la distribucin.
Q2= Valor de la variable que deja a la izquierda el 50% de la distribucin = mediana.
Q3= Valor de la variable que deja a la izquierda el 75% de la distribucin.
D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De
Conceptos Basicos De Estadistica.DOC
Pgina 11 de 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales


.
Al igual que ocurre con el clculo de la mediana, el clculo de estos estadsticos, depende del tipo de variable.
Caso I: Variable cuantitativa discreta:
En este caso tendremos que observar el tamao de la muestra: N
Veamos la tabla adjunta:
N PAR
N/2 PAR

N/2 IMPAR
N1

n1

n2

N
4

N
+1
4

Q=x

n1

N
+
2 n1

Q=x
3

N
+1
2
2
Q1 = x n1

+ xn2
2

N 1
4

Q=x

N 1
+1
4

n1

N
+
2 n2
n1

N IMPAR
(N-1)/2 PAR
(N-1)/2 IMPAR
n1
n2
n1

+ xn2
2

N
+1
2
+ n1
2

Q =x
3

n1

N +1
+
2 n1

Q=x
3

n1

N +1
4

+ xn2
2

Q=x

N+1
+
2 n2

N +1
+ n1
2

+ xn2
2

Q =x

n1

n1

Caso II: Variable cuantitativa continua:


En este caso el clculo es ms simple:, sea la distribucin que sigue:
[Li-2 -- Li-1)
[Li-1 -- Li)

ni-1
ni

Ny-1
Ny

Intervalo donde se encuentra el Cuartil correspondiente:

N
Q1 = Li 1 + 4 i 1 a i
N i N i 1

3N
N
Q3 = Li 1 + 4 i 1 a i
N i N i 1

Deciles
Medida de localizacin que divide la poblacin o muestra en 10 partes iguales
No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver slo para las variables
continuas.
dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k10 % de la distribucin.
[Li-2 -- Li-1)
[Li-1 -- Li)

d =L
k

+
i 1

ni-1
ny

Ny-1
Ny

Intervalo donde se encuentra el Decil correspondiente:

kN

10 N i1
N i N i1 ai

k = 1 .. 9

Percentiles:
Medida de localizacin que divide la poblacin o muestra en 100 partes iguales

D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De


Conceptos Basicos De Estadistica.DOC
Pgina 12 de 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales


No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver slo para las variables
continuas.
pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribucin.
[Li-2 -- Li-1)
[Li-1 -- Li)

ni-1
ni

p =L
k

+
i 1

Ny-1
Ny

Intervalo donde se encuentra el percentil corespondiente:

kN

100 N i 1
N i N i1 ai

k=1 .. 99

Como se puede observar la forma de calcular estas medidas es muy similar a la del clculo de la mediana.
Veamos el clculo de algunas de estas medidas en el ejemplo que estamos estudiando.
Vamos a calcular Q1,Q, d7, y p45
Li-1
Li
ni Ni
45
55
6 6
55
65
10 16
65
75
19 35
75
85
11 46
85
95
4 50
Clculo de Q1: Buscamos en la columna de las frecuencias Acumuladas el valor que supere al 25% de N=50, corresponde
al 2 intervalo.(50/4=12.5)

50 6
4
10 = 615
.
16 6

Q1 = 55 +

Anlogamente calculemos Q3, Buscamos ahora en la misma columna el correspondiente al 75 %de N que en este caso es el
4 intervalo (3.50/4=37.5)

3.50 35
Q3 = 75 + 46 4 35 10 = 77.27
Veamos ahora el decil 3. (corresponde al 30 % 3 50 / 10 = 15) sera el 2 intervalo.

= 55 +
3

3.50

10 6 10 = 64
16 6

Por ltimo veamos el percentil 45 (4550/100 = 22.5) Corresponde al intervalo 3.

p45 = 65 +

45.50

100 16 10 = 68.421
35 16

Una vez estudiadas las medidas de localizacin surgen dos nuevas medidas de dispersin, que son:
-

Recorrido intercuartlico:

Semirecorrido intercuartlico:

Recorrido interdeclico:

Recorrido intercentilico:

R = Q Q
Q Q
=
SR 2
R = d d
R = c c
Q

99

1.5.4. Medidas de Simetra:

D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De


Conceptos Basicos De Estadistica.DOC
Pgina 13 de 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales


Las medidas de la asimetra, al igual que la curtosis, van a ser medidas de la forma de la distribucin, es frecuente que los
valores de una distribucin tiendan a ser similares a ambos lados de las medidas de centralizacin. La simetra es importante
para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable.
As<0
As=0
As>0
Asimetra Negativa a la Izquierda
Simtrica
Asimetra Positiva a la izquierda

Para medir la asimetra se puede realizar atendiendo bsicamente a dos criterios:


- Comparando la Media y la Moda.
- Comparando los valores de la variable con la media.
Comparando la Media y la Moda:
Si la diferencia

x M

es positiva, diremos que hay asimetra positiva o a la derecha, en el caso de que sea negativa

diremos que hay asimetra negativa o a la izquierda. No obstante, esta medida es poco operativa al no ser una medida
relativa, ya que esta influida por la unidad en que se mida la variable, por lo que se define el coeficiente de Asimetra como:

As =

x Mo

Esta medida es muy fcil de calcular, pero menos precisa que el coeficiente de asimetra de Pearson.
El coeficiente de asimetra de Pearson se basa en la comparacin con la media de todos los valores de la variable, as que es
una medida que se basar en las diferencias

x x , como vimos en el caso de la dispersin si medimos la media de esas


i

desviaciones sera nulas, si las elevamos al cuadrado, seran siempre positivas por lo que tampoco serviran, por lo tanto
precisamos elevar esas diferencias al cubo.
Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo tanto relativa, dividimos por el cubo de
su desviacin tpica. Con lo que resulta la siguiente exopresin:

(
xi x) n

As =

i=1

N
3
x

1.5.5 Medida de apuntamiento, Curtosis:


La curtosis es una medida del apuntamiento, que nos indicar si la distribucin es muy apuntada o poco apuntada
Curtosis Negativa
Platicrtica

Curtosis nula
Mesocrtica

Curtosis Positiva
Leptocrtica

D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De


Conceptos Basicos De Estadistica.DOC
Pgina 14 de 15

Bloque 0 Repaso Conceptos Bsicos de Estadstica: Distribuciones Unidimensionales


Como podemos observar, el coeficiente de curtosis nos mide el grado de apuntamiento de la distribucin. Este coeficiente lo
vamos a denotar por K y se calcula segn la siguiente expresin:

(
xi x) n

K=

i=1

N
4

Veamos por ltimo el clculo de estos dos ltimos coeficientes en el ejemplo que estamos estudiando.

L L n N
i 1

45
55
65
75
85

55
65
75
85
95
N=

6
10
19
11
4
50

n x

6
16
35
46
50

50
60
70
80
90

n d
i

n d

300 -19,4 -43808,304


600 -9,4 -8305,84
1330
0,6
4,104
880 10,6 13101,176
360 20,6 34967,264
3470
-4041,6

4
i

849881,098
78074,896
2,4624
138872,466
720325,638
1787156,56

x = 3470 = 69.4
50
Mo= 70.24

.
= 11029
69.4 70.24
= -0,892
As=
11029
.
Coeficiente de Asimetra de 40416
.
50 = -0,06025162
Pearson As=
3
11029
.
1787156.566
50 3 = -0,58431795
K=
4
11029
.
x

Luego es una distribucin asimtrica negativa o a la izquierda y Platicrtica.

D:\Libros digitales y Manuales\Libros-Castellano-Hansi-Libroz-Com-Ar\A\Alvarez J A\ALVAREZ J A - Repaso De


Conceptos Basicos De Estadistica.DOC
Pgina 15 de 15

You might also like