You are on page 1of 30

TEMA 3.

INTRODUCCIN A LA ESTADSTICA DESCRIPTIVA

1. Concepto de estadstica 1.1. 1.2. 1.3. De acuerdo con el fin del anlisis: estadstica descriptiva vs. inferencial De acuerdo con la metodologa aplicada: estadstica paramtrica vs. no paramtrica Segn el nmero de variables que atiende el anlisis: estadstica univariada, bivariada y multivariada

2.

Conceptos bsicos

3. 3.1. 3.2. 3.3.

Preparacin y presentacin de los datos Conceptos bsicos Tipos de presentacin tabular Representacin grfica de los datos

4. 4.1. 4.2. 4.3. 4.4.

Medidas de tendencia central Moda (Mo) Mediana (Md) Media aritmtica ( X ) Comparacin entre la media, la mediana y la moda

5. 5.1. 5.2. 5.3. 5.4.

Medidas de variabilidad y dispersin Amplitud Total (AT) Cuantiles Varianza (s2) y desviacin tpica (s) Coeficiente de variacin (CV)

6. 6.1. 6.2. 6.3.

La curva normal Concepto y caractersticas de la curva normal Concepto de asimetra. Tipos Puntuaciones transformadas

Bibliografa

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

1. CONCEPTO DE ESTADSTICA

La estadstica es la disciplina que intenta sacar conclusiones de estudios empricos mediante la utilizacin de modelos matemticos. Sirve como nexo entre los fenmenos reales y los modelos matemticos.

Existen diversos criterios de clasificacin de los mtodos y tcnicas estadsticas:

1.1. De acuerdo con el fin del anlisis: Estadstica descriptiva vs inferencial

La Estadstica descriptiva tiene como fin describir un conjunto de datos. Es decir, recoge, organiza y sintetiza la informacin.

La Estadstica Inferencial tiene como fin hacer inferencias a partir de una muestra sobre una poblacin. Es decir, cmo se tiene que realizar el proceso de extrapolacin de los resultados.

1.2. De acuerdo con la metodologa aplicada: Estadstica Paramtrica vs Estadstica no Paramtrica

En la Estadstica Paramtrica, que es la ms exigente, las variables son cuantitativas y deben cumplirse tres supuestos paramtricos:

Los datos obtenidos se ajustan a la distribucin normal. Homogeneidad de la varianza (medida de dispersin) entre grupos. Las medidas son, mnimo, de intervalo (ej. CI).

En la Estadstica no Paramtrica se utiliza a partir de escalas nominales u ordinales con variables cualitativas, o bien, cuando no se cumple alguno de los tres supuestos anteriores.

Por lo tanto, es muy importante realizar un anlisis previo de los datos, de qu clase son, cmo se distribuyen y qu tipo de estadsticos se pueden aplicar.

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

1.3. Segn el nmero de variables que atiende el anlisis: Estadstica Univariada, Bivariada y Multivariada.

La Estadstica Univariada incluye todas las tcnicas que hacen referencia a la descripcin e inferencia de una sola variable.

La Estadstica Bivariada incluye todas las tcnicas que hacen referencia a la descripcin de dos variables

La Estadstica Multivariada se utiliza al trabajar con tres o ms variables. Es la ms utilizada en Educacin. Su anlisis se ha facilitado con la aplicacin de programas informticos como el SPSS.

2. CONCEPTOS BSICOS

A) Poblacin: Todo el conjunto de elementos, finito o infinito, que tiene una o varias caractersticas que satisfacen el objeto de estudio de una investigacin. Ej. Universidad de Alicante. Censo: Est directamente relacionado con la poblacin. Es un listado de los elementos que componen una poblacin.

Muestra: Es cualquier subconjunto de una poblacin y, para que sea vlida, ha de ser representativa de la poblacin porque se va a trabajar con ella y las conclusiones se van a extrapolar a la poblacin. Ej. 300 alumnos de la Universidad de Alicante.

B) Parmetro: Es cualquier funcin definida a partir de los valores numricos de una poblacin. Se representan con letras griegas. = media = desviacin tpica

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Estadstico: Es cualquier funcin calculada sobre los valores numricos de una muestra (media, moda, mediana, varianza...). Todos ellos permiten describir en forma simplificada al conjunto de datos obtenidos en la muestra.
X , M = media

S, DT = desviacin tpica

En definitiva, lo que en la investigacin interesa es describir las poblaciones. Pero debido a que suelen ser muy grandes y su conocimiento es costoso, la Estadstica Inferencial se encarga de estimar los parmetros a partir de los correspondientes estadsticos.

3. PREPARACIN Y PRESENTACIN DE DATOS

3.1. Conceptos bsicos

Tabular: Es clasificar la informacin de forma resumida mediante una tabla.

Tabla: Conjunto de clases o modalidades

Clase: Agrupaciones de distintos elementos que siguen un criterio (exhaustivas, excluyentes, definidas).

Frecuencia absoluta (F): nmero de observaciones que aparece en cada clase o modalidad.

Frecuencia relativa (Fr ): es igual al cociente entre las frecuencias absolutas y el nmero total de datos.
Fr = f N

Porcentajes: columnas de las frecuencias relativas multiplicadas por 100. Tiene la misma funcin que las frecuencias relativas.

% = Fr * 100

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

F Bomberos Mdicos Albailes Psicopedagogos 30 20 40 10 100

Fr 03 02 04 01 100

% 30 20 40 10 100%

Frecuencia acumulada (Fa): Indica el nmero de casos comprendidos en un intervalo o por debajo del mismo. La frecuencia acumulada no se puede conocer en variables cualitativas en escala nominal.

CI 121 - 130 111 - 120 101 - 110 91 - 100

F 5 7 9 3

Fa 24 19 12 3

3.2. Tipos de representacin tabular

1. Distribucin categrica Se utiliza con variables cualitativas en escala nominal. Lo nico que puede determinarse con estos datos es la frecuencia de aparicin de sus modalidades (n = 110, 40 son de modalidad 1-hombre- y 70 de la modalidad 2 mujeres-).

ESTUDIOS Alumnos de Psicopedagoga Alumnos de Derecho Alumnos de Magisterio

F 92 41 62 N = 195

Fr 047 021 032

% 47% 21% 32%

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Generalmente, la representacin grfica de este tipo de datos se realiza mediante el diagrama de barras y el ciclograma.

2. Distribucin por rangos: Se puede utilizar para variables cuantitativas o cualitativas en escala ordinal. Consiste en ordenar todos los elementos de la muestra y asignarles un rango u orden (categoras profesionales, curso acadmico, notas de clase).

Para organizar estos datos se utilizan tablas de frecuencias incluyendo las frecuencias, las frecuencias relativas y los porcentajes o frecuencias acumuladas.

Ejemplo 1: En los diez centros de Educacin Primaria de una localidad se han diagnosticado 622 nios/as como superdotados. Se pone en prueba un programa de enriquecimiento para esta muestra. Despus de la aplicacin de dicho tratamiento se pasa una prueba para analizar su eficacia. Los resultados obtenidos nos indican que han conseguido una mejora mxima 134 nios/as, 212 moderada, 129 leve y en 147 sujetos la mejora ha sido nula.

MEJORA Mxima (4) Moderada (3) Leve (2) Nula (1)

F 134 212 129 147 622

Fr 02154 03408 02074 02363 10000

% 2154 3408 2074 2363 10000

Fa 622 488 276 147

Fra 10000 07846 04437 02363

%a 10000 7846 4437 2363

El diagrama de barras es la representacin grfica ms comn para estos datos. En el eje de abcisas (x) deben ser colocadas las clases de manera ordenada y en el eje de ordenadas (y) se colocan las frecuencias.

3. Distribucin con intervalos: Se utiliza cuando tenemos variables cuantitativas tanto discretas como continuas (escala de intervalo y de razn). Las clases que forman la tabla estn definidas numricamente, de ah que se les llame intervalos.

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

a) Conceptos bsicos de las distribuciones de intervalos Intervalo: Distancia entre dos valores. Cualquier intervalo viene definido por dos valores llamados lmites de intervalo. Uno es el lmite inferior y el otro el superior.

Existen dos tipos de lmites:

Aparentes: son aquellos que tenemos en una distribucin cuando existe discontinuidad entre un intervalo y el siguiente.

Reales: aquellos que no presentan discontinuidad entre un intervalo y el siguiente. Se calcula: * El lmite real superior: se toma el lmite aparente superior ms media unidad

de media (+ 05). * El lmite real inferior es igual al lmite aparente inferior menos media unidad de medida (- 05).

Marcas de clase: Es el valor que sirve para representar al intervalo. Es decir, es el punto medio del intervalo y se calcula:

X m= lim. Sup. + lim. Inf. 2

Amplitud del intervalo: Es la cantidad de valores que recoge el intervalo (tamao del intervalo). Hay de dos tipos:

Unitarios: tienen una amplitud de 1 No unitarios: su amplitud es superior a 1

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

X 10 9 8 7 6 5

F 2 2 3 4 5 8 La amplitud en este caso sera 1.

106-110 101-105 96-100 91-95

Clculo: A = Lim. Real sup. lm. Real inferior ................. A = 955 905 = 5

A = Lm. Apar. Sup. lm. Apar. Inf. + 1 .............. A = 95 91 + 1 = 5

Tipos de intervalos

1) Intervalos abiertos: carecen de lmite superior o de lmite inferior 2) Intervalos cerrados: tienen los dos lmites

El inconveniente de los intervalos abiertos es que no podemos calcular las marcas de clase puesto que desconocemos uno de los lmites. Estos se soluciona con otra clasificacin:

1) Intervalos iguales: todos los intervalos presentan la misma amplitud. 2) Intervalos desiguales: cuando los intervalos no tienen la misma amplitud.

111 130 86 - 95

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Construccin de tablas de intervalos

1. Se calcula la amplitud total incluyente o Rango total incluyente, que es la distancia entre el valor mximo y el valor mnimo.

ATi = Pto. Mx. Pto. Mn. + 1 unidad de medida 2. Ver el nmero ptimo de intervalos. La precisin ser mayor cuando mayor sea el nmero de intervalos. Sin embargo, es una decisin del investigador.

Si N es menor a 100 conviene que el nmero de intervalos no exceda del valor de la raz cuadrada de N.

85 = 9219 9. El nmero de intervalos es 9

Si N es mayor que 100 el nmero de intervalos debe oscilar entre 10 y 20

3. Calcular la amplitud del intervalo:

A=

ATi N de intervalos

4. Establecimiento de los lmites, especialmente el lmite aparente inferior que ser el punto mnimo.

Ejemplo: 14,10,13,8,8,7,4,5,14,13,10,11,5,8,9,13,11,11,11,10 1) ATi = 14 4 + 1 = 11 2) N de intervalos aproximado: Aunque 3) A = 11/6 = 183 2 20 = 47 tomaremos 6.

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

4) 14 - 15 12 13 10 11 89 67 4-5 2 3 7 4 1 3 20

Tablas estadsticas mltiples: Son las que se utilizan cuando queremos estudiar la distribucin conjunta de dos o ms variables. Se trata de variables cruzadas y sirve tanto para variables cualitativas como cuantitativas. Ejemplo: V1 = Profesin V2 = Sexo V3 = Edad

Menos de 40 aos Hombres Bombero Astronauta Psicopedagogo Otros 15 7 27 4 Mujeres 3 1 5 14

Ms de 40 aos Hombres 7 5 14 5 Mujeres 1 28 3 9

Para la representacin grfica se puede utilizar el histograma o el polgono de frecuencias.

3.3. Representacin grfica de los datos

Se suele representar siempre mediante coordenadas cartesianas. El eje de abcisas (x) tiene los valores que estamos estudiando y el eje de ordenadas (y) representa las frecuencias.

10

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Diagrama de barras: Es un grfico formado por un conjunto de barras o rectngulos, que se dibujan sobre unos ejes de coordenadas. Cada una de las barras representa una categora y deben estar separadas entre ellas por espacios en blanco. La anchura de las barras es elegida arbitrariamente. Normalmente debe guardar una relacin 3/5, es decir, que si el eje de ordenadas mide 9 cm., el eje de abcisas debe medir 15 cm.

Ciclograma o diagrama de sectores: Est formado por un crculo subdividido en sectores por algunos de sus radios. La superficie o rea de tales sectores ha de ser proporcional a la frecuencia (normalmente porcentajes).

Para el clculo del nmero de grados que ocupa cada sector se aplica una regla de tres:
F 360 (para los datos directos) N

X=

x=

% 360 (para los porcentajes) 100

11

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Histograma: Se trata de una serie de rectngulos que tienen sus bases sobre el eje horizontal, con centros en los puntos medios de los intervalos y anchura igual a la amplitud de los intervalos. En el eje vertical se colocan las frecuencias, proporciones o porcentajes, siempre especificndolo. Si tomamos las frecuencias, proporciones o

porcentajes acumulados se denomina histograma de frecuencias acumuladas..

Polgono de frecuencias: En el caso de que la variable sea continua se suele preferir el polgono de frecuencias. Se construye sobre el histograma y se sitan unos puntos en el centro de la lnea superior de cada uno de los rectngulos. Si se toman las frecuencias, proporciones o porcentajes acumulados, el grfico se denomina polgono de frecuencias

12

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

acumuladas y la lnea que une los distintos intervalos pasa por el lmite superior de cada uno de ellos, en vez de hacer por sus puntos medios. El polgono de frecuencias es una representacin grfica ms sencilla que su correspondiente histograma.

4. MEDIDAS DE TENDENCIA CENTRAL

Los estadsticos de tendencia central buscan un valor que sirva par representar a los sujetos de la muestra.

4.1. Moda (Mo)

Es la categora o valor que se repite ms veces en una distribucin. Es decir, aquel valor que tiene mayor frecuencia. Es la ms imperfecta de las tres medidas de tendencia central.

Ejemplo: 1,1,5,5,6,7,7,7,8,9, ............... Mo = 7

Para determinar la moda es necesario que antes se ordenen y se tabulen los datos, para conocer la frecuencia de cada valor o intervalo. Puede suceder que en algunas distribuciones se encuentre ms de una moda. As, podemos hablar de

13

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Distribucin unimodal Distribucin multimodal Distribucin amodal

2,4,6,6,8,10 ..............Mo = 6 1,1,1,5,6,6,6,7,8,8 ....Mo = 1 2,4,6,8,10 y Mo = 6

Cuando los dos valores que se repiten igual nmero de veces son contiguos, slo habr una moda: Ejemplo: 1,1,5,5,6,6,6,7,7,7 ...................Mo = 6 + 7 = 65 2 En el caso de que la variable medida se agrupe en intervalos, hay que referirse al intervalo modal que es el intervalo que tiene mayor frecuencia. La Mo ser la marca de clase de dicho intervalo. 130 - 136 123 -129 116 - 122 109 - 115 102 - 108 95 - 101 6 5 10 8 9 6

Mo = 119 ............ 116 + 122 / 2 = 119

Puede que en una distribucin haya ms de una moda, pero que no todas tengan la misma altura. La ms alta sera la moda mayor y la/s otra/s sera la moda menor.

14

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Propiedades de la moda

Es un estadstico muy inestable por lo que ser ms conveniente su clculo cuando tengamos muestras grandes. La moda es la nica medida de tendencia central que puede calcularse cuando trabajamos en una escala nominal y otras escalas superiores. En el caso de que haya intervalos, el valor de la moda depender de los intervalos que hayamos formado. Cuando la moda cae en un valor extremo de la distribucin, entonces no puede considerarse representativa de la tendencia central. La moda puede calcularse aunque una distribucin tenga intervalos abiertos, siempre que no caiga en uno de esos intervalos.

4.2. Mediana (Md)

Es la puntuacin central de una serie de datos ordenados; es la puntuacin que deja por debajo el 50% de los datos y tambin por arriba. Es el dato que queda en el centro de la distribucin cuando los datos estn ordenados de menor a mayor. Slo se puede utilizar a partir de escalas ordinales.

Clculo

1 Se calcula la posicin de la Mediana: Posicin = N + 1 2 2 Se busca el valor que ocupa dicha posicin (Md)

Ejemplo: 3,3,5,5,7,7,7

Posicin = N + 1 = 7 + 1 = 4 .................Md = 5 2 2

En el caso en que se trate de un nmero par de datos, se calcula la posicin y despus se realiza la semisuma de las dos puntuaciones ms prximas al centro.

Ejemplo: 3,3,5,5,7,7,7,8

Posicin = 8 + 1 = 45 ............Md = 5 + 7 = 6 2 2

15

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Cuando los datos estn agrupados en una distribucin de frecuencias se utiliza la siguiente frmula:

N 2 F ai Md = Li + A F Donde: Li = lmite real inferior del intervalo en el cual caiga la mediana (1 frecuencia que sea mayor que N / 2). N = nmero total de observaciones Fai = frecuencia acumulada del intervalo anterior a aquel en que cae la mediana. F = frecuencia absoluta del intervalo en el que cae la mediana. A = Tamao del intervalo (amplitud) en el que cae la mediana.

Ejemplo:

INTERVALOS 128 - 134 121 127 114 - 120 107 - 113 100 - 106

F 15 21 23 17 12

Fa 88 73 52 29 12

1) Se calcula la posicin: Posicin = N = 88 = 44 2 2 2) El intervalo es el 114 120 Li = 1135 F = 23


A = 120 114 + 1 = 7 Fai = 29 (del intervalo anterior) F = 23 (del intervalo en el que cae la Md) 44 29 Md = 113,5 + 7 = 118,06 23

16

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Propiedades de la Mediana

Es un estadstico resistente o robusto ya que no se ve afectado por todas las puntuaciones de la serie de datos. Esto tambin quiere decir que no es mximamente eficiente. Es una buena medida de tendencia central cuando tenemos puntuaciones extremas. Es un buen estadstico cuando la distribucin es muy asimtrica porque no se ve tan afectada como la media por valores extremos. La Mediana puede calcularse aunque existan intervalos abiertos, siempre que no caiga en uno de esos intervalos. Depende de la distribucin de frecuencias. Si tenemos varias distribuciones, cada una con su Md, la Mediana de la distribucin total ser mayor o igual que la Md menor, y menor o igual que la Md mxima.

Es decir: Mdmenor Mdtotal Mdmayor Ejemplo: A = 7,7,8 ...........MdA = 7 B = 5,6,6,7,7 .....MdB = 6 C = 1,1,2,3,4 .....MdC = 2 1,1,2,3,4,5,6,6,7,7,7,7,8 ...................... Posicin = 13 + 1 = 7 .......... Md = 6 2 Debido a que la Md es una posicin, se deben ordenar los datos antes de llevar a cabo cualquier clculo. Esto implica consumo de tiempo para cualquier conjunto de datos que contenga un gran nmero de elementos (intervalos o medidas directas). Por consiguiente, si se desea utilizar una medida de tendencia central en tales casos, es ms sencillo usar la media. 2 MdTOTAL = 6 7

17

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

4.3. Media aritmtica ( X )

Es la ms utilizada tradicionalmente en las ciencias porque es muy eficiente. Capta la variacin de cada una de las puntuaciones. La media aritmtica de la muestra se representa con x , mientras que la media aritmtica de la poblacin se representa con la .

Cculo

En el caso de datos no agrupados en intervalos o puntuaciones directas:


xi (cuando la frecuencia de xi = 1) N xi Fi N

X=

x=

Xi 35 30 25 20 15 10 5
=

F 2 3 5 7 9 5 3 34

Fa 34 32 29 24 17 8 3

Xi Fi 70 90 125 140 135 50 15 625

x=

xi Fi 625 = = 18,38 N 34

En el caso de datos agrupados en intervalos:


( xm Fi ) N

X=

Donde: = Sumatorio xi = puntuaciones

18

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Fi = frecuencia de cada puntuacin N = n de observaciones de la muestra Xm = marca de clase de cada intervalo Ejemplo:

xi
15 25 25 45 45 - 75 =

F
378 324 108 810

xm
20 35 60

Xm Fi
7560 11340 6480 25380

X=

( xm Fi ) 25.380 = = = 3133 N 810

Propiedades de la media aritmtica

Se puede decir que la media, en trminos fsicos, es el centro de gravedad de la distribucin. Es un estadstico mximamente eficiente y mnimamente robusto. No es un buen estadstico de tendencia central cuando en la distribucin hay valores extremos o cuando es muy asimtrica. Cada conjunto tiene una y slo una media. Si multiplicamos o dividimos todas las puntuaciones de una serie de datos por una constante, la x de las nuevas puntuaciones ser igual a la x de las antiguas por o dividido por la constante.
y = c x

Ej. x = 7,3,2,4 ............ x = 4 c=2 y = 14,6,4,8 ............... y = 2 4 = 8

Si sumamos o restamos una constante a todas las puntuaciones de una distribucin, la x de los nuevos datos ser igual a la x original ms o menos la constante.

19

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

y = x+c

Ej. x = 7,3,2,4 ........... x = 4 c=2 y = 9,5,4,6 ........... y = 4 + 2 = 6

Estas dos propiedades se pueden sintetizar de la siguiente manera:


y = Ax + B

4.4. Comparacin entre la media, mediana y la moda

En las distribuciones simtricas

Slo contienen una moda. Tienen el mismo valor para la x , Md y Mo La Mo se encuentra en el punto ms alto de la distribucin,

En una distribucin positivamente sesgada (hacia la derecha)

la Md est hacia la derecha de la Mo y la x se encuentra ms a la derecha de las dos anteriores. La Md resulta ser la mejor medida de posicin, ya que siempre est entre la moda y la media.

En una distribucin negativamente sesgada (hacia la izquierda)

La Mo sigue siendo el punto ms alto. La Md est hacia la izquierda de aqulla y la media ms a la izquierda de la moda y la mediana. La Md resulta ser la mejor medida de posicin, debido a que siempre est entre la moda y la media. La mediana no se ve influenciada por la frecuencia de aparicin de un solo valor, como la Mo, ni se distorsiona con la presencia de valores extremos como la media.

- Distribucin simtrica: Mo = Md = x - Distribucin asimtrica positiva: Mo < Md < x - Distribucin asimtrica negativa: Mo > Md > x

20

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

5. MEDIDAS DE VARIABILIDAD O DISPERSIN

Los estadsticos de variabilidad son los que nos permiten tener una idea de la dispersin de los datos respecto a algn valor promedio. Se refiere a la extensin de los datos de una distribucin.

5.1. Amplitud Total (AT)

Es la primera aproximacin que podemos hacer para calcular la variabilidad de los datos. Consiste en la distancia entre el valor mximo y el mnimo. Es, adems, el ms inexacto.

En el caso de datos originales: Amplitud total excluyente: ATE = Punt. Mx. Punt. Mn. (una de las dos puntuaciones no est incluida) Amplitud total incluyente: ATI = Punt. Mx. Punt. Mn. + 1

21

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Ejemplo: x = 2,5,7,4,2,1,3,10,9,11,12,9 ATE = 12 1 = 11 ATI = 12 1 + 1 = 12 En el caso de intervalos:

Amplitud total excluyente (ATE) es igual a los datos originales Amplitud total incluyente: ATI = Punt. Mx. Punt. Mn. + Amplitud del intervalo ATI = Lm real sup. Lim real inf. (intervalo mx.) (intervalo mn.) Ejemplo:

i
10 12 79 46 1-3

F
4 7 10 8

xi
11 8 5 2

ATE = 11 2 = 9 ATI = 11 2 + 3 = 12 ATi = 125 05 = 12

5.2. Los Cuantiles (medidas de posicin)

Nos indican la posicin relativa que ocupa una determinada puntuacin de la cual sabemos el porcentaje de casos que deja por arriba y por abajo. Existen diversos tipos:

Cuartiles (Q)
Son las puntuaciones que dividen a una distribucin en cuatro partes iguales: Q1 = Es el que deja por debajo de s una cuarta parte de las puntuaciones, y por encima las tres cuartas partes restantes. Es decir, deja por debajo el 25% y por encima el 75% de las observaciones. Q2 = Se encuentra en el punto medio, dejando por debajo el 50% de los datos y por encima el otro 50%. Q3 = Deja el 75 % de las observaciones por debajo, y el 25% por encima.

22

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Q4 = Deja el 100% de los datos por debajo. Este cuartil no se suele utilizar.

Deciles (D)
Dividen el conjunto de datos en diez partes iguales. De esta manera, D1 = Dejara el 10% o 1/10 parte de los datos por debajo y el 90% por encima. D5 = Deja el 50% de las observaciones tanto por debajo como por encima. Y as sucesivamente.

Percentiles (P) o Centiles (C)


Son los cuantiles que dividen el conjunto de datos en cien partes iguales, cada una de ellas con el 1% de los datos. Por ejemplo, el P33 dejara por debajo el 33% de los datos. Los cuartiles y los deciles son equivalentes a los percentiles. Por ejemplo: 30% = P30 = D3 ; 75% = P75 = Q3 ; 50% = P50 = Q2 = D5 = Md Pasos para el clculo de los percentiles:

1)

pn =

p N 100

donde p es la posicin del percentil que queremos conocer.

P60p=60

23

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

2) Pp = Li + ( pn - Fai ) A F 5.3. La Varianza (s2) y la desviacin tpica (s)

La idea para su construccin surge de cuantificar las distancias, y por tanto la variabilidad, entre los valores de la variable a travs de su diferencia respecto de una medida central como es la media.

Varianza = s 2 =

( x x) 2 N

Debido a que las unidades de la varianza son las de la variable pero al cuadrado, se define la desviacin tpica o estndar como la raz cuadrada de la varianza. Desviacin tpica = s =
( x x) 2 F N

s = s2

Cuando trabajemos con intervalos x = la marca de clase de cada intervalo. Cuando la varianza y la desviacin tpica hacen referencia a la poblacin los parmetros que se utilizan son 2 para la varianza y para la desviacin tpica.

i
25 27 22 24 19 21 16 18 13 - 15 10 - 12

F
3 5 10 8 4 2 32

xi
26 23 20 17 14 11

xi F
78 115 200 136 56 22 607

(x x)2 F
147 80 10 32 100 128 497

x = 607 / 32 = 18,9 19 s 2 = 497 / 32 = 15,53 s = 15,53 = 3,94

24

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

Propiedades de la varianza y la desviacin tpica

0 sera la variabilidad mnima, no podemos encontrar variabilidad negativa. No hay un valor mximo, por ello no es fcil de interpretar. Lo que se hace son comparaciones entre distribuciones, en estados de variabilidad. Como se basan en el clculo de la media son mximamente eficientes, pero se ven afectados por todas las puntuaciones de la distribucin. Su clculo es adecuado cuando lo es la media como medida de tendencia central. La s viene expresada en las mismas unidades que los datos, mientras que la s2 en unidades cuadrticas.

5.4. Coeficiente de variacin (CV)

Es un indicador de la variabilidad relativa de los datos. Se trata de un porcentaje que afirma la mayor o menor variabilidad de los datos. Es decir, lo que pretende medir es el porcentaje de variabilidad respecto al total, lo cual permite comparar datos.

s CV = 100 x

A partir del ejemplo anterior: CV =

3,94 100 = 20,73% 19

Propiedades del coeficiente de variacin

En sentido estricto slo puede explicarse cuando trabajamos en escala de razn. A nivel prctico tambin en la de intervalos. Se trata de un valor abstracto; no tiene unidades de medida. No es una buena medida cuando x = 0 o un valor prximo a 0.

5.5. Estadsticos de variabilidad y escalas de medida E. Nominal AT E. Ordinal AT Q E. Intervalos AT Q s s2 E. Razn AT Q s s2 CV

25

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

6. LA CURVA NORMAL 6.1. Concepto y caractersticas de la curva normal


Existen diferentes tipos de distribuciones, aunque la ms utilizada es la

distribucin normal o gaussiana, ya que la mayora de los eventos de la naturaleza se


distribuyen de esa forma. Fue desarrollada por Gauss, de ah que se la conozca como curva normal o campana de Gauss.

Propiedades
Todas las distribuciones normales son simtricas por la media y, cuando tenemos un curva normal perfecta, coincide con la mediana y la moda:
x = Md = Mo . La media se situara en el centro de la curva.

Tienen dos puntos de inflexin en x s : el punto donde la curva pasa de ser cncava a ser convexa. Entre la x 1s se encuentran el 6826% de los datos, entre la x 2 s el 9544%, y entre la x 3s estn el 9974% de las puntuaciones. La curva tiene un solo pico, es decir es unimodal. Tiene forma de campana.

Ventajas y utilidad
En las variables que tienen en la poblacin una distribucin gaussiana o normal se puede predecir su comportamiento en la poblacin. Es decir, desde los valores de la muestra se pueden inferir los resultados para la poblacin, ya que el

26

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

modelo gaussiano permite aplicar teoremas matemticos que facilitan estas inferencias. A partir de un punto o valor en el eje de abcisas, se puede calcular la proporcin de valores que quedan por debajo o por encima. Dado que los valores o puntuaciones directas se pueden convertir en puntuaciones tpicas, algunos autores han elaborado tablas que determinan tales proporciones a partir de un punto de la curva normal.

6.2. Concepto de asimetra. Tipos

Se dice que una distribucin es simtrica si al dividir en dos partes, con igual superficie, mediante la Md, una parte es imagen de la otra. Una distribucin ser

asimtrica cuando presenta algn sesgo.

Tipos de asimetra
Positiva: cuando presenta un sesgo positivo, es decir, hacia la derecha. Negativa: cuando el sesgo es negativo, es decir, hacia la izquierda.

Como se coment anteriormente: En una distribucin simtrica: Mo = Md = x En una distribucin asimtrica positiva: Mo < Md < x En una distribucin asimtrica negativa: Mo > Md > x

6.3. Puntuaciones transformadas

En ocasiones, no podemos comparar varias muestras utilizando estadsticos de posicin como los percentiles o los cuartiles. Los percentiles se caracterizan por ser una escala ordinal siendo poco tiles a la hora de hacer clculos estadsticos. Para ello, es
27

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

conveniente transformar los datos en otro tipo de puntuaciones en escala de intervalo, como son las puntuaciones tpicas.

Puntuaciones directas (X, Y, Z)


Se obtienen directamente cuando hacemos una medicin. Se simbolizan con las letras latinas maysculas. Este tipo de puntuaciones por s solas aportan poca informacin. Para conocer el significado de una puntuacin hay que ponerla en relacin con el resto de puntuaciones. En esto consisten las puntuaciones diferenciales.

Puntuaciones diferenciales o desviadas (x, y,..)


Se obtienen a partir de la diferencia entre las puntuaciones directas y la x :
x = X X . Se simbolizan con letras latinas en minsculas.

Caractersticas: x = 0 .............. ( x x) = 0

La x = 0 ............. f / N = 0 La sx = s X Las puntuaciones positivas indican valores directos mayores a la media. Las puntuaciones negativas indican valores directos menores a la media. Las unidades de la nueva escala son unidades de medida de desviacin.

Las puntuaciones diferenciales aportan informacin de las puntuaciones con respecto a la media, pero no aportan informacin sobre la magnitud de esa diferencia, de manera que no son comparables entre s las puntuaciones diferenciales entre distintas muestras.

Puntuaciones tpicas (z)

Las puntuaciones z o tpicas comparan las diferencias con la desviacin tpica. Expresan el nmero de desviaciones tpicas que un determinado valor se desva de la media y la direccin de esa desviacin. Tiene en cuenta no slo la media sino la variabilidad del grupo. Se obtiene de la siguiente manera:

28

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

z=

x X X = Sx Sx

A la transformacin de las puntuaciones directas en puntuaciones tpicas se le llama tipificacin de la variable. Este tipo de puntuaciones permite llevar a cabo comparaciones entre grupos o muestras diferentes.

Caractersticas:

z =

x 1 .......................... x = 0...................... z = 0 s s La media de z es igual a 0 ............... z = 0 ( z z ) 2 = N z 2 = N

z 2 = N ........................................... z 2 F = N S Z = 1.............................................. s z =
Ejemplo: Xi = 90
X = 70 z= 90 70 20 = =2 10 10

N =1 N

S = 10 La puntuacin directa 90 est 2 desviaciones tpicas por encima de la media. Si fuera una valor negativo estara por debajo de la media.

Para conocer el porcentaje de sujetos que se quedaran por encima o por debajo de una determinada puntuacin, se utilizan unas tablas para distribuciones normales, en las que, una vez conocida la puntuacin z, podemos conocer el porcentaje (fotocopia).

En el ejemplo anterior y tras consultar la tabla sabremos que si:

z=2

P (z < 2) = 0.9772 El 97.72% de los sujetos quedaran por debajo de la

puntuacin 90. Es decir, habran obtenido una puntuacin inferior a 90.

29

Tema 3. Introduccin a la estadstica descriptiva

Prof. Esther Chiner

BIBLIOGRAFIA
Amn, J. (1999): Estadstica para psiclogos I. Estadstica descriptiva. Madrid, Espaa: Pirmide. Botella, J., Len, O. G., San Martn, R. y Barriopedro, M. I. (2001). Anlisis de datos en psicologa I. Teora y ejercicios. Madrid, Espaa: Pirmide. Prez Juste, R., Garca Llamas, J. L., Gil Pascual, J. A. y Galn Gonzlez, A. (2009). Estadstica aplicada a la educacin. Madrid, Espaa: UNED/Pearson-Prentice Hall. Selva, J., Cervera, T., Das, C., Ruiz, J. C. y Meli, J. L. (1991). Problemas de psicoestadstica descriptiva. Valencia, Espaa: Cristbal Serrano.

30

You might also like