You are on page 1of 14

1.

- ESTADSTICA DESCRIPTIVA
II.

El pensamiento estadstico ser un dia tan necesario para el ciudadano como la capacidad de leer o escribir.

H.G. Wells 1.-Fenmenos aleatorios y determinsticos

1.1.-Introduccin. Qu es la Estadstica Descriptiva?


Que es la estadstica ? . La palabra estadstica se emplea con dos significados distintos : a) Estadsticas ( en plural ) selecciones de datos numricos presentados en forma esquemtica y ordenada. b) Estadstica como ciencia. Para el alumno la estadstica debe tener el significado de la opcin b) y desde este punto podemos dar la definicin de estadstica como: " la ciencia que estudia la tcnica o mtodo que se sigue para recoger, organizar, resumir, representar, analizar, generalizar y predecir resultados de las observaciones de fenmenos aleatorios. " Partes de la estadstica, en esquema: DESCRIPTIVA : Encuestas. Organizacin datos. Tabulacin. Representaciones. Clculo de parmetros. Interpretacin de resultados. Conclusiones y predicciones.

ESTADISTICA INFERENCIAL :

1.2.-Fenmenos aleatorios y determinsticos. Ejemplos


Decimos que un fenmeno o experimento es aleatorio si rene las siguientes caractersticas: a) Podemos realizarlo el nmero de veces que deseemos sin alterar las condiciones del experimento. b) No se puede predecir el resultado.
IV: Estadstica Descriptiva

Ejemplos: lanzar una moneda al aire, un dado, extraer una carta de la baraja, hallar el nmero de tornillos defectuosos entre 10 elegidos al azar en una caja. Si no cumple alguna de las condiciones establecidas, estamos ante un fenmeno o experimento determinstico. Son ejemplos de este tipo: tirar una piedra al vaco y medir su aceleracin. Se caracteriza por que podemos preveer su resultado, en contra de los fenmenos aleatorios. Los fenmenos que estudia la estadstica son los aleatorios. Otros conceptos como poblacin estadstica, unidad estadstica, muestra, tamao muestral, son estudiados con ms profundidad en Mtodos Estadsticos.

2.-Variable estadstica monodimensional: tipos

2.1.-Variable estadstica. Definicin y ejemplos.


Consideramos un experimento o muestra de una poblacin cualquiera y realizamos 'n' pruebas o 'n' observaciones, de esta forma obtenemos un conjunto de observaciones que llamaremos muestra aleatoria de tamao 'n'. Los valores o cualidades que representan los 'n' resultados de las 'n' pruebas realizadas le llamaremos variable estadstica.

2.2.-Clasificacion de las variables estadsticas: cualitativas y cuantitativas (discretas y continuas).


Hemos visto que un carcter estadstico es una propiedad que permite clasificar a los individuos de la poblacin. Hay dos tipos: a) Caracteres estadsticos cuantitativos: Se dice que un carcter estadstico es cuantitativo cuando sus modalidades son medibles (expresables como nmeros y cumpliendo unas propiedades de medida.). Ejemplos: peso, talla, pulso, edad, etc. b) Caracteres estadsticos cualitativos: Se dice que un carcter estadstico es cualitativo cuando sus modalidades no pueden ser medidas. Ejemplos: raza, sexo, profesin, estado civil, etc.
Nota: Es evidente , por ejemplo, que si el carcter es el estado civil, podiamos asignarle a sus modalidades los siguientes nmeros:a los casados 1 , solteros 0 , viudos un 2, etc, pero este carcter no es medible en el sentido de que el 1>0 por ejemplo , expresin que no tiene sentido.

Ejemplos: La profesin es un carcter cualitativo. Dentro de el podemos tener modalidades: profesor, pen, abogado, etc.

IV: Estadstica Descriptiva

Lo anterior determina un atributo que puede ser observado pero no medido. Podemos contar el nmero de abogados o profesores, pero no medirlos. En cambio, un carcter cuantitativo determina una variable que llamaremos variable estadstica. Atributos : se le suele llamar a las variables cualitativas. La talla es un carcter cuantitativo. Es por lo tanto una variable estadstica que podemos medir, puede tomar diversos valores: 1.60 , 1.62 , ......., 1.92 , ....etc . Las variables estadisticas cuantitativas pueden ser: continuas o discretas. Variable estadstica Discreta: es aquella que solo puede tomar un nmero finito o infinito numerable de valores. Dicho con otras palabras: cuando no puede tomar cualquier valor entre dos valores dados. O bien solo toma valores aislados, generalmente enteros. Ejemplo: el nmero de libros en una estanteria, las tiradas de un dado, el nmero de ptalos de una flor, etc. Continua : cuando puede tomar, al menos tericamente, todos los valores posibles dentro de un cierto intervalo de la recta real. Ejemplo: la temperatura de los enfermos entre 35 y 40 grados, aunque en la prctica sea imposible medir temperaturas aproximando hasta la cuarta o quinta cifra decimal. En la prctica son variables estadsticas continuas aquellas que fijamos como suceso elemental las que entren en un intervalo.
+QDiscretas +QCUANTITATIVAS)1 * .QContinuas )))1 * .QCUALITATIVAS (=atributos)

VARIABLE ESTADSTICA

3.-Tablas De Frecuencias. Representaciones Graficas.

3.1.-Frecuencia absoluta y relativa. Frecuencias acumuladas


Nota sobre la notacin con sumatorios: cuando tenemos una serie de sumas podemos utilizar el signo abreviar la notacin:

para

IV: Estadstica Descriptiva

Si realizamos un experimento o tenemos una muestra de de tamao n, que tiene por variable estadstica xi y el valor de una de las variables es n', o el suceso ha ocurrido n' veces, entonces: Llamamos frecuencia absoluta del valor xi al nmero de veces que se repite dicho valor (n') fr. abs (xi)= fi =n' frecuencia absoluta acumulada del valor xi a la suma de las frecuencias absolutas de todos los valores anteriores a xi ms la fr. absoluta de xi.

Llamamos: frecuencia relativa del valor xi al cociente entre el nmero de veces que se repite xi (frecuencia absoluta) y el nmero de pruebas realizadas (n'/n). Fr. rel (xi)= hi =n'/n frecuencia relativa acumulada del valor xi a la suma de las frecuencias relativas de todos los valores anteriores a xi ms la fr. relativa de xi.

3.2.-Tabla de la distribucin de frecuencias.


Llamamos Distribucin de frecuencias absolutas a la aplicacin que asocia a cada valor de la variable estadistica su frecuencia absoluta. Anlogamente sera para frecuencias relativas. Tablas estadsticas a una presentacin en forma de tabla de la distribucin de frecuencias absolutas, que suele ir acompaado de las frecuencias relativas. Este primer ejemplo es una tabla estadistica simple.

IV: Estadstica Descriptiva

Una tabla estadstica simple es la siguiente: Not xi 0 1 2 3 4 5 6 7 8 9 10 F.abso.fi F.Relat. hi 1 2 1 4 6 15 4 3 2 1 1 40 0,03

Tabla estadisticas acumulativas La tabla la podemos hacer con las frecuencias acumuladas, tanto relativas como absolutas Var. Fr. absolutas Fr. Relativas hi Acumula Hi 0,00

Nota F.abso xi fi 0 1 2 3 4 5 6 7 8 9 10 1 2 1 4 6 15 4 3 2 1 1

Acumlad F. rel. Fi 0,03 0,00

40 40 1 1 Ejemplo 3.2.1: de variable aleatoria continua y con los intervalos de igual tamao Experimento: Muchas personas experimentan reacciones alrgicas a las picaduras de insectos. Estas reacciones difieren de paciente a paciente, no solo en la gravedad sino tambin en el tiempo de aparacin de la reaccin. En 40 personas se han obtenido los siguientes resultados: 10'5 11'2 9'9 15'0 11'4 12'7 16'5 10'1
IV: Estadstica Descriptiva

12'7 11'4 11'6 6'2 7'9 8'3 10'9 8'1 3'8 10'5 11'7 8'4 12'5 11'2 9'1 10'4 9'1 13'4 12'3 5'9 11'4 8'8 7'4 8'6 13'6 14'7 11'5 11'5 10'9 9'8 12'9 9'9 Es una variable estadstica continua, porque entre el mnimo tiempo de reaccin en minutos (3'8) y el mximo (16'5) pueden darse todos los minutos. Como veremos ms adelante, tomamos 6 intervalos y por redondeo comenzomos en 3'75 en intervalos de 2'2, hasta 16'95.

Var. Nota xi [ 3'75, 5'95) [ 5'95, 8'15) [ 8'15,10'35) [10'35,12'55) [12'55,14'75) [14'75,16'95]

Fr. absolutas F.abso fi 2 4 10 16 6 2 40

Fr. Relativas hi Acumula Hi 0,00

Acumlad F. rel. Fi 0,05 0,00

AAproximadamente qu porcentaje de pacientes han experimentado una reaccin cuando han


transcurrido diez minutos? AEn que intervalo se ha presentado la reaccin en la mitad de los pacientes?. AQu representa las frecuencias acumuladas?

3.3.-Representacin grfica de las frecuencias.


Aun cuando las tablas estadsticas que hemos visto encierran toda la informacin, a veces es conveniente traducir esta informacin mediante la construccin de grficos con el fin de hacerlos ms expresivos. Los grficos ms habituales son los siguientes, que utilizaremos en un caso u otro, as como pueden hacerse con frecuencias absolutas o con frecuencias relativas Diagramas de barras o bastones Diagramas lineales Poligono de frecuencias Una combinacin de los dos anteriores, de manera que se determinan poligonos (trapecios) con la altura de las frecuencias. Hoy con los ordenadores pueden presentarse con aspecto de tres dimensiones, como se ve en la figura.

IV: Estadstica Descriptiva

Histogramas Utilizado sobre todo para distribuciones de variable estadistica continua, donde dividimos en intervalos generalmente de igual amplitud. Si hacemos de distinta amplitud hemos de cuidar en el diagrama que tengan la misma rea los rectangulos determinados. Si representa a una variable discreta, como es este caso, es conveniente que los rectangulos no estn 'pegados'. Histograma

Diagrama de sectores Consiste en representar, mediante sectores circulares, las distintas modalidades de un carcter, teniendo en cuenta que los sectores han de tener un ngulo central proporcional a la frecuencia absoluta correspondiente. En consecuencia, el rea del sector circular ser proporiconal a la frecuencia absoluta. D. de Sectores

Grficos con las tablas acumuladas

IV: Estadstica Descriptiva

4.-Medidas caracteristicas Tenemos la representacin en forma de tabla de una distribucin de frecuencias, hemos visto alguna de sus representaciones grficas ms caracteristicas, pero todavia no es suficiente. Por un lado las tablas pueden ser muy costosas para su interpretacin y no resumen adecuadamente la informacin. Por otro lado, es dificil comparar dos distribuciones distintas. Por otro lado con las graficas pueden hacerse distorsiones y manipulaciones en: -Alteracin de las escalas. -Inicio de las escalas -Mantenimiento de la proporcionalidad de lineas. Utilizaremos dos tipos de medidas, que llamaremos caractersticas. =Unas de medidas son para medir los valores centrales (medidas centrales). =Otras nos darn valores de cuan dispersos estn los datos respecto de los valores centrales (medidas de dispersin) =Y por ltimo, otra para poder comparar distintas distribuciones entre s.

MEDIDAS CARACTERSTICAS
MEDIDAS DE CENTRALIZACION De tamao : Media aritmtica MEDIDAS DE DISPERSION Recorrido Desviacin Media Varianza Desviacin Tpica. MEDIDA PARA COMPARAR DISTRIBUCIONES Coeficiente de variacin de Pearson

De posicin: Mediana. De frecuencia :Moda

Objetivo perseguido con las medidas : resumir y sintetizar un conjunto de datos mediante un nico nmero o unos pocos.

4.1.-Medidas de centralizacion
Se llaman Medidas de centralizacin a los valores que tienden a situarse en el centro del conjunto de datos ordenados respecto a su magnitud. Las medidas centrales ms importantes son: Media aritmtica, Mediana, Moda.

IV: Estadstica Descriptiva

Sea X una variable estadstica discreta que toma los valores: x1, x2, x3,.., xn con frecuencias absolutas f1, f2, f3,.., fn se llama media aritmtica o simplemente media:

se puede operar para transformar a travs de las frecuencias relativas. Expresin mediante sumatorios:

Ejemplo: en el de notas _ 1@0+2@1+....+9@1+10@1 x = ))))))))))))))))))))))))) = 4.875 40 Ventajas e inconvenientes de la Media Aritmtica: Ventajas: -El clculo se realiza con todos los valores de la variable. -Tiene un clculo sencillo, que aportan las calculadores actuales. -Su resultado es nico. Inconvenientes: -Los efectos que sobre ella producen los valores extremos, que muchas veces son poco significativos por su rareza. La insuficiencia de la media se ve el ejemplo siguiente: Ejemplo : Salarios de las 11 personas de una empresa. Frecuencia :n Sueldos

50.000 pts/ mes 70.000 2 75.000 85.000 3 90.000 1.000.000 1 2 2 1 Salario medio = 157.727 pts/ mes Ntese lo engaoso del resultado.

IV: Estadstica Descriptiva

MEDIANA Se llama mediana de una variable estadstica, y se representa por Me, a un valor de la variable, tal que existen igual nmero de observaciones mayores que menores de Me. Es decir, el nmero de datos que preceden a la media es igual al nmero de datos que le siguen, por lo tanto, es el valor central en caso de que el nmero de valores a tomar sea impar, o los dos centrales si son pares. Ejemplo: Hacemos las frecuencias acumuladas
+)))))))0))))))))))))))0))))))))))))), * Notas * Fr. absolutas*Fr. acumulada* * xi * fi * Fi * /)))))))3))))))))))))))3)))))))))))))1 * 0 * 1 * 1 * * 1 * 2 * 3 * * 2 * 1 * 4 * * 3 * 4 * 8 * * 4 * 6 * 14 < 20 * * 5 * 15 * 29 > 20 * * 6 * 4 * 33 * * 7 * 3 * 36 * * 8 * 2 * 38 * * 9 * 1 * 39 * * 1 * 1 * 40 * .)))))))3))))))))))))))3)))))))))))))1 * 40 * * .))))))))))))))2)))))))))))))-

Si no son valores simples, como en este caso, se procede a ordenar los dados como si fuera:: 0,1,1,2.... , es decir poniendo todos los datos seguidos. La mediana ser el valor central, para calcularlo haremos las frecuencias acumuladas. El valor central ser: 20=40/2. Tomamos como mediana aquella que tenga como frecuencia acumulada mayor a 20 y ms proximo. En nuestro caso es el 5. Me=5 Ventajas y usos de la mediana: La mediana se utiliza especialmente en los siguientes casos: -Cuando se vea que los valores extremos son excepcionales. -Cuando los datos estn agrupados en clases y las clases extremas son ( al menos una de ellas) abiertas.

LA MODA Se llama moda de una distribucin de frecuencias, y representamos por Mo, al valor de la variable estadstica que presenta mayor frecuencia. Es por tanto, el valor que ms se repite. Ejemplo: En nuestro caso ser el 5 pues se repite 15 veces. Ventajas e inconvenientes de la moda:
IV: Estadstica Descriptiva

Evidentemente este parmetro no es tan representativo como la media, pero es til en muchas ocasiones. Por ejemplo cuando la moda se destaca preferentemente. En geografa puede ser la expresin de un estructura determinada, caracterizar una regin, al darnos de un clima dominante , etc. Por otro lado es el nico valor cantral que puede calcularse en las series nominales. Ejemplo : En un grupo se procede a la eleccin del cargo X al que lleve el mximo nmero de votos: La eleccin resulta asi: Personas a elegir: Juan Prez Maria Lpez Carmen Vazquez Nmero de votos: 10 20 5

Aqu en este ejemplo unicamente tendra sentido calcular la moda.

4.2.-Medidas de dispersin
Las medidas dispersin ms importantes son: Recorrido, deviacin media, varianza y desviacin tpica. Las medidas centrales de una distribucin nos hablan de como es por los valores medios, puediendo haber dos distribuciones muy distintas que tengan valores medios similares. Queda pues la investigacin incompleta, siendo necesario conocer en qu medida los datos nmerico estn agrupados o no alrededor de los valores centrales Ejemplo en donde el alumno puede observar la necesidad de las medidas de dispersin: Al.<------Notas -------> x y 9 6 2 5 3 6 0 4 4 4 8 5 2 4 8 2

Nota Media de X =4.5 Y= 4.5 RECORRIDO Se llama recorrido o rango de una distribucin a la diferencia entre el mayor y el menor valor de la varible estadstica. Ejemplo: En el ejemplo que seguimos desde el principio de notas el recorrido=10-0=10
IV: Estadstica Descriptiva

En el ejemplo de la ltima tabla, el recorrido de x es 9 el recorrido de y es 4 . Creemos que resulta significativo.

DESVIACIN MEDIA Se llama desviacin media de una distribucin de frecuencias, y se representa por Dx a la media aritmtica de las desviaciones respecto de la media tomadas en valor absoluto: En el caso de que los valores estn repetidos y aparezcan sus frecuencias correspondientes, la expresin de la desviacin media es la siguiente:

frmula que usaremos en la construccin de las tablas Ejemplo: 1@*0-4'87*+2@*1-4'87*+....+1@*9-4'87*+1@*10-4'87* Dx = ))))))))))))))))))))))))))))))))))))))))))))))))))) 40 Inconvenientes de la Desviac. media : sin lugar a dudas el uso de los valores absolutos (que complica bastante los clculos) VARIANZA Se llama varianza de una distribucin de frecuencias y se representa por aritmtica de los cuadrados de las desviaciones respecto a la media.

F, a la media

En el caso de que los valores estn repetidos y aparezcan sus frecuencias correspondientes, la expresin de la varianza es la siguiente:

frmula que usaremos en la construccin de las tablas Consideraciones sobre la varianza: 1: La varianza es siempre un nmero positivo, por tratarse de la media aritmtica de
IV: Estadstica Descriptiva

nmeros positivos. 2: Cuanto mayor es la dispersin le corresponde mayor varianza, y, en consecuencia, menor es la representatividad de los valores centrales. 3: La varianza depende de todos los valores de la variable. La expresin de la varianza mediante operaciones obtenemos la siguiente, que resulta ms facil para el clculo.

Ejemplo: 1@(0-4'87)+2@(1-4'87)+....+1@(9-4'87)+1@(10-4'87) F= ----------------------------------------------------------------------- = 40 Inconvenientes de la varianza: El inconveniente principal es que utiliza unas medidas distintas a las que tratamos en la variable. Al estar elevado al cuadrado perdemos referencia respecto a las variables. DESVIACIN TIPICA Llamamos desviacin tpica de una distribucin de frecuencias y representamos por F a la raiz cuadrada positiva de la varianza. Sus expresiones segn los casos es la siguiente:

frmula que usaremos en la construccin de las tablas

Ejemplo: S = /S = 2.01 Otras ventajas de la desviacin tpica: Es interesante saber que as como para calcular la desviacin tpica hemos elegido la
IV: Estadstica Descriptiva

media, si se tomase otro valor, como por ejemplo la moda, la mediana , o un valor m cualquiera puede desmostrarse que la media aritmtica es el valor que hace mnima la expresin. Dicho con otras palabras , de todas "las posibles desviaciones tpicas escogidas" F es la mnima.
En el estudio de la estadstica inferencial, veremos tambien la importancia que tiene la desviacin tpica en las distribuciones normales.

COEFICIENTE DE VARIACION

El coeficiente de variacin (de Pearson) Cv=des.tip/media

No tiene unidades y se utiliza para comparar distribuciones con distintas medidas. Por ejemplo tallas y pesos. Suele expresarse en %. Tambien se utiliza cuando al comparar dos distribuciones sobre la misma variable estn medidas en distintas unidades, por ejemplo en m y Km. En definitiva, que nos mide la dispersin relativa de una distribucin. Ejemplo: con unas notas notas 1: =4'5 3'16 ==> Cv=)))))) = 0'70-->70% 4'5 1'2 ==> Cv=)))))) = 0'26-->26% 4'5

F=3'16

notas 2:

=4'5

F=1'2

Ventajas Permite comparar distribuciones distintas, incluso con medidas distintas. Desventajas Deja de ser representativa y no debe utilizarse cuando la media de una de las distribuciones sea muy baja.

IV: Estadstica Descriptiva

You might also like