You are on page 1of 7

La estadística descriptiva es una ciencia que analiza series de datos

(por ejemplo, edad de una población, altura de los estudiantes de una


escuela, temperatura en los meses de verano, etc) y trata de extraer
conclusiones sobre el comportamiento de estas variables.

Individuo: cualquier elemento que porte información sobre el fenómeno


que se estudia. Así, si estudiamos la altura de los niños de una clase, cada
alumno es un individuo; si estudiamos el precio de la vivienda, cada
vivienda es un individuo.

Población: conjunto de todos los individuos (personas, objetos,


animales, etc.) que porten información sobre el fenómeno que se estudia.
Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la
población será el total de las viviendas de dicha ciudad.

Muestra: subconjunto que seleccionamos de la población. Así, si se


estudia el precio de la vivienda de una ciudad, lo normal será no recoger
información sobre todas las viviendas de la ciudad (sería una labor muy
compleja), sino que se suele seleccionar un subgrupo (muestra) que se
entienda que es suficientemente representativo.

Las variables pueden ser de dos tipos:

Variables cualitativas o atributos: no se pueden medir


numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).

Variables cuantitativas: tienen valor numérico (edad, precio de un


producto, ingresos anuales).

Las variables también se pueden clasificar en:

Variables unidimensionales: sólo recogen información sobre una


característica (por ejemplo: edad de los alumnos de una clase).

Variables bidimensionales: recogen información sobre dos


características de la población (por ejemplo: edad y altura de los alumnos
de una clase).

Variables pluridimensionales: recogen información sobre tres o más


características (por ejemplo: edad, altura y peso de los alumnos de una
clase).
Por su parte, las variables cuantitativas se pueden clasificar en
discretas y continuas:

Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por
ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por
ejemplo, nunca podrá ser 3,45).

Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por


ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57
km/h...etc.

ESTADISTICA DESCRIPTIVA

RECOPILACION CLASIFICACION PRESENTACION DESCRIPCION

Encuesta Alcance Diagramas Media

Cuestionario Rango Histogramas Mediana

Censo Intervalo Moda

Muestreo

Recopilación: población=Censo Barrio=Muestra


Clasificación:
Ejemplo: (datos no agrupados) Edades de un grupo de personas:
2,3,5,6,10,12,12,14,16,16,16,18,21,22,23,24,25,27,29,32.
Tamaño de la muestra: n = 20
Alcance: son los intervalos de los números (extremos) [2,32]
Rango o recorrido: numero mayor – numero menor R = 32 – 2 = 30
Numero de Intervalo de clase (K) K = 1 + 3.3Log(n) K = 1 + 3.3Log(20) K= 5
Intervalo de clase Ii
Ancho de clase o Amplitud W = R/K W = 30/5 W = 6
Tabla de datos de nuestro ejemplo: se coloca en intervalos cerrado a la
derecha, abierto a la izquierda. Recuerde K = 5 W = 6
Ii fi
[2,8> 4
[ 8 , 14 > 3
[ 14 , 20 > 5
[ 20 , 26 > 5
[ 26 , 32 > 3

Presentación:
Presentación tabular ( tablas )
Marca de Clase Xi Xi = ( Linf + Lsup ) / 2
Frecuencia Absoluta Simple ( fi ) ∑𝐾
𝑖=1 𝑓𝑖 toda esta operación debe dar n.

Frecuencia Absoluta Acumulada ( Fi ) fK = n


Frecuencia Relativa ( hi ) hi = fi / n
Frecuencia Relativa Acumulada ( Hi ) Hi = Fi / n
Con los datos del ejercicio anterior realizamos el ejemplo de presentación:
Tabla de Distribucion de Frecuencias.
Ii Xi Fi Fi Hi Hi
[2,8> 5 4 4 0,20 0,20
[ 8, 14 > 11 3 7 0,15 0,35
[ 14 , 20 > 17 5 12 0,25 0,60
[ 20 , 26 > 23 5 17 0,25 0,85
[ 26 , 32 > 29 3 20 0,15 1,0

Presentación Grafica:
Diagrama de barras: Para variables Cuantitativas Discretas
Ejemplo: notas de un grupo de 20 alumnos
{0,0,1,1,1,2,3,3,4,5,6,6,6,7,7,8,8,8,8,9} Xi = notas
En el grafico la línea continua es el Polígono de Frecuencias
Diagrama de Sectores: Los 360° de una circunferencia se reparten
proporcionalmente a las frecuencias de los valores de la variable.
Pd. Es útil si existen pocos datos.
Para el ejercicio anterior la gráfica seria:
Formula ( f / N ) * 360 o sea : ejemplo:
( 2 / 20 ) * 360 = 36° ( 3 / 20 ) * 360 = 54° ( 1/20 )* 360=18°
( 4 / 20 ) * 360 = 72°

Histogramas: las barras quedan pegadas.


Para nuestro ejemplo quedaría asi:
Ii Fi
[2,8> 4
[ 8, 14 > 3
[ 14 , 20 > 5
[ 20 , 26 > 5
[ 26 , 32 > 3
En el grafico el Poligono de Frecuencias es la línea Roja atravezada.

Descripción de los Datos: Medidas de Tendencia Central ( Datos no Agrupados )

Media, Mediana y Moda para datos no agrupados. Por ejemplo 1, 2, 2, 3, 5, 3, 4, 6.

Media: promedio Aritmetico: ( 1+2+2+3+3+3+4+6 ) / 8

Mediana: Ejemplo: 1, 2, 2, 3, 3, 3, 4, 6 la mediana son los números 3,3 entonces ( 3 + 3 )/2

Moda : es el numero que mas se repite para el ejemplo 3

Descripción de datos para Datos Agrupados.


𝑘
Media: 𝑋̅ = (∑𝑖=1) ∗ (𝑓𝑖𝑥𝑖)/𝑛

Para nuestro ejemplo anterior seria asi:

Ii Xi Fi Xifi
[2,8> 5 4 20
[ 8, 14 > 11 3 33
[ 14 , 20 > 17 5 85
[ 20 , 26 > 23 5 115
[ 26 , 32 > 29 3 87
𝑋̅ = (20+33+85+115+87)/20 = 340/20 = 17

Mediana: Linf + W (( n/2 – F(me-1)/fme)

Linf = limite inferior de la clase mediana

W = ancho de clase

F(me-1) = F de la clase anterior a la mediana

fme = f de la clase mediana

La clase mediana se localiza asi n/2, dado el resultado se busca el dato donde este el numero
inmerso de resultado o muy cerca de el.

Ejemplo para la mediana.

Ii Xi Fi Fi
[2,8> 5 4 4
[ 8, 14 > 11 3 7F(me-1)
[ 14Linf , 20 > 17 5 fme 12 Clase Mediana
[ 20 , 26 > 23 5 17
[ 26 , 32 > 29 3 20
N = 20

Localizacion de La clase mediana

n = 20 entonces (20 / 2) = 10 escojemos el 12 por ser la mediana mas cercana a 10. W = 6

Mediana: Linf + W (( n/2 – F(me-1)/fme)

Me = 14 + 6 ((10-7)/5) = 17.6

Moda: Para encontrar la Moda usamos la siguiente ecuación: M = Linf + W ( Ʌ1/ Ʌ1+ Ʌ2)

Linf: limite inferior de la Clase Modal

W: ancho de la clase

Ʌ1 : fmo – f(mo – 1 )

Ʌ2 : fmo – f(mo + 1 )

fmo: frecuencia Modal

Ejemplo de Moda:
Intervalo Xi Fi

[ 5.2 , 6.4 > 5,65 3


[ 6.1, 7> 6,55 5 f(mo -1)
[ 7Linf , 7 > 7,46 9 Clase Modal fmo
[ 7.9 , 8.8 > 8,35 7 (fmo + 1)
[ 8.8 , 9.7 > 9,25 5
[ 9.7 , 10.6 > 10,15 3

W: 0,9 salio de restar 10.6 – 9.7

Ʌ1 : fmo – f(mo – 1 ) =9–5=4

Ʌ2 : fmo – f(mo + 1 ) =9–7=2

Entonces el resultado seria Mo = 7 + 0,9 ( 4 / 4+2 ) = 7.6

Desviación Estandar o Desviacion Tipica: es la raíz cuadrada de la varianza. Es decir la raíz cuadrada
de la media de los cuadrados de las puntuaciones de desviación.

𝜎 = √(𝑥1 − ̅̅̅
𝑥) 2 + (𝑥2 − ̅̅̅
𝑥) + (𝑥1 − ̅̅̅
𝑥) 2 + (𝑥3 − ̅̅̅
𝑥) 2 … . (𝑋𝑛 − ̅̅̅
𝑥) 2

Ejemplo: 9, 3, 8, 8, 9, 8, 9, 18 𝑋̅ = (9 + 3 + 8 + 8 + 9 + 8 + 9 + 18 )/8 = 9

𝜎 = ( √((9 − ̅̅̅
9) 2 + (3 − ̅̅̅
9) + (8 − ̅̅̅
9) 2 + (8 − ̅̅̅
9) 2 + (9 − ̅̅̅
9) 2 + (8 − ̅̅̅
9) 2 + (9 − ̅̅̅
9) 2 + (18 − ̅̅̅
9) 2 )/8

You might also like