Professional Documents
Culture Documents
ESTADÍSTICA DESCRIPTIVA
ANOTACIONES
1º BACHILLERATO SOCIALES
PSICOLOGÍA
TRABAJO SOCIAL
ESTADÍSTICA DESCRIPTIVA
- Población son todos y cada uno de los elementos que se quieren analizar.
Puede ser finita o infinita( en realidad las poblaciones infinitas no existen,
pero cuando se trata de un número grande se trata como si lo fuera).
ESCALAS DE MEDIDA
Las representaciones gráficas tienen que estar hechas para que el simple
impacto visual nos dé información de la distribución
Diagrama de Barras
12
10
Frecuencias
8
6
4
2
0
x1 x2 x3 x4 x5
Datos X
Diagrama rectángulos
10
8
Frecuencias
0
x1 x2 x3 x4 x5
X
x1 x2 x3 xn
Datos
Intervalos clase
El área de cada rectángulo nos da la frecuencia del intervalo, por tanto la base es
la amplitud y la altura la densidad de frecuencia de dada uno di
f5
Densidades
f3
f1 f4
f2
a1 a2 a3 a4 a5
Amplitudes
MEDIDAS DE POSICIÓN
1. Media
2. Mediana
3. Moda
• De tendencia no central
1. Cuantiles.
Las medidas de posición tienen que cumplir que intervengan todos los valores de la
variable, que se puedan calcular y que su valor sea único para cada distribución de
frecuencias.
1.- MEDIA
Se suman de todos los valores de la variable ponderados por sus frecuencias absolutas y
dividido todo ello por el número total de observaciones
n
− ∑x f i i
x=
i =1
N
La media aritmética es siempre el centro de gravedad de la distribución y es
siempre un valor que entra dentro del campo de variación de la variable.
Si los datos están agrupados en intervalos se toma la marca de clase de cada
intervalo para su cálculo.
Propiedades
1.- Cuando a los valores de la variable se les suma una constante, la nueva media
es la antigua más la constante.
− −
x´= x + K ⇒ x´ = x + K
Demostración
x´ =
∑ x ´ f = ∑ ( x + K ) f = ∑ x f + k ∑ f = x + K puesto que la suma
i i i i i i i
−
N N N N
de las fi es N.
2.- Si a los valores de la variable se les multiplica por una constante, la nueva
media es la antigua multiplicada por la constante.
− −
x , ´= x i K ⇒ x´= K x
Demostración
x´=
∑ x ´ f = ∑ Kx f = K ∑ x f = k x
i i i i i i
−
N N N
3.- Como consecuencia de las dos anteriores si a los valores de una variable se
les multiplica por constante y se les suma un número, la media aritmética queda
multiplicada por la constante y sumado el número.
− −
Es decir si : Y = KX + B entonces Y = K X + B
Media cuadrática
∑x f
− 2
x2 = i i
Media Armónica
N
H =
f
∑ i
xi
Media Geométrica
Es la raíz N-ésima del producto de los valores de la variable elevado cada uno de ellos a
su frecuencia absoluta
G = N x1f .x 2f .......... x nf
1 2 n
2.- MEDIANA
Para poder hallar la mediana, lo primero que hay que hacer es ordenar los valores de la
variable de forma creciente, y escribir los valores de las frecuencias acumuladas Fi.
3.- MODA
Es el valor de la variable que más veces se repite. En algunos casos existen varias
modas, pero normalmente es una, si son dos se llama bimodal.
d i − d i −1
Mo = Li + .a i
( d i − d i −1 ) + (d i − d i +1 )
CUANTILES
Son medidas de posición que no tiene porqué ser central. Hay varios tipos de cuantiles:
1.- Cuartiles Son valores de la variable que dividen a la distribución en cuatro partes
iguales, por lo tanto los cuartiles son tres C1 que deja por detrás de él al 25% de la
población, C2 que divide a la población en dos partes iguales y C3 que deja dtrás de él al
75% de la población.
2.- Deciles Son valores e la variable que dividen a la distribución en diez partes iguales,
por lo tanto los deciles son nueve, D1 deja al 10% antes, D2 al 20% y así sucesivamente
hasta D9 que deja al 90% antes y al 10% después de él.
MEDIDAS DE DISPERSIÓN
Recorrido
Recorrido Intercuartílico
Desviación Media
Varianza
Desviación Típica
RECORRIDO
R = xn – x1
RECORRIDO INTERCUARTÍLICO
RI = Q 3 – Q 1
DESVIACIÓN MEDIA
∑ x − x f
i=n −
D =
i =1 i
i
−
x N
VARIANZA
S 2X =
∑( xi − x)2 fi
N
Propiedades:
1.-La varianza siempre es mayor o igual que cero. Tan solo hay un caso en que es cero y
es cuando todos los valores de la variable son iguales.
2.- Si a los valores de la variable le sumo una constante, la varianza de la nueva variable
es la misma que la que tenía antes.
Demostración:
− −
S x´2 =
∑( xi ´− x´) fi =
∑( xi + k − ( x + k )) 2 fi = S x2
N N
3.- Si a los valores de la variable se les multiplica por una constante, la varianza de la
nueva variable es la que tenía por el cuadrado de la constante.
Demostración
´− − −
S 2
´=
∑( x ´− x)
i
2
fi
=
∑(kx i − k x)2 fi
=k 2 ∑( x i − x) 2 f i
= k 2 S x2
x
N N N
S y2 = a 2 S x2
− −2
5.- Cálculo abreviado de la varianza
S = x − x que es la fórmula más utilizada.
2
x
2
Demostración
−2
−2 − −2 −
∑2 xi− x fi ∑ (xi2+ x− 2 i )fxx i ∑ i2fx i x∑ fi 2x∑ fx ii −2 −2 .
Sx = = = + − = x − x
N N N N N
DESVIACIÓN TÍPICA (Sx)
Sx
CVx = −
x
Tipificación de variables
Tipificar una variable es cambiarla por otra que tenga de media cero y
desviación típica 1. Se utiliza para comparar distribuciones .
MEDIDAS DE FORMA
−
−
x− M o
Ap =
Sx
Este coeficiente puede ser:
g1 =
∑( xi − x)3 fi
N .S x3
g2 =
∑(x i − x) 4 f i
−3
N .S x4
Este coeficiente puede ser:
Las medidas más utilizadas son el Índice de Gini y la curva de Lorentz, su cálculo se
basa en la siguiente tabla de distribución:
Li-1-Li mi fi Fi Fi u
ui = ∑f i .mi
pi = .100 qi i = i .100
N un
10-20 15 6 6 90 26,09 8,45
20-40 30 4 10 210 43,48 19,72
40-50 45 3 13 345 56,52 32,39
50-70 60 5 18 645 78,26 60,56
70-80 75 2 20 795 86,96 74,65
80-100 90 3 23 1065
N=23 291,31
Siempre pi > qi en caso de igualdad implica que todos perciben la misma cantidad, por
lo tanto hay nula concentración o total uniformidad en el reparto.
Indice de Gini
IG =
∑( p − q ) = 95,54 = 0,3280
i i
en nuestro ejemplo hay escasa
∑p i 291,31
concentración por lo tanto bastante uniformidad en el reparto.
xi fi
47 1
48 3
49 2
50 8
51 3
52 2
53 1
3.- Un hotel tiene cinco tipos de habitaciones cuyos precios así como los ingresos son:
4.- Un empresario desea repartir unas bonificaciones entre sus empleados en base a
la categoría y productividad de los mismos. Dicha distribución quedó de la siguiente
forma:
3
2,8
2,6
2,4
2,2
2
1,8
1,6
1,4
1,2
1
0,8
0,6
0,4
0,2
0
25 50 75 100 125 150
Calcular:
• Tabla estadística
• Establecer nº de empresas con beneficios superiores a 75 millones
• Calcular media mediana y moda
• Coeficiente de variación y de asimetría de Pearson ( significado)
xi fi
0 4
1 10
2 13
3 11
4 13
5 10
6 9
7 7
8 7
9 4
10 2
7.- La tabla adjunta muestra la distribución de los salarios/mes en Euros percibidos por
los 65 empleados de la empresa AVISO.
8.- Una variable estadística tiene una media igual a 7, y una desviación típica igual a 5.
Calcular la media y la varianza de las variables:
• Y = (X-2)/4
• Z= 5X+2
9.- Completar los datos que faltan en la siguiente tabla de distribución de frecuencias:
xi fi FI hi HI
70 2 - - -
60 - 12 - -
50 8 - - -
40 6 - - -
30 - 34 - -
20 4 - - -
10 3 - - -
Calcular:
• Media aritmética
• Varianza
• Coeficiente de variación
• Mediana
• Recorrido intercuartílico
10.- La puntuación que han obtenido 50 personas que se presentaron para ocupar un
puesto en la plantilla de una empresa, ha sido la siguiente:
Puntuación Nº personas
14.18 3
18.20 6
20.25 11
25.28 15
28.32 8
32.36 7
11.- Las últimas cien ventas facturadas por un establecimiento se habían agrupado en
cuatro intervalos de clase, recordamos tan sólo la siguiente información:
• El primer intervalo tiene seis semanas como extremo superior, una frecuencia
relativa de 0,2 y una amplitud de cuatro semanas.
• La marca de clase del segundo y cuarto intervalo son ocho y cincuenta semanas
respectivamente.
• Hasta el segundo intervalo se acumulan sesenta ventas.
• El tercer intervalo presenta una frecuencia de treinta ventas y una amplitud de
treinta semanas.
13.- Durante la última semana dos librerías han vendido los libros que ocupan los tres
primeros puestos en las listas de ventas a los siguientes precios
Librería 1 Librería2
Precio Nº Ejemplares Precio Nº Ejemplares
18 10 15 25
21 13 19 18
23 15 20 25
14.- Una empresa automovilística ha abierto una nueva factoría en un país del este. En
este año en dicha factoría se han obtenido unas ventas medias mensuales de 100
automóviles con una desviación típica de 10, mientras que en España por término medio
se han vendido 75 coches con una desviación típica de 8.
Se pide a los alumnos de la clase las notas de la evaluación en las dos asignaturas y
se anotan los resultados. Una vez anotados los resultados en dos filas, se pide:
16.- Con los datos de la siguiente tabla obténgase las medias, varianzas y covarianza de
las variables X e Y
yj 1 2 4 ni
xi
5 1 0 2 3
10 2 1 0 3
15 0 1 3 4
nij 3 2 5 10
xi yj nij
2 1 6
2 4 7
3 2 4
3 5 2
5 4 1
18.- Se ha encuestado a 100 familias en una ciudad sobre su gasto mensual en ocio
(variable Y) y sus ingresos mensuales (Variable X). En la siguiente tabla se presentan
los resultados obtenidos, donde las variables vienen expresadas en Euros.
20.- Calcular las rectas de regresión de una variable bidimensional (X,Y) sabiendo los
siguientes datos :
x = 1 4 y = 7 S x2 = 3 S y2 = 1 r = 0,9 5
• ¿ Qué valor asignaría a X para un valor Y=5
21.- Dada la recta de regresión Y = - 0,25 + 3,2X ¿ Puede ser Sy< 6,4 si Sx = 2?
22.- En una región de España se observó el precio del vino y la cantidad de producción
durante algunos años , obteniéndose los siguientes datos :
X 35 31 42 60 52 49 61 50 55 58
Y 100 140 120 110 200 200 110 160 160 200
• Distribuciones marginales
• Media, mediana, desviación típica y coeficiente de variación de Pearson
de X
• Covarianza entre las variables
• Porcentaje de años en los que el precio del vino fue inferior a 48
céntimos
• Recta de regresión de Y/X
• Coeficiente de correlación y de determinación , significado.
23.- La recta de regresión entre dos variables viene dada por Y = 5 + b.X. Sabiendo que
las medias de las variables son respectivamente 5 y 20. Calcular el coeficiente de
regresión .
• El ajuste es bueno
• El coeficiente de correlación es 0,9
• El 10% de los valores no se explican por la regresión
25.- Media aritmética y varianza. Tipos de medida que son. Utilidad, importancia y
propiedades que cumple cada una de ellas.
TEORÍA
PROBLEMAS
En todos los apartados ponga en un recuadro el resultado final
5.10 20
10.15 15
15.20 25
20.30 40
2.- ( 2 puntos ) Halle las rectas de regresión de una variable bidimensional (X,Y)
− −
sabiendo x = 20 y = 10 S x = 4 S y = 2 , siendo el coeficiente de correlación lineal r =
0,95.
En cual de las dos variables la media es más representativa?. ¿ Qué valor asignaría
a Y = 6? Sería la predicción fiable?
TEORÍA
1.- ( 2 puntos ) Conteste a la pregunta que mejor sepa de entre las propuestas por el
profesor en clase.
PROBLEMAS
En todos los apartados ponga en un recuadro el resultado final
1.-(2 puntos ) Una empresa quiere realizar un estudio sobre la influencia de las
campañas publicitarias en sus cifras de ventas. Para ello dispone del gasto destinado a
publicidad y sus ventas en los últimos cinco años:
2.-(2 puntos ) Calcular los tres cuartiles de las dos distribuciones siguientes:
Xi fi
2 8
3 10
8 12
12 6
15 3
Li-1-Li fi
5-10 6
10-15 7
15-20 10
20-30 9
Nota importante