Professional Documents
Culture Documents
Tema 1 Estadistica Descriptiva
Tema 1 Estadistica Descriptiva
Tema 1
Estadı́stica descriptiva
Javier Cárcamo
Departamento de Matemáticas
Universidad Autónoma de Madrid
javier.carcamo@uam.es
Javier Cárcamo
1. Introducción.
2. Variables. Distribución de una variable.
3. Representación gráfica de la distribución.
4. Medidas numéricas para resumir la distribución.
5. Correlación.
6. Transformaciones: estandarización y transformación
logarı́tmica.
7. Regresión lineal.
25
RIO
,00
1,00
20
Frecuencia
15
10
0
,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 9,00 10,00 11,00 12,00 13,00 14,00 15,00
30
Frecuencia
20
10
Media =1,1918
Desviación típica =0,76166
N =171
0
0,00 2,00 4,00
CONC
40
30
30
20
20
10
10
0 0
Distribución simétrica unimodal Distribución simétrica bimodal
100 100
80 80
60 60
40 40
20 20
0 0
Distribución asimétrica a la derecha Distribución asimétrica a la izquierda
Javier Cárcamo PREST. Tema 1: Estadı́stica descriptiva 18
La forma depende del número de intervalos
50
75 40
R ecu ento
30
Recu ento
50
20
25
10
0
1,00 2,00 3,00 1,00 2,00 3,00
CONC CONC
Javier Cárcamo PREST. Tema 1: Estadı́stica descriptiva 19
Con SPSS
x̄ da una idea del valor central alrededor del cual se reparten los
valores x1 , . . . , xn .
Algunas propiedades
• La suma de las desviaciones a la media siempre es igual a cero:
y
1 1 1 1 1 1 1 1 1 1
− ,− ,− ,− ,− , , , , , .
10 8 6 4 2 2 4 6 8 10
Calcular sus medias, medianas y varianzas.
10, 15, 13, 20, 25, 18, 15, 14, 21, 19.
17, 22, 14, 15, 19, 23, 21, 13, 14, 11.
4,00
162
70
66
CONC
2,00
0,00
,00 1,00
RIO
4,00
66
123
CONC
2,00
24
25 76
82 138
75
0,00
,00 1,00 2,00 3,00 4,00 5,00 6,00 7,00 8,00 9,00 10,00 11,00 12,00 13,00 14,00 15,00
ESTACION
5
2
4
1
●
●
3
5
0
2
4
−1
●
●
1
●
●
●
−2
0
●
4,00
CONC
2,00
0,00
PESO
Javier Cárcamo PREST. Tema 1: Estadı́stica descriptiva 40
Interpretación de un diagrama de dispersión
50,00
LONG
40,00
30,00
● ● ●
4
● ●
● ● ● ●
4
● ● ●
● ●
● ● ●
● ● ● ● ● ●
● ● ● ● ●
●● ● ● ● ● ●
●●● ● ● ● ● ●
●● ● ● ● ● ● ● ● ● ●
●
● ●● ● ● ● ● ● ●● ● ● ● ●
● ● ● ●● ● ● ● ● ●
● ●●● ● ●
2
● ● ● ● ● ●● ● ● ● ●● ●
● ●●● ● ●
● ●● ● ● ●
● ● ● ● ● ● ● ●
●●● ●
● ● ●● ● ● ●
2
● ● ●● ● ● ● ● ● ● ● ●
●
● ●
● ●
● ●● ●
● ● ● ●● ●● ● ● ● ● ● ● ●●● ● ● ● ● ● ● ●●● ●
● ●
● ● ● ●●
● ● ● ●● ●● ● ● ● ●
●● ●
● ●●●
● ● ●
● ●
● ● ●
●● ● ● ● ●● ● ●
● ●
● ● ● ●● ●● ●● ● ● ● ● ●●●● ● ●
●●
● ● ● ● ● ●● ● ● ●
● ● ● ●●● ● ● ● ●●
●● ● ●● ● ● ●●●●● ● ●●●●●● ● ●
● ●●
●●● ● ● ●●● ●● ● ● ● ●
●● ●● ● ● ●● ● ● ● ● ● ● ● ●
● ●● ● ●●●● ● ● ● ● ●● ● ● ● ● ●● ● ● ● ●● ●● ● ● ●●● ● ●
● ●●
●● ● ● ● ● ● ●●●●● ●● ●
● ●● ● ●●● ● ● ● ●●●● ● ●
●● ●● ● ●
●● ●● ● ●● ●● ●
● ● ●
● ●● ● ● ●● ● ● ● ●● ● ●● ●
● ●
●● ● ●
● ● ● ● ●● ●●
● ● ●● ● ● ● ● ●● ● ●●
●
● ●● ●
y
y
● ●● ● ● ● ●●●● ● ●●●● ● ● ●● ●
● ●●● ● ● ● ●● ●●●●● ●● ● ●●
●
●
● ●● ● ●
● ●●● ● ● ● ●● ● ● ●● ●
●
● ● ●● ●● ●
● ● ● ●● ●
0
● ● ●● ●● ●● ● ● ● ● ● ● ● ● ●● ● ● ●●●●● ●● ● ● ●●
0
● ● ● ● ●●●● ● ● ●● ● ● ●● ●● ● ● ● ●● ● ● ● ● ●● ● ● ● ●●
● ● ●●● ● ● ●● ● ●●● ●●●● ● ●
●
● ● ● ●● ● ● ● ●● ● ● ●● ● ● ●●●● ● ● ● ● ●● ● ●●
●●●● ●● ●● ● ●●
● ●●
●●
● ●● ● ●●● ●●●● ● ● ● ● ● ● ●● ●● ●● ●●● ● ●
●●●●
●
●● ●
● ● ●● ● ● ●
●
●● ● ●● ● ●●
● ● ● ●● ●● ●● ● ● ●
● ● ●● ● ● ● ● ●● ● ● ● ● ●● ●● ●●● ● ●
●● ●●● ● ●● ●
● ●● ● ●● ● ● ●● ● ●● ●● ● ●●● ● ● ●
●
●
● ● ● ●● ● ● ● ●●●●● ● ● ●
●
● ●
●●● ● ● ● ●● ●●● ● ●●
● ● ●● ● ● ● ● ●●● ● ●● ● ● ● ● ●
● ● ● ● ● ● ● ●●
● ● ● ● ●● ●● ● ● ● ● ●●● ● ●●● ● ● ●● ● ●● ●● ●● ● ● ● ●
●● ●● ● ● ●● ● ●
●
●● ● ●●
● ● ● ●● ● ●
●● ●
●
●
● ●● ●
● ●
● ● ● ●
● ●
● ●●
● ●● ●
−2
● ● ● ● ● ● ●
−2
●● ● ● ● ●● ● ●●
●
● ● ● ● ● ● ● ●
● ● ● ●●
● ● ● ●● ● ● ●● ● ● ● ●
●
●●● ●
● ● ● ●
● ● ● ● ● ●
● ● ●
● ●
●
−4
●
● ●
−4
−2 −1 0 1 2 −2 −1 0 1 2
● ● ●
●
● ● ●
● ● ●
● ● ● ●
2
● ● ● ●
●● ●
● ●
6
● ● ●
● ● ● ● ● ● ● ●
● ● ●● ● ●
● ● ● ● ●
● ● ● ● ●● ●
● ● ●●● ●●●● ● ●
●● ● ● ● ●
●● ●
●● ● ● ● ● ● ●● ●
●
●
● ● ● ●● ● ● ●
1
●
● ●● ●● ● ● ● ● ● ●● ●
● ●
●●● ● ● ● ●●
● ●● ● ●● ● ● ● ● ●
●
● ● ● ●
● ● ●● ● ● ● ● ●
● ● ● ● ●● ● ● ●
4
● ● ● ● ●● ● ● ● ● ● ●● ● ● ● ● ●
● ●
●
● ●
● ● ● ●
● ● ● ●●● ● ● ● ● ● ●
● ● ● ● ●
●● ● ●
● ● ● ● ● ● ● ● ● ● ●● ● ●●●●●●● ● ●●● ● ● ● ● ● ● ● ●● ●● ● ● ●
● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ● ●
● ●● ●● ● ● ● ● ●●
● ●● ●● ● ● ●
● ● ●● ●
●
● ● ●● ●● ● ● ● ● ●● ● ● ● ● ● ●● ●● ●
● ● ● ● ●● ● ●●
● ● ●●● ● ● ● ● ● ● ●
● ●
● ● ● ●● ●
0
●
●●●● ● ● ●● ● ●● ● ● ● ● ● ● ● ● ● ●● ●
y
● ● ● ● ●●● ● ●
● ● ● ● ● ● ● ● ● ● ● ●
● ● ●● ● ● ● ●
● ● ● ● ● ● ●
● ● ●● ● ● ● ● ●● ● ●●● ● ● ●● ● ● ●
● ●● ● ●
● ●●● ●● ●●● ● ● ●● ●● ●● ● ● ●● ● ●●●● ● ●
2
● ● ● ● ● ● ● ●● ● ● ●● ●● ● ● ●
● ●
● ● ● ● ● ●
● ● ● ●● ●
● ● ●●● ● ●● ● ● ● ● ●
● ● ● ● ● ● ● ● ● ● ● ●
● ● ●● ● ● ● ● ●
●
● ● ●
●●● ● ● ● ● ● ● ● ●●● ● ●●●●
● ●
● ● ● ● ● ●● ● ●● ●● ● ● ●●●● ● ● ● ● ● ●● ● ●
● ●● ● ● ●
●● ●● ● ● ●●●● ●
● ● ● ●
●●
●
●●
●● ● ●● ● ●
●● ●●
● ● ●
●● ● ●●
● ●
●●●●● ● ● ● ● ●● ● ●● ●
●●●●
●
● ● ●
●
● ● ●●●● ● ●●
● ●
●
−1
● ● ●● ● ● ● ● ● ● ● ●● ●
● ●
●● ●●●● ● ● ● ● ● ●
● ● ●
● ●● ● ● ●●● ●
● ●● ●● ● ●● ● ● ● ●●
● ● ● ●● ●● ●
●
● ●●● ● ● ● ● ● ●● ●● ●●● ●●●
● ● ●● ●● ● ● ● ●●● ●
● ● ● ●●
●
● ● ●● ●●
● ● ● ●● ● ●●●●●●
●● ●
● ●● ●
●●
● ●
● ●● ●● ● ●● ● ● ● ● ●● ● ●
● ● ● ● ● ●●● ● ●
● ● ●● ● ●
0
● ●● ● ● ● ● ●● ● ●● ● ●● ● ● ● ●
●● ● ● ●● ● ● ●●●● ●● ●●●●●●●● ●
● ● ●
● ● ● ● ● ● ● ●●● ● ● ●● ●● ●
● ●
● ● ●● ● ● ● ● ● ● ●● ● ●● ● ●●●● ●● ● ● ● ● ● ● ● ● ●
● ● ● ●●●● ●●● ● ●● ● ● ●
● ● ● ●
●● ● ● ● ● ●●
●
● ●
● ● ● ●●●
−2
● ● ● ● ●
● ● ● ●●
●● ● ● ● ● ●
● ● ●● ●
● ●● ● ● ●
●
−2
● ● ●
● ● ● ● ● ●
● ●
● ●
● ●
−2 −1 0 1 2 −2 −1 0 1 2
Correlaciones
−4 −2 0 2 4 6 8
Datos originales
−4 −2 0 2 4 6 8
−4 −2 0 2 4 6 8
1 0
log (x)
−1 −2
−3
0 1 2 3 4 5
x
Utilidad
• En algunas ocasiones se consigue que la distribución de log x
sea más simétrica.
• En algunas ocasiones se consigue que la asociación entre dos
variables sea aproximadamente lineal.
Javier Cárcamo PREST. Tema 1: Estadı́stica descriptiva 52
6. Tomar logaritmos para hacer la distribución más
simétrica
30
30
25
20
Frecuencia
Frecuencia
20
15
10
10
CONC
LNCONC
4,00
1,00
0,00
LNCONC
CONC
2,00
-1,00
-2,00
0,00
PESO LONG
6 6
5
5
4
4
3
3 4 5 6 7 3 4 5 6 7
6 6
5
5
4
4
3
3 4 5 6 7 3 4 5 6 7
Aplicaciones:
• Resumir la información de los datos mediante una recta.
• Predecir valores de una variable usando la otra.
Javier Cárcamo PREST. Tema 1: Estadı́stica descriptiva 58
Ejemplo: consumo de vino y dolencias cardı́acas
Algunas preguntas:
¿Qué podemos decir sobre la relación entre las dos variables?
Vino Card
Vino Card Vino Correlación de Pearson 1 -,843
N Válidos 19 19 Sig. (bilateral) ,000
Perdidos 0 0 N 19 19
Card Correlación de Pearson -,843 1
Media 3,026 191,05
Sig. (bilateral) ,000
Desv. típ. 2,5097 68,396 N 19 19
Irlanda
300
250
200
Card
150
100
Francia
50
Vino Card
Vino Correlación de Pearson 1 -,843
Javier Cárcamo
Sig. (bilateral) PREST.
,000 Tema 1: Estadı́stica descriptiva 60
2. ¿ASOCIACION
2. ¿ASOCIACION ESTADISTICA
ESTADISTICA O CAUSAL?
7.OAsociación
2. ¿ASOCIACION ESTADISTICA O CAUSAL?
CAUSAL? estadı́stica y causalidad
La asociación
La asociación entreentre
unauna causa (C)
causa y un efecto (E),puede
puedesurgir
surgirde
detres
tresmodos
modos distintos:
distintos:
La asociación entre(C)
unay un efecto
causa (E),
(C) y un efecto (E), puede surgir
La asociación entre una causa (C) y un efecto (E), puede surgir de tres modos distintos:
de tres modos
es causadistintos:
a) a) C esCcausa de de
E E
a) (a) C es causa
C es causa dede E E.
C E
C E
E
C
b) C y E tiene una causa común (variable X)
b)b) CCy yEEtiene una causa común (variable X)
(b) C y Etiene unauna
tiene causa común
causa (variable
común X)
(variable X).
X
X
X
C E
C
C E
E
c) E es causa de C
c)c) (c)EEE
eseses
causa
causade
deCde
causa C C.
C E
C
C E
E
Javier Cárcamo PREST. Tema 1: Estadı́stica descriptiva 61
Ejemplo Ejemplo: renta y fracaso escolar en la CAM
●
Arganda
35
●
30
●
● ●
% fracaso escolar
● ●
25
● ●
●
●
20
●
● ●
● ●
●
15
● ●
●
●
10
● Torrelodones
10 12 14 16 18 20 22
yi ≈ β0 + β1 xi , i = 1, . . . , n.
● ●
3
3
● ●
2
2
● ●
● ●
● ●
1
1
y
y
● ●●● ● ●●●
0
0
● ●
● ● ● ●
● ●
−1
−1
● ●
● ●
−2 −1 0 1 2 −2 −1 0 1 2
x x
Recta de regresión:
y = 260,57 − 22,974x.
Predicción de Y para x0 = 4:
A
A
A A
A
200 A
A
Card
A
A A
A
A
100
A
1Card = 260,56 + -22,97 * Vino
A
R-cuadrado = 0,71
Vino