Professional Documents
Culture Documents
Profesor de teoría:
Andrés M. Alonso
Despacho 10.1.32
E. Mail: andres.alonso@uc3m.es
Web: www.est.uc3m.es/amalonso
Web docente: http://www.est.uc3m.es/amalonso/esp/docencia.html
Profesores de práctica:
• Concepción Molina (Grupo 30)
• Javier Reques (Grupo 31)
• Natalia Fojo (Grupo 32)
1
Estadística I
Temario de la asignatura
• Análisis de datos univariantes.
• Análisis de datos bivariantes.
• Probabilidad.
• Variables aleatorias multidimensionales.
• Distribuciones muestrales.
• Estimación puntual.
• Estimación por intervalos.
• Contrastes de hipótesis.
2
Estadística I
Bibliografía básica
Newbold, P., Carlson, W.L. y Thorne, B. (2008)
Estadística para Administración y Economía,
Editorial Prentice Hall, Madrid.
3
Estadística I
Bibliografía complementaria
Levin, R.I. y Rubin, D.S. (2004) Estadística para
Administración y Economía, Editorial Prentice Hall,
Madrid.
1. Introducción
2. Representaciones y gráficos
Tablas de frecuencias
Diagrama de barras, Diagrama de sectores, Histograma, y
Diagrama de caja
3. Resumen numérico
Medidas de localización
Medidas de dispersión
Medidas de forma
Lecturas recomendadas:
• Capítulos 1 al 3 del libro de Newbold, Carlson, y Thorne (2008).
• Capítulos 1 y 2 del libro de Peña (2001).
• Capítulos 1 al 5 del libro de Peña y Romo (1997).
5
Objetivos del tema
6
Objetivos del tema
7
Objetivos del tema
8
Definiciones básicas
9
Población frente a muestra
Población Muestra
b c
a b cd gi n
ef gh i jk l m n o r u
o p q rs t u v w y
x y z
12
Estadística descriptiva e Inferencia estadística
Inferencia Estadística
Proporciona las bases para predicciones y
estimaciones para convertir la información en
conocimiento.
13
Tipos de variables o datos
Datos
Categóricos Numéricos
Ejemplos:
Estado Civil Discretos Continuos
¿Es mayor de edad?
Color de Ojos Ejemplos: Ejemplos:
(Categorías definidas o
Número de hijos Peso
grupos)
Defectos por hora Voltaje
(recuento de (Características Medibles)
elementos) 14
Niveles de medida
Diferencias entre
medidas, dado que Datos de Razón
existen ceros
verdaderos Datos Cuantitativos
Diferencias entre
medidas pero no Datos de Intervalo
existe un cero
verdadero
Categorías ordenadas
(rangos, orden, o Datos Ordinales
escalamientos)
Datos Cualitativos
Categorías (no hay
orden o dirección) Datos Nominales
15
Representaciones y gráficos
Gráficos
Variables Variables
Categóricas Numéricas
17
Tablas y gráficos para variables categóricas
Datos
Categóricos
Tabla
Distribución Diagrama Diagrama
Frequencias Barras Tarta
18
Tabla de frecuencias
Resumir datos por categorías
Ejemplo: Pacientes de un Hospital según Servicio
Indice Servicio Número de Pacientes Proporción de
Clase Hospital Pacientes
Clase Frequencia Absoluta Frequencia
i= ci ni = número de Relativa
1,...,k observaciones clase ci f i = ni / n
1 Cardiología 1052 0.12
2 Emergencias 2245 0.25
3 UCI 340 0.04
4 Maternidad 552 0.06
5 (=k) Cirugía 4630 0.53
n1 + n2 +...+ nk = n = 8819 f1 +...+ fk = 1.00
19
Diagrama de Barras y de Sectores
20
Ejemplo de Diagrama de Barras
Hospital Número
Unidad Pacientes
2000
1000
0
Cardiac
Emergency
Intensive
Maternity
Surgery
Care
Care
21
Ejemplo de Diagrama de Sectores
Hospital Numero % de
Unidad Pacientes Total
Hospital Patients by Unit
Cardiac Care 1052 11.93
Emergency 2245 25.46 Cardiac Care
12%
Intensive Care 340 3.86
Maternity 552 6.26
Surgery 4630 52.50
Emergency
Surgery 25%
53%
Intensive Care
(Porcentajes 4%
Maternity
se redondean
al valor más 6%
cercano)
22
Tablas y gráficos para variables cuantitativas
Datos
Numéricos
Distribuciones de
Frecuencias y
Distribuciones
Acumuladas
Histogramas
23
Distribución de frecuencias
24
¿Por qué usar tablas de frecuencias?
25
Intervalos y extremos de clase
24, 35, 17, 21, 24, 37, 26, 46, 58, 30,
32, 13, 12, 38, 41, 43, 44, 27, 53, 27
27
Ejemplo de distribución de frecuencias
28
Ejemplo de distribución de frecuencias
Datos ordenados:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Freq.
Intervalos Frecuencias Porcentaje
Relativas
10 y menos que 20 3 .15 15
20 y menos que 30 6 .30 30
30 y menos que 40 5 .25 25
40 y menos que 50 4 .20 20
50 y menos que 60 2 .10 10
Total 20 1.00 100
29
Histograma
30
Ejemplo de Histograma
Intervalo Frecuencia
His togram : Daily High Te m pe rature
10 y menos que 20 3
20 y menos que 30 6 7 6
30 y menos que 40 5
6 5
40 y menos que 50 4
50 y menos que 60 2 5 4
Frequency
4 3
3 2
2
1 0 0
(Sin huecos
0
entre barras)
0 10 20 30 40 50 60
Temperature in Degrees
31
¿Cómo agrupar los datos?
Frequency
2
• Puede dar lugar a una distribución 1.5
4
8
12
16
20
24
28
32
36
40
44
48
52
56
60
More
frecuencia entre las clases Temperature
Anchos) 10
8
Frequency
• Puede comprimir mucho la variación y 6
33
Distribución de frecuencias acumuladas
Datos ordenados:
12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58
Frecuencia Porcentaje
Clase Frecuencia Porcentaje
Acumulada Acumulada
10 y menos que 20 3 15 3 15
20 y menos que 30 6 30 9 45
30 y menos que 40 5 25 14 70
40 y menos que 50 4 20 18 90
50 y menos que 60 2 10 20 100
Total 20 100
34
Forma de la distribución
10
9
8
7
Frequency
6
5
4
3
2
1
0
1 2 3 4 5 6 7 8 9
35
Forma de la distribución
• La forma de la distribución se dice que es asimétrica
si las observaciones NO están equilibradas, o
distribuidas simétricamente respecto al centro.
Positively Skewed Distribution
Frequency
cola que se extiende a la derecha en 6
4
dirección de los valores positivos. 2
0
1 2 3 4 5 6 7 8 9
10
cola que se extiende a la izquierda 8
Frequency
en dirección de los valores negativos. 6
0
1 2 3 4 5 6 7 8 9
36
Resumen numérico
Moda Varianza
Desviación estándar
Coeficiente de Variación
37
Medidas de tendencia central
Tendencia Central
∑x
i=1
i
x=
n
Punto central
Media de los valores Valor observado
Aritmética ordenados más frecuente
38
Media aritmética
∑x i
x1 + x 2 + ⋯ + x N Valores
µ= =i=1
Población
N N
Tamaño Población
– Para una muestra de n valores:
n
∑x
i=1
i
x1 + x 2 + ⋯ + x n
Valores
observados
x= =
n n Tamaño muestra
39
Media aritmética
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Media = 3 Media = 4
1 + 2 + 3 + 4 + 5 15 1 + 2 + 3 + 4 + 10 20
= =3 = =4
5 5 5 5
40
Mediana
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Mediana = 3 Mediana = 3
41
Cálculo de la mediana
• La localización de la mediana:
n +1
Posición Mediana = posición en los datos ordenados
2
n +1
• Nótese que no es el valor de la mediana, sólo es
2
la posición de la mediana en los datos ordenados
42
Moda
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
Sin Moda
Moda = 9
43
Ejemplo
• Cinco casas en una colina cerca de la playa
€2.000.000
500.000
300.000 $500 K
100.000 $300 K
100.000
$100 K
$100 K
44
Ejemplo
Precios Casas:
• Media: (€3.000.000/5)
€2.000.000 = €600.000
500.000
300.000
100.000
100.000
• Mediana: valor medio de los datos
ordenados
Suma 3.000.000
= €300.000
45
¿Cual es la mejor medida de centralidad?
46
Forma de la distribución
47
Medidas de variación
Variación
Mismo centro,
diferente variación 48
Rango
• Medida más simple de variación
• Diferencia entre la mayor y la menor de las
observaciones:
Ejemplo:
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Rango = 14 - 1 = 13
49
Desventajas del rango
7 8 9 10 11 12 7 8 9 10 11 12
Rango = 12 - 7 = 5 Rango = 12 - 7 = 5
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120
Rango = 120 - 1 = 119
50
Rango intercuartílico
51
Rango intercuartílico
Ejemplo:
Mediana X
X Q1 Q3 máximo
mínimo (Q2)
25% 25% 25% 25%
12 30 45 57 70
Rango Intercuartílico
= 57 – 30 = 27
52
Cuartiles
Q1 Q2 Q3
54
Cálculo de los cuartiles
Q1 = 12.5
55
Varianza poblacional
2
∑ (x
i =1
i − µ) 2
σ =
N
donde µ = media población
N = tamaño población
xi = iesimo valor de la variable x
56
Varianza muestral
s =
n -1
donde x = media aritmética
n = tamaño muestral
xi= iesimo valor de la variable x
57
Desviación estándar poblacional
∑ (x
i =1
i − µ) 2
σ=
N
58
Desviación estándar muestral
∑ i
(x
i =1
− x) 2
s=
n -1
59
Medida de variación
60
Ejemplo
Datos
Muestrales (xi): 10 12 14 15 17 18 18 24
n=8 Media = x = 16
2 2 2 2
(10 − 16) + (12 − 16) + (14 − 16) + ⋯ + (24 − 16)
=
7
SC = Suma de Cuadrados:
n n
SC(x) = ∑ (x i − x) = ∑ x − nx 2 2
i
2
i =1 i =1
n
∑x
i =1
2
i − nx 2
s=
n -1
62
Comparación de desviaciones estándar
Datos A
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 3.122
Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 0.866
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.275
63
Ventajas de la varianza y de la desviación estándar
64
Coeficiente de variación
s
CV = ⋅ 100%
x
65
Comparación de coeficientes de variación
• Stock A:
– Precio medio último año = €50
– Desviación estándar = €5
s €5
CVA = ⋅100% = ⋅100% = 10%
x €50 Ambos stocks
tienen la misma
• Stock B: desviación
estándar, pero
– Precio medio último año = €100 el stock B es
– Desviación estándar = €5 menos variable
en relación a su
s €5 precio
CVB = ⋅100% = ⋅100% = 5%
x €100
66