P. 1
Apuntes Inferencia Estadistica

Apuntes Inferencia Estadistica

|Views: 85|Likes:

More info:

Published by: Juan Jesús Cid Carreño on Oct 01, 2012
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

12/03/2012

pdf

text

original

Sections

  • Cient´ıfica
  • 1.2. Motivaciones y Definiciones
  • 1.2.1. Tipos de Variables
  • 1.2.2. Tabulaci´on
  • 1.2.3. Representaci´on Gr´afica
  • 1.3. Medidas de Tendencia Central
  • 1.3.1. Media Arm´onica (H(X))
  • 1.3.2. Media Geom´etrica (G(X))
  • 1.3.4. Media Ponderada (µP, ¯xP)
  • 1.3.5. Media Recortada en α%
  • 1.3.6. Moda (Mo(X))
  • 1.3.7. Mediana (Me(X))
  • 1.3.8. Comentarios
  • 1.4. Medidas de Posici´on
  • 1.4.1. M´ınimo (XMin)
  • 1.4.2. M´aximo (XMax)
  • 1.4.3. Percentiles( Pα)
  • 1.4.4. Diagrama de Caj´on o Box-Plot:
  • 1.5. Medidas de Variabilidad o de Dispersi´on
  • 1.5.1. Amplitud o Rango (R)
  • 1.5.2. Rango Intercuartil (RI)
  • 1.5.3. Desviaci´on Media (DM)
  • 1.5.5. Coeficiente de Variaci´on (C.V.(X))
  • 1.6. An´alisis Bivariado
  • 1.6.1. Tablas de Doble Entrada
  • 1.6.2. An´alisis Condicional
  • 1.6.3. Covarianza
  • 1.7. Correlaci´on
  • 1.7.1. Coeficiente de Correlaci´on Lineal de Pearson (ρ
  • 1.7.2. Matrix-Plot
  • 1.7.3. Concepto de Rango
  • 1.7.4. Correlaci´on de Rangos de Spearman (r
  • 1.7.5. Correlaci´on de Punto Biserial (r
  • 1.7.6. Correlaci´on Phi (φ)
  • 1.8. Ejercicios Resueltos
  • Regresi´on Lineal
  • 2.1. Modelo de Regresi´on Lineal
  • 2.2. Ejercicios Resueltos
  • Probabilidades
  • 3.1. Probabilidades
  • 3.1.1. Introducci´on
  • 3.1.2. Definiciones
  • 3.1.3. Probabilidad
  • Variables Aleatorias
  • 4.1. Variable Aleatoria
  • 4.1.1. Varaibles Aleatorias Discretas
  • 4.1.2. Varaibles Aleatorias Continuas
  • 4.2. Valor Esperado
  • Inferencia Estad´ıstica
  • 5.1. Estimaci´on
  • la Estad´ıstica Inferencial
  • 5.2. Estimaci´on Puntual
  • 5.2.1. M´etodo de M´axima Verosimilitud
  • 5.2.2. M´etodo de los Momentos
  • 5.2.3. Propiedades de los Estimadores Puntuales
  • 5.2.4. Estimaci´on Intervalar
  • 5.3. D´ocima de Hip´otesis
  • 5.3.1. Introducci´on
  • 5.3.2. D´ocimas
  • 5.3.3. D´ocimas Univariadas
  • 5.3.4. D´ocimas Bivariadas
  • 5.4. D´ocimas de Hip´otesis No Param´etricas
  • 5.4.3. Tablas de Contingencia
  • 6.1. Muestreo
  • 6.1.1. Muestreo Aleatorio Simple. (m.a.s.)
  • 6.1.2. Muestreo Estratificado
  • 6.1.3. Muestreo Sistem´atico
  • 6.1.4. Tama˜no Muestral
  • 6.1.5. Plan de Muestreo

Apuntes

de Probabilidad y Estad´ıstica
(Versi´ on Preliminar)
CARLOS BUSTOS-L
´
OPEZ
A los caminos que aun faltan por recorrer
siendo un peque˜ no saltamontes
´
Indice general
1. Estad´ısticas Descriptivas: Definiciones 4
1.1. Fundamentos de la Investigaci´on
Cient´ıfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2. Motivaciones y Definiciones . . . . . . . . . . . . . . . . . . . 5
1.2.1. Tipos de Variables . . . . . . . . . . . . . . . . . . . . 6
1.2.2. Tabulaci´ on . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.3. Representaci´on Gr´afica . . . . . . . . . . . . . . . . . . 13
1.3. Medidas de Tendencia Central . . . . . . . . . . . . . . . . . . 22
1.3.1. Media Arm´onica (H(X)). . . . . . . . . . . . . . . . . 22
1.3.2. Media Geom´etrica (G(X)). . . . . . . . . . . . . . . . . 23
1.3.3. Media Aritm´etica o Promedio (µ
X
, ¯ x o M(X)). . . . . 23
1.3.4. Media Ponderada (µ
P
, ¯ x
P
). . . . . . . . . . . . . . . . 26
1.3.5. Media Recortada en α% . . . . . . . . . . . . . . . . . 27
1.3.6. Moda (Mo(X)). . . . . . . . . . . . . . . . . . . . . . . 28
1.3.7. Mediana (Me(X)). . . . . . . . . . . . . . . . . . . . . 29
1.3.8. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . 31
1.4. Medidas de Posici´ on . . . . . . . . . . . . . . . . . . . . . . . 31
1.4.1. M´ınimo (X
Min
). . . . . . . . . . . . . . . . . . . . . . . 32
1.4.2. M´aximo (X
Max
). . . . . . . . . . . . . . . . . . . . . . 32
1.4.3. Percentiles( P
α
). . . . . . . . . . . . . . . . . . . . . . 32
1.4.4. Diagrama de Caj´on o Box-Plot: . . . . . . . . . . . . . 34
1.5. Medidas de Variabilidad o de Dispersi´on . . . . . . . . . . . . 35
1.5.1. Amplitud o Rango (R). . . . . . . . . . . . . . . . . . . 35
1.5.2. Rango Intercuartil (RI). . . . . . . . . . . . . . . . . . 36
1.5.3. Desviaci´on Media (DM). . . . . . . . . . . . . . . . . . 36
1.5.4. Varianza y Desviaci´on Est´andar (σ
2
X
, S
2
X
o VVar(X)). . 36
1.5.5. Coeficiente de Variaci´ on (C.V.(X)). . . . . . . . . . . . 38
1
´
INDICE GENERAL 2
1.6. An´alisis Bivariado . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.6.1. Tablas de Doble Entrada. . . . . . . . . . . . . . . . . 40
1.6.2. An´alisis Condicional. . . . . . . . . . . . . . . . . . . . 41
1.6.3. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . 45
1.7. Correlaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
1.7.1. Coeficiente de Correlaci´on Lineal de Pearson (ρ
XY
o r
XY
) 47
1.7.2. Matrix-Plot . . . . . . . . . . . . . . . . . . . . . . . . 50
1.7.3. Concepto de Rango . . . . . . . . . . . . . . . . . . . . 50
1.7.4. Correlaci´on de Rangos de Spearman (r
S
). . . . . . . . . 52
1.7.5. Correlaci´on de Punto Biserial (r
pb
). . . . . . . . . . . . 53
1.7.6. Correlaci´on Phi (φ). . . . . . . . . . . . . . . . . . . . 54
1.8. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . 56
2. Regresi´on Lineal 133
2.1. Modelo de Regresi´on Lineal . . . . . . . . . . . . . . . . . . . 133
2.2. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . 135
3. Probabilidades 153
3.1. Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . 153
3.1.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . 153
3.1.2. Definiciones . . . . . . . . . . . . . . . . . . . . . . . . 154
3.1.3. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . 156
4. Variables Aleatorias 164
4.1. Variable Aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . 164
4.1.1. Varaibles Aleatorias Discretas . . . . . . . . . . . . . . 165
4.1.2. Varaibles Aleatorias Continuas . . . . . . . . . . . . . . 165
4.2. Valor Esperado . . . . . . . . . . . . . . . . . . . . . . . . . . 166
5. Inferencia Estad´ıstica 170
5.1. Estimaci´on . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
5.2. Estimaci´on Puntual . . . . . . . . . . . . . . . . . . . . . . . . 172
5.2.1. M´etodo de M´axima Verosimilitud . . . . . . . . . . . . 173
5.2.2. M´etodo de los Momentos . . . . . . . . . . . . . . . . . 180
5.2.3. Propiedades de los Estimadores Puntuales . . . . . . . 182
5.2.4. Estimaci´on Intervalar . . . . . . . . . . . . . . . . . . . 198
5.3. D´ocima de Hip´otesis . . . . . . . . . . . . . . . . . . . . . . . 203
5.3.1. Introducci´on . . . . . . . . . . . . . . . . . . . . . . . . 203
Carlos Bustos-L´opez
´
INDICE GENERAL 3
5.3.2. D´ocimas . . . . . . . . . . . . . . . . . . . . . . . . . . 204
5.3.3. D´ocimas Univariadas . . . . . . . . . . . . . . . . . . . 205
5.3.4. D´ocimas Bivariadas . . . . . . . . . . . . . . . . . . . . 209
5.4. D´ocimas de Hip´otesis No Param´etricas . . . . . . . . . . . . . 214
5.4.1. Prueba de Suma de Rangos de Wilcoxon . . . . . . . . 214
5.4.2. D´ocima de Bondad de Ajuste Chi-cuadrado . . . . . . 217
5.4.3. Tablas de Contingencia . . . . . . . . . . . . . . . . . . 218
5.4.4. D´ocima Chi-cuadrado de Independencia . . . . . . . . 220
6. Muestreo 224
6.1. Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
6.1.1. Muestreo Aleatorio Simple. (m.a.s.) . . . . . . . . . . . 227
6.1.2. Muestreo Estratificado. . . . . . . . . . . . . . . . . . . 227
6.1.3. Muestreo Sistem´atico. . . . . . . . . . . . . . . . . . . 228
6.1.4. Tama˜ no Muestral . . . . . . . . . . . . . . . . . . . . . 229
6.1.5. Plan de Muestreo . . . . . . . . . . . . . . . . . . . . . 230
Carlos Bustos-L´opez
Cap´ıtulo 1
Estad´ısticas Descriptivas:
Definiciones
1.1. Fundamentos de la Investigaci´on
Cient´ıfica
La Ciencia se puede entender como un conjunto sistematizado de conocimien-
tos, sobre la realidad observada, que se obtienen aplicando el m´etodo cient´ıfi-
co.
El fin esencial de la ciencia es la teor´ıa, la que levanta como un conjunto de
leyes y reglas que son la base del conocimiento; la teor´ıa sirve para relacionar,
explicar, predecir y controlar fen´omenos.
Definici´on 1.1.1 El m´etodo, (meta=hacia; hodos=camino), es un conjun-
to de acciones desarrolladas seg´ un un plan preestablecido con el fin de lograr
un objetivo.
El m´etodo cient´ıfico diferencia la investigaci´ on de la especulaci´on, y
el conocimiento cient´ıfico (universal, necesario, sistem´atico y met´odico), del
vulgar (particular, contingente, asistem´atico y amet´odico).
4
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 5
1.2. Motivaciones y Definiciones
¿Qu´e es la Estad´ıstica?
Originalmente la palabra estad´ıstica ha estado asociada al procesamiento
de datos, censos y demograf´ıas en la Roma Imperial, entendiendose por esto
la representaci´on gr´afica, la tabulaci´on y el c´alculo de medidas resumen, que
permiten analizar e interpretar un conjunto de datos.
La estad´ıstica es una Ciencia (disciplina) que se preocupa de desarrollar
t´ecnicas y modelos que permitan estudiar la forma como la “incertidumbre”
sobre un fen´omeno es alterada por la informaci´on disponible.
La Estad´ıstica no es “una ciencia vulgar que busca la manera de tratar
los datos num´ericos”, sino “la base del conocimiento cuantitativo, el principal
instrumento hasta ahora descubierto por el hombre para poder dominar la
terrible complejidad de las cosas y de las relaciones entre ellas.” (Kendall,
19..).
¿Qu´e es la Poblaci´on?
Definici´on 1.2.1 Conjunto formado por TODAS las unidades (personas,
animales o cosas) que tienen algo en com´ un. La poblaci´on puede ser listada
en lo que llamaremos Marco Muestral (Ω).
¿Qu´e es una Muestra?
Definici´on 1.2.2 Una muestra es un subconjunto de la poblaci´on. General-
mente de denotan con letras may´ usculas. (p.e. A, B, C, etc.).
¿Qu´e es una Variable?
Definici´on 1.2.3 Caracter´ıstica que cambia (var´ıa) de sujeto a sujeto. (p.e.
color de ojos). Las denotaremos por letras may´ usculas. (p.e. X, Y, Z, etc.).
¿Qu´e es un Dato?
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 6
Definici´on 1.2.4 Es un registro alfanum´erico. Ycorresponde a una real-
izaci´on de una caracter´ıstica o variable, al ser evaluada en un conjunto. (p.e.
Color de ojos = azul). Los denotaremos con la misma letra de la variable,
pero con letras min´ usculas. (p.e. x
1
, x
2
, . . . , x
n
).
¿Qu´e es Informaci´on?
Definici´on 1.2.5 Llamaremos informaci´on al conjunto de datos.
x
1
, x
2
, . . . , x
n
.
B´asicamente, al conjunto de observaciones (datos) que permiten disminuir
la incertidumbre que se tiene de un fen´omeno.
1.2.1. Tipos de Variables
V ariable
_
¸
¸
_
¸
¸
_
Cualitativa
_
Nominal
Ordinal
Cuantitativa
_
Discreta
Continua
Cualitativas: Son todas aquellas variables cuyo conjunto de posibles
respuestas corresponden a cualidades del objeto en estudio.
• Nominales: El conjunto de posibles respuestas de las variables
corresponden a nombres de las cualidades del objeto en estudio.
(p.e. 1: representa sexo masculino y 2: sexo femenino).
• Ordinales: El conjunto de posibles respuestas de las variables
tienen un orden jer´arquico natural. (p.e. En un partido de f´ utbol:
-1 es perder, 0 es empatar y 1 es ganar).
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 7
Cuantitativas: Son todas aquellas variables cuyo conjunto de posibles
resultados corresponden a mediciones de la caracter´ıstica del objeto en
estudio.
• Discretas: El conjunto de posibles respuestas, es un conjunto
finito o infinito numerable. (p.e. N´ umero de hijos, etc.).
• Continuas: El conjunto de posibles respuestas, es un conjunto
infinito no numerable. (p.e. Altura, Peso, etc.).
Ejemplos de datos estad´ısticos.
1. Variable Discreta Nominal: Las preferencias de colores para un
determinado envase en una encuesta a 32 personas se representan en la
siguiente tabla de c´odigos:
Color Rojo Verde Azul Amarillo
C´odigo 1 2 3 4
y el conjunto de datos es el siguiente:
1 1 1 2 3 3 4 1
1 1 2 3 3 4 1 1
2 2 3 3 1 1 2 2
3 4 1 1 2 2 3 4
esta variable es nominal porque los valores posibles s´olo representan un
nombre de acuerdo a la tabla de c´odigos.
2. Variable Discreta Ordinal: Las 25 personas que trabajan en un
departamento de una tienda se clasifican seg´ un la edad x en la forma
siguiente:
Edad x < 18 18 ≤ x < 25 25 ≤ x < 40 40 ≤ x < 60 60 ≤ x
C´odigo 1 2 3 4 5
las observaciones son las siguientes:
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 8
1 2 2 4 3
2 2 2 5 2
2 2 3 2 3
4 3 3 3 3
4 3 2 2 3
esta variable es ordinal, ya que los valores de las respuestas, tienen un
orden jer´arquico natural.
3. Variable Cuantitativa Discreta: Las ventas de un modelo de au-
tom´ovil durante una semana entre 15 distribuidores:
Distrib. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Venta 2 1 0 0 3 2 0 0 2 1 1 1 0 1 2
esta variable es cuantitativa porque representa una cantidad y es discre-
ta debido a que, aunque el n´ umero de valores posibles es infinitamente
grande, estos se pueden enumerar, 0-1-2-3-4-etc.
4. Variable Cuantitativa Continua: Las duraciones de 10 ampolletas,
son los siguientes:
Ampolleta 1 2 3 4 5 6 7 8 9 10
Duraci´on 18.0 18.4 19.0 20.2 19.6 18.6 19.4 19.2 17.0 18.5
esta variable es continua, ya que el conjunto de valores posibles es no
numerable.
1.2.2. Tabulaci´ on
[Tabla de Frecuencias]
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 9
Definici´on 1.2.6 Una tabla de frecuencias es un arreglo en la que se
anotan las frecuencias de los distintos valores posibles, denotados por X.
Toda tabla consta de filas y columnas, utilizandose la primera columna para
la identificaci´on de la variable y de sus respectivos atributos o intervalos,
como veremos en lo que sigue:
Variable n
i
f
i
f
i
% N
i
F
i
F
i
%
categor´ıa 1 n
1
f
1
f
1
% N
1
F
1
F
1
%
categor´ıa 2 n
2
f
2
f
2
% N
2
F
2
F
2
%
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
categor´ıa k n
k
f
k
f
k
% N
k
F
k
F
k
%
Total N 1 100 %
Variables Cuantitativas
1. Variables Discretas
Para un conjunto de N observaciones de una variable discreta X, se
define:
a) La frecuencia absoluta u observada de la variable X, como el
n´ umero de observaciones iguales a x
i
, y se simboliza por n
i
.
b) La frecuencia relativa de la variable X, como:
f
i
=
n
i
N
.
c) La frecuencia absoluta acumulada de la variable X, como el n´ umero
de observaciones menores o iguales a x
i
. Se denota por:
N
i
=
i

j=1
n
j
.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 10
d) La frecuencia relativa acumulada de la variable X, como:
F
i
=
i

j=1
f
j
.
Note que:
a)

k
i=1
n
i
= N .
b)

k
i=1
f
i
= 1 .
c) N
k
=

k
i=1
n
i
= N .
d) F
k
=

k
i=1
f
i
= 1 .
e) F
i
=

i
j=1
f
j
=

i
j=1
n
j
N
=
1
N

i
j=1
n
j
=
N
i
N
.
Ejemplo 1.2.1 La siguiente informaci´on representa el nivel de in-
strucci´on de 20 personas:
B, M, S, S, B, B, M, M, M, S, S, M, B, B, M, M, B, M, S, B .
Nivel de Instrucci´on n
i
f
i
N
i
F
i
F
i
%
B´asico 7
7
20
= 0,35 7 0,35 35 %
Medio 8
8
20
= 0,40 15 0,75 75 %
Superior 5
5
20
= 0,25 20 1,00 100 %
Total 20 1,00
Ejemplo 1.2.2 Para las ventas de un modelo de autom´ovil en una
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 11
semana en 15 distribuidores:
X n
i
f
i
N
i
F
i
F
i
%
0 5 0,333 5 0,333 33,3 %
1 5 0,333 10 0,667 66,7 %
2 4 0,268 14 0,933 93,3 %
3 1 0,067 15 1,000 100 %
Total 15 1,000
2. Variables Continuas
Si la variable que se estudia es continua o bien el n´ umero de resultados
posibles de una variable discreta es muy grande, es conveniente agrupar
las observaciones en intervalos de clase.
Ejemplo 1.2.3 Se tienen las edades de 50 pacientes que han sido aten-
didos en la consulta m´edica, referentes a problemas de stress, los datos
se presentan en la tabla siguiente:
20 22 23 23 24 24 25 25 25 26
26 27 27 28 30 30 30 30 30 31
32 34 34 34 36 36 36 36 37 37
37 37 37 37 38 38 38 38 38 40
40 41 42 42 42 43 44 45 45 48
En este caso como la variable es cuantitativa continua la cantidad de
categor´ıas posibles son infinitas, por lo cual no se pueden representar
f´acilmente en la tabla. Por lo cual se procede de la siguiente forma:
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 12
Ejemplo 1.2.4 Para el ejemplo de tiempo de duraci´on de ampolletas,
se tiene la tabla de frecuencias:
Intervalos de Clase Marca de Clase n
i
f
i
N
i
F
i
F
i
%
17 −18 17,5 2 0,20 2 0,20 20 %
18 −19 18,5 4 0,40 6 0,60 60 %
19 −20 19,5 3 0,30 9 0,90 90 %
20 −21 20,5 1 0,10 10 1,00 100 %
Total 10 1,00
3. Notas:
a) Es usual que los intervalos de clase sean de igual longitud.
b) El criterio utilizado para definir el n´ umero de intervalos (k) cuando
la cantidad de observaciones es un n´ umero peque˜ no es:
k =

N .
c) Cuando el n´ umero de observaciones es muy grande se prefiere:
k = 1,6 ln N .
d) Otra posibilidad para el n´ umero de intervalos es la f´ormula de
Sturges:
NI = 1 + 3,3 ln N .
e) Adem´as la amplitud del intervalo esta dado por:
a =
X
Max
−X
Min
k
.
f ) En una tabla de frecuencias con intervalos de clase se pierde in-
formaci´on, porque s´olo se conoce el intervalo al que pertenecen los
resultados. Lo usual es considerar a la marca de clase como un
valor representativo de todos los datos del correspondiente inter-
valo.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 13
g) En variables nominales no tiene sentido calcular frecuencias acu-
muladas porque no existe relaci´on de orden entre los valores posi-
bles de la variable.
Ejemplo 1.2.5 Considere las notas de 20 alumnos:
6,2 4,8 3,8 4,6 4,4
5,7 6,4 5,4 6,3 4,8
4,9 3,1 3,8 5,5 5,1
6,8 4,7 5,5 7,0 4,2
De donde, k =

20 ≈ 4,47 ≈ 4,5 ≈ 5 , R = 7,0 − 3,1 = 3,9 , y
A =
3,9
5
≈ 0,78 .
Notas Marca de Clase n
i
f
i
N
i
F
i
F
i
%
3,10 −3,88 3,49 3 0,15 3 0,15 15 %
3,88 −4,66 4,27 3 0,15 6 0,30 30 %
4,66 −5,44 5,05 6 0,30 12 0,60 60 %
5,44 −6,22 5,83 4 0,20 16 0,80 80 %
6,22 −7,00 6,61 4 0,20 20 1,00 100 %
Total 20 1,00
1.2.3. Representaci´on Gr´afica
1. Diagrama de Tallo y Hojas:
Otra alternativa para estudiar la variabilidad consiste en estudiar los
datos usando un diagrama de “Tallo y Hojas”. Tiene la ventaja de
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 14
retener todo el detalle de los datos originales y al mismo tiempo permite
ordenarlos r´apidamente.
Cada dato num´erico se divide en dos partes: el (los) d´ıgito(s) princi-
pal(es) se convierte(n) en el tallo, y el (los) d´ıgito(s) secundario(s) en
hojas.
Ejemplo 1.2.6 Consideremos los siguientes datos de la tabla:
13 18 15 12 14 13
13 18 10 14 13 13
13 18 15 14 17 13
17 12 17 18 14 15
17 13 10 18 17 15
Entonces el diagrama de tallo y hojas es el siguiente:
2 1 00
2 1
4 1 22
12 1 33333333
16 1 4444
14 1 5555
10 1
10 1 77777
5 1 88888
Ejemplo 1.2.7 Consideremos los siguientes datos de la tabla:
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 15
-5.5 -3.4 -1.3 1.7 1.4 3.6
-1.9 -7.6 -1.2 1.7 -1.0 5.8
-5.2 -4.2 5.8 4.5 6.6 6.9
-4.2 2.5 4.0 2.4 -3.6 4.7
0.8 -0.9 -1.6 -4.3 1.7 -1.3
Entonces el diagrama de tallo y hojas es el siguiente:
1 -7 6
1 -6
3 -5 52
6 -4 322
8 -3 64
8 -2
14 -1 963320
15 -0 9
15 0 8
14 1 4777
10 2 45
8 3 6
7 4 057
4 5 88
2 6 69
2. Diagrama Circular o Torta:
El diagrama Circular permite representar las frecuencias porcentuales
de las categor´ıas de una variable cualitativa nominal.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 16
Ejemplo 1.2.8 Consideremos los datos del ejemplo de preferencias de
color para un envase, el gr´afico asociado es el siguiente:
Fracuencias
α =
n
i
N
· 360 .
3. Diagrama de Puntos o Dot-plot:
Este tipo de gr´afico permite exhibir r´apidamente los datos sobre la
recta real. Consiste b´asicamente en una recta horizontal, bajo la cual
se marcan los valores m´ınimo y m´aximo, y se completa con los dem´as
valores en incrementos espaciados.
Se marca el valor observado con una • o una sobre el valor correspon-
diente en la recta. Si hay dos o m´as unidades con el mismo valor de la
variable ubicarlos verticalmente.
Ejemplo 1.2.9 Consideremos los datos obtenidos al calibrar un ins-
trumento de medici´on:
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 17
4. Gr´afico de Barras:
En variables discretas la mejor forma de representar las frecuencias es
mediante un gr´afico de barras en el que se colocan los valores posibles
de la variable en el eje horizontal y las frecuencias relativas en el eje
vertical.
Ejemplo 1.2.10 Consideremos los datos de las ventas de autom´ovil
en las 15 distribuidoras. Su gr´afico de barras asociado es:
5. Histograma:
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 18
Un histograma es una representaci´ on gr´afica de las frecuencias rela-
tivas.
En variables continuas el histograma se construye a partir de rect´angu-
los para cada uno de los intervalos de clase; en estos rect´angulos, la base
corresponde al intervalo de clase y la altura es la frecuencia relativa del
intervalo, es claro que el ´area no corresponde a la frecuencia relativa,
salvo en el caso que la longitud del intervalo sea la unidad.
Ejemplo 1.2.11 Considere los siguientes datos:
271 301 301 312
312 314 317 319
324 325 329 334
335 337 342 349
351
El histograma asociado es el siguiente:
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 19
6. Poligono de Frecuencias:
Los poligonos de frecuencias permiten representar las distribuciones de
uno m´as grupos de datos, y adem´as como se representan las frecuen-
cias relativas o porcentuales es f´acil comparar el comportamiento de la
variable en los grupos.
Ejemplo 1.2.12 Consideremos los datos del ejemplo anterior:
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 20
7. Ojiva:
Es un poligoo de frecuencias, pero permite representar las frecuencias
acumuladas, de tal forma que pueda establecer para los distintos inter-
valos cu´al grupo presenta mayor frecuencia relativa o porcentaje para
un determinado punto de la variable.
Ejemplo 1.2.13 Consideremos los datos del ejemplo anterior:
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 21
Nota hist´orica:
La primera aplicaci´on de metodolog´ıa estad´ıstica, corresponde a fines del
siglo XIX y retrata a una gran mujer, Florence Nightingale, quien realiz´o im-
portantes aportes a la medicina y a la estad´ıstica.
En la Guerra de Crimea (1854-1856), ella grafic´o la incidencia de las
muertes previsibles en el hospital del frente de batalla por las malas condi-
ciones sanitarias.
Desarroll´o un diagrama de ´area polar, a fin de ilustrar la necesidad de la
reforma en las condiciones de atenci´on.
Nightingale, revolucion´ o el sistema y mostr´o que un fen´omeno social pod´ıa
ser medido objetivamente, y estudiado mediante un an´alisis matem´atico.
Luego de este estudio, la tasa de mortalidad baj´o de un 42.7 % a un 2.2 %.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 22
El diagrama, muestra la evoluci´ on de las causas de mortalidad en el Ej´erci-
to en el Oriente a fines de 1858.
Se observa que la mayor´ıa de los soldados brit´anicos que murieron durante
la guerra de Crimea, fue producto de una enfermedad (azul) en lugar de
heridas u otras causas (rojo o negro).
Tambi´en, se puede apreciar que la tasa de mortalidad fue mayor en el
primer a˜ no de la guerra (mitad derecha del diagrama), antes de que la
Comisi´on Sanitaria llegara en marzo de 1855 para mejorar la higiene en los
campamentos y hospitales.
1.3. Medidas de Tendencia Central
Las medidas de Tendencia Central, son valores alrededor de los cuales las
observaciones tienden a concentrarse
1
.
1.3.1. Media Arm´onica (H(X)).
Definici´on 1.3.1 Sean x
1
, x
2
, . . . , x
n
los valores observados de una variable
X, entonces denominamos como media arm´onica a:
H(X) =
n
n

i=1
1
x
i
=
n
1
x
1
+
1
x
2
+· · · +
1
x
n
.
Ejemplo 1.3.1 Consideremos el conjunto de datos que consta de 5 valores:
3, 4, 6, 6 y 8, entonces:
H(X) =
5
1
3
+
1
4
+
1
6
+
1
6
+
1
8
=
5
25
24
= 4,8 .
1
A estos indicadores llamaremos Estad´ıgrafos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 23
1.3.2. Media Geom´etrica (G(X)).
Definici´on 1.3.2 Sean x
1
, x
2
, . . . , x
n
los valores observados de una variable
X, entonces denominamos como media geom´etrica a:
G(X) =
n
¸
¸
¸
_
n

i=1
x
i
=
n

x
1
· x
2
· · · x
n
.
Ejemplo 1.3.2 Consideremos el conjunto de datos que consta de 5 valores:
3, 4, 6, 6 y 8, entonces:
G(X) =
5

3 · 4 · 6 · 6 · 8 = 5,1 .
1.3.3. Media Aritm´etica o Promedio (µ
X
, ¯ x o M(X)).
Definici´on 1.3.3 Sean x
1
, x
2
, . . . , x
n
los valores observados de una variable
X, entonces denominamos como media o promedio a
2
:
µ
X
=
x
1
+ x
2
+· · · + x
n
n
=
n

i=1
x
i
n
.
Ejemplo 1.3.3 Consideremos el conjunto de datos que consta de 5 valores:
3, 4, 6, 6 y 8, entonces:
µ
X
=
3 + 4 + 6 + 6 + 8
5
=
27
5
= 5,4 .
2
Se denota con µ
X
a la media aritm´eticapoblacional y con ¯ x a la media aritm´etica
muestral.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 24
Nota: La media es un punto de equilibrio en el siguiente sentido:
Si d
i
= x
i
− ¯ x representa el desv´ıo de la i-´esima observaci´on con respecto
a la media, entonces d
1
+d
2
+· · · + d
n
= 0.
Es decir, los desv´ıos por bajo la media son compensados por los desv´ıos
por sobre la media.
En el ejemplo anterior los desv´ıos correspondientes son d
1
= 3 − 5,4,
d
2
= 4 −5,4, d
3
= d
4
= 6 −5,4, d
5
= 8 −5,4, cuya suma es cero.
Ejemplo 1.3.4 Consideremos la siguiente tabla con datos:
Muestra x
1
x
2
x
3
x
4
x
5
¯ x
A 2 3 4 5 6 4
B 2 4 4 4 6 4
C 1 5 4 5 5 4
D 4 4 4 4 4 4
La lista anterior se puede extender con todas las colecciones de cinco n´ umeros
cuya suma sea 20.
Nota: La media es una caracter´ıstica del comportamiento de los datos
que puede ser utilizada como un indicador (p.e. de rendimiento), pero no
se puede pretender que un s´olo n´ umero nos d´e una idea de la forma del
comportamiento de los datos.
Propiedades de la Media:
Sean X e Y variables aleatorias, y a, b y c constantes.
µ(c) = c.
µ(X ±b) = µ(X) ±b.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 25
µ(aX ±b) = aµ(X) ±b.
µ(aX ±bY ) = aµ(X) ±bµ(Y ).
Ejemplo 1.3.5 Considere la siguiente tabla con edades de varones, que tra-
bajan en una empresa manufacturera.
56 41 49 56 48 47 46 53 51 52 47 42
56 49 48 52 50 43 58 38 54 46 47 58
47 48 52 57 51 47 55 46 41 48 47 56
54 48 51 52 50 44 47 43 49 53 51 52
49 46 62 51 51 47 51 50 49 53 52 33
Para este caso el valor de ¯ x = 49,50 a˜ nos.
Cuando los datos est´an agrupados en una tabla de frecuencias, con k
intervalos de clase, el procedimiento para calcular ¯ x es el siguiente:
¯ x =
x
1
n
1
+ x
2
n
2
+· · · + x
k
n
k
n
=
k

i=1
x
i
n
i
n
,
note que en este caso x
i
no es la observaci´ on i, sino corresponde a la i-´esima
marca de clase.
Ejemplo 1.3.6 Ahora construyamos la tabla de frecuencias: k =

60 ≈
7,75 ≈ 8, R = 62 −33 = 29, entonces LI =
29
8
≈ 3,63.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 26
Int. de Clase M. de C. x
i
n
i
f
i
f
i
% N
i
F
i
F
i
% x
i
n
i
33,00 −36,63 34,82 1 0,017 1,7 % 1 0,017 1,7 % 34,8
36,63 −40,26 38,45 1 0,017 1,7 % 2 0,033 3,3 % 38,4
40,26 −43,89 42,08 5 0,083 8,3 % 7 0,117 11,7 % 210,4
43,89 −47,52 45,71 13 0,217 21,7 % 20 0,333 33,3 % 594,2
47,52 −51,15 49,34 20 0,333 33,3 % 40 0,667 66,7 % 986,7
51,15 −54,78 52,97 11 0,183 18,3 % 51 0,850 85,0 % 582,6
54,78 −58,41 56,60 8 0,133 13,3 % 59 0,983 98,3 % 452,8
58,41 −62,04 60,23 1 0,017 1,7 % 60 1,000 100,0 % 60,2
Total 60 1 100 % 2960,1
Ahora, al calcular el valor de ¯ x se obtiene: ¯ x =
2960,1
60
≈ 49,33 a˜ nos.
1.3.4. Media Ponderada (µ
P
, ¯ x
P
).
Definici´on 1.3.4 Sean x
1
, x
2
, . . . , x
n
los valores observados en una variable
X y w
1
, w
2
, . . . , w
n
n´ umeros no negativos cuya suma es 1, entonces denomi-
namos media ponderada de n observaciones a:
¯ x
P
=
n

i=1
w
i
x
i
= w
1
x
1
+ w
2
x
2
+· · · + w
n
x
n
, con
n

i=1
w
i
= 1 .
Si la variable en la muestra tiene k valores distintos (k ≤ n) que aparecen
con frecuencias n
1
, n
2
, . . . , n
k
, entonces la media puede ser obtenida como:
¯ x =
n
1
x
1
+ n
2
x
2
+· · · + n
k
x
k
n
=
k

i=1
n
i
x
i
n
,
= f
1
x
1
+ f
2
x
2
+ . . . + f
k
x
k
=
k

i=1
f
i
x
i
,
donde f
i
es la frecuencia relativa de la observaci´on x
i
, con i = 1, 2, . . . , k.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 27
Note que en este caso w
i
= f
i
. Adem´as, si la poblaci´on fue dividida
en p grupos, cada uno con tama˜ no n
i
, con i = 1, 2, . . . , p, con ¯ x
i
la media
correspondiente al grupo i, entonces el valor de la media poblacional es:
¯ x =
p

i=1
¯ x
i
n
i
p

i=1
n
i
.
Ejemplo 1.3.7 En un estudio de 92 personas de tres grupos sobre la altura
media en cierta compa˜ n´ıa, se obtuvieron los siguientes resultados, separados
seg´ un tramo de edad:
¯ x
1
= 158,5mt. , n
1
= 34
¯ x
2
= 172,3mt. , n
2
= 30
¯ x
3
= 163,1mt. , n
3
= 28
Ejemplo 1.3.8 Y el valor de la media poblacional es:
¯ x =
¯ x
1
n
1
+ ¯ x
2
n
2
+ ¯ x
3
n
3
n
1
+ n
2
+ n
3
,
=
158,5 ×34 + 172,3 ×30 + 163,1 ×28
34 + 30 + 28
,
=
5389 + 5169 + 4566,8
92
=
15124,8
92
= 164,4mt.
Adem´as, si w
i
= 1/n, para todo i, entonces ¯ x
P
= ¯ x.
1.3.5. Media Recortada en α% .
Definici´on 1.3.5 Se llama media recortada en α a un promedio o media que
no considera una proporci´on α de las observaciones en cada extremos de las
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 28
observaciones ordenadas de menor a mayor (Corte sim´etrico)
3
.
El objetivo es eliminar la influencia de las observaciones m´as extremas,
asignandoles peso cero.
Ejemplo 1.3.9 Calculemos la media de los siguientes datos que correspon-
den al n´ umero de bibliotecas por regi´on.
68 (I) 78 (II) 52 (III) 74 (IV) 214 (V) 84 (VI)
75 (VII) 186 (VIII) 125 (IX) 105 (X) 33 (XI) 47 (XII)
855 (XIII)
¯ x =
68 + 78 + 52 + 74 + 214 + 84 + 75 + 186 + 125 + 105 + 33 + 47 + 855
13
=
1996
13
= 153,5bibliotecas.
y la media recortada a un 10 % es
¯ x
,1
=
68 + 78 + 52 + 74 + 214 + 84 + 75 + 186 + 125 + 105 + 47
11
= 100,7bibliotecas.
1.3.6. Moda (Mo(X)).
Definici´on 1.3.6 La moda, como su nombre lo indica, corresponde a la ob-
servaci´on m´as frecuente o que se repite m´as veces.
Ejemplo 1.3.10 Considere los siguientes conjuntos de datos:
1, 2, 3, 4, 5, 6, 7, 8, 9, y la moda para este grupo no existe.
1, 1, 2, 2, 3, 3, 3, 3, 4, y la moda para este grupo es Mo(X) = 3.
1, 1, 2, 2, 3, 4, 4, 5, 6, y la moda para este grupo es Mo(X)
1
= 1,
Mo(X)
2
= 2 y Mo(X)
3
= 4.
3
Es t´ıpico tomar α = 5 % o bien α = 10 %.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 29
Seg´ un lo anterior, el valor modal puede existir o no, si existe este valor
puede ser no ´ unico, en ese caso se habla de bimodal, trimodal, multimodal.
En el caso de tener s´olo un valor modal, se habla de unimodal.
En el caso que los datos se encuentren tabulados, la forma de calcular la
moda es la siguiente:
1. Primero, identificar el o los intervalos que contienen el valor modal, es
decir, el intervalo con mayor frecuencia absoluta o relativa.
2. Determinar el valor de
Mo(X) = LI
i
+
_
n
i
−n
i−1
(n
i
−n
i−1
) + (n
i
−n
i+1
)
_
a
i
,
donde a
i
es la amplitud del i-´esimo intervalo.
3. Si existe m´as de un intervalo repetir el c´alculo anterior.
Ejemplo 1.3.11 Retomemos el ejemplo anterior de las edades, en este caso
i = 5, LI
5
= 47,52, n
5
= 20, n
4
= 13, n
6
= 11 y a
5
= 3,63, entonces:
Mo(X) = 47,52 +
_
20 −13
(20 −13) + (20 −11)
_
3,63 ,
= 47,52 +
_
7
16
_
3,63 = 47,52 + 1,588 ,
= 49,108 ≈ 49,11a˜ nos.
Pero si nos referimos a los datos sueltos, el valor que m´as se repite es 47
a˜ nos.
1.3.7. Mediana (Me(X)).
Definici´on 1.3.7 Es la realizaci´on u observaci´on que ocupa la posici´on que
divide en dos partes iguales al conjunto de datos previamente ordenados de
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 30
menor a mayor, es decir, el 50 % de las observaciones son menores a este
valor y el 50 % restante son valores mayores a esta observaci´on.
Si el n´ umero de observaciones es impar, entonces, el valor de la mediana
coincide con la observaci´ on central, en cambio si el n´ umero de observaciones
es par, el valor de la mediana ser´a la media de los dos valores centrales.
Ejemplo 1.3.12 Considere los siguientes conjuntos de datos:
1, 2, 3, 4, 5, 6, 7, 8, 9, y la mediana para este grupo Me(X) = 5.
1, 2, 3, 4, 5, 6, 7, 8, y la mediana para este grupo es Me(X) =
4+5
2
=
4,5.
En el caso de que los datos ya se encuentren tabulados, el procedimiento
es el siguiente:
Me(X) = LI
i
+
_
N
2
−N
i−1
_
a
i
n
i
.
En el caso del ejemplo anterior se tiene que i = 5, LI
5
= 47,52, N = 60,
N
4
= 20, a
5
= 3,63 y n
5
= 20, entonces:
Me(X) = 47,52 +
_
60
2
−20
_
3,63
20
,
= 47,52 + 10 ×0,1815 = 49,335 ≈ 49,34a˜ nos.
Si se calcula directamente con los datos sueltos, la Me(X) =
49+50
2
=
49,5a˜ nos, donde las observaciones 49 a˜ nos y 50 a˜ nos corresponden a las
posicines 30 y 31, respectivamente.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 31
1.3.8. Comentarios
:
1. La Media Arm´onica, se utiliza principalmente para obtener un valor
representativo de un conjunto de datos expresados en forma de tasas,
esto es, tantas unidades de un tipo por cada unidad de otras especies.
2. La Media Geom´etrica, se utiliza principalmente para: 1) promediar
porcentajes, ´ındices y cifras relativas; y 2) determinar el incremento
porcentual promedio en ventas, producci´on u otras actividades o series
econ´omicas de un periodo a otro.
3. Las Medias Geom´etrica y arm´onica tienden a reducir la influencia de
valores grandes y a destacar la de los valores peque˜ nos. El c´alculo de
estas dos estad´ısticas exige que los valores de la variable sean positivos.
4. La Media Aritm´etica, se utiliza principalmente cuando la distribuci´on
de los datos es aceptablemente sim´etrica.
5. La Media Ponderada, se utiliza principalmente cuando se sabe que al-
gunos datos tienen mayor importancia dentro de la muestra.
6. La Media Recortada, se utiliza principalmente cuando los datos ex-
tremos son muy an´omalos y se alejan mucho del centro de los datos.
7. La Moda, se utiliza principalmente cuando la variable que se est´a es-
tudiando es cualitativa nominal.
8. La Mediana, se utiliza cuando la variable en estudio es al menos ordinal.
1.4. Medidas de Posici´on
Las medidas de posici´on, nos permiten cuantificar en qu´e posici´on se
encuentra una observaci´on dentro de un conjunto de datos previamente or-
denado de menor a mayor.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 32
1.4.1. M´ınimo (X
Min
).
Corresponde a la observaci´ on m´as peque˜ na, y se encuentra en la primera
posici´on.
1.4.2. M´aximo (X
Max
).
Corresponde a la observaci´ on m´as grande, y se encuentra en la ´ ultima
posici´on.
1.4.3. Percentiles( P
α
).
Los percentiles corresponden a ciertos valores de las observaciones que
dejan un determinado porcentaje de observaciones por bajo este valor. En
general se designa como P
α
, que representa la valor del percentil que deja
α% de las observaciones por bajo de este valor.
Definici´on 1.4.1 Para un n´ umero α ∈ [0, 100] se denomina percentil α a
un n´ umero x
α
tal que la frecuencia relativa acumulada en x
α
es α% de las
observaciones, es decir:
F
x
α
= α% .
Los percentiles se calculan de manera diferente seg´ un sea la variable disc-
reta o continua.
1. Variable Discreta.
En este caso el percentil α se define como x
α
: el menor n´ umero x tal
que F
x
α
≥ α.
Recordemos el ejemplo de venta de autom´oviles, el percentil 50 es P
50
=
1, esto quiere decir que el 50 % de los distribuidores vende un auto o
menos, el percentil 93 corresponde a P
93
= 2 y ´esto significa que el 93 %
de los distribuidores vende dos o menos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 33
2. Variable Continua.
En esta situaci´on, se puede encontrar el intervalo de clase en el cual
est´a el percentil α mediante la frecuencia relativa acumulada en la tabla
de frecuencias. El procedimiento es similar al c´alculo de la mediana,
utiliz´andose para ´esto la siguiente f´ormula:
P
α
= LI
i
+
_
α ×n
100
−N
i−1
_
a
i
n
i
.
Ejemplo 1.4.1 Retomemos el ejemplo anterior, y calculemos el P
75
,
en este caso i = 6, LI
6
= 51,15, n = 60, α = 75, N
5
= 40, a
6
= 3,63 y
n
6
= 11, entonces:
P
75
= 51,15 + (60 ×0,75 −40)
3,63
11
,
= 51,15 + 5 ×0,33 = 52,8a˜ nos .
Notas:
Los percentiles no tienen sentido en variables nominales en las que no
se puede ordenar las observaciones de menor a mayor.
Los percentiles dependen de la forma seg´ un la que se ha construido la
tabla de frecuencias; ´esto significa que no existe una forma ´ unica para
obtener los percentiles. (a menos que conozcamos la distribuci´on de los
datos.).
Para datos no agrupados es usual calcular los percentiles del siguiente
modo: se supone que la observaci´ on ordenada que ocupa el lugar i
corresponde al percentil:
k =
i −1
n −1
×100 .
Otra forma es definir a la observaci´ on ya ordenada, n´ umero i como
correspondiente al percentil:
k =
i
n + 1
×100 .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 34
Para calcular percentiles correspondientes a otros valores de k se ocupan
interpolaciones.
Se denominan Cuartiles a:
C
1
= P
25
, C
2
= P
50
= Me(X), C
3
= P
75
.
De la misma forma se denominan Quintiles a:
Q
1
= P
20
, Q
2
= P
40
, Q
3
= P
60
, Q
4
= P
80
.
Deciles a:
D
1
= P
10
, D
2
= P
20
, . . . , D
9
= P
90
.
1.4.4. Diagrama de Caj´on o Box-Plot:
El diagrama de caj´on (Box-Plot) denominado tambi´en caj´on con bigotes,
es una representaci´ on gr´afica de los datos basado en 5 n´ umeros: m´ınimo,
primer cuartil, mediana, tercer cuartil y m´aximo.
La l´ınea vertical que se dibuja desde el tercer cuartil hacia arriba, ge-
neralmente se extiende hasta el mayor valor que est´a a una distancia de
1.5(C
3
− C
1
) del tercer cuartil. An´alogamente, la l´ınea que sale del primer
cuartil, hacia abajo, se extiende hasta el menor valor que est´a a una distancia
de 1.5(C
3
−C
1
) del primer cuartil.
Los datos que est´en fuera de estos rangos se denominan “outliers” u
observaciones an´omalas.
Ejemplo 1.4.2 El Box-plot para los datos de edades es:
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 35
1.5. Medidas de Variabilidad o de Dispersi´on
Estas medidas son estad´ıgrafos que permiten medir la dispersi´on de un
conjunto de datos. Los m´as importantes son aquellos que representan las
desviaciones de las observaciones respecto a alguna medida de tendencia cen-
tral.
1.5.1. Amplitud o Rango (R).
Definici´on 1.5.1 Corresponde a la mayor diferencia que existe entre dos
observaciones de un conjunto de datos.
Rango = X
Max
−X
Min
.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 36
1.5.2. Rango Intercuartil (RI).
Definici´on 1.5.2 Corresponde a la mayor diferencia que existe entre dos
observaciones del 50 % de los datos centrales.
RI = C
3
−C
1
= P
75
−P
25
.
1.5.3. Desviaci´on Media (DM).
Definici´on 1.5.3 En este caso nos interesa la magnitud de los desv´ıos, es
decir su valor absoluto. La desviaci´on media se define como:
DM =
|x
1
− ¯ x| +· · · +|x
n
− ¯ x|
n
=
n

i=1
|x
i
− ¯ x|
2
n
.
1.5.4. Varianza y Desviaci´on Est´andar (σ
2
X
, S
2
X
o VVar(X)).
Definici´on 1.5.4 Corresponde a la media de las desviaciones o diferencias
al cuadrado de las observaciones, con respecto a su media
4
.
1. Datos desagrupados (no tabulados): En este caso se tienen para X
(variable de inter´es) las n observaciones x
1
, x
2
, . . . , x
n
.
σ
2
X
=
1
n
n

i=1
(x
i
−µ)
2
=
1
n
_
n

i=1
x
2
i
−nµ
2
_
,
⇔σ
X
=
¸
¸
¸
_
1
n
_
n

i=1
x
2
i
−nµ
2
_
.
4
Se denomina Desviaci´on Est´andar a σ =

σ
2
.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 37
S
2
X
=
1
n −1
n

i=1
_
x
i

¯
X
_
2
=
1
n −1
_
n

i=1
x
2
i
−n
¯
X
2
_
,
⇔S
X
=
¸
¸
¸
_
1
n −1
_
n

i=1
x
2
i
−n
¯
X
2
_
.
2. Datos agrupados (tabulados): En este caso se tiene una tabla de fre-
cuencias con k intervalos, donde n
i
es la frecuencia absoluta del in-
tervalo i, x
i
la marca de clase del i-´esimo intervalo y n el total de
observaciones.
σ
2
X
=
1
n
_
k

i=1
n
i
x
2
i
−nµ
2
_
⇔σ
X
=
¸
¸
¸
_
1
n
_
k

i=1
n
i
x
2
i
−nµ
2
_
.
S
2
X
=
1
n −1
_
k

i=1
n
i
x
2
i
−n
¯
X
2
_
⇔S
X
=
¸
¸
¸
_
1
n −1
_
k

i=1
n
i
x
2
i
−n
¯
X
2
_
.
Propiedades de la Varianza (VVar(X)).
Sean X e Y variables aleatorias independientes, y a, b y c constantes.
VVar(X) ≥ 0.
VVar(c) = 0.
VVar(X ±b) = VVar(X).
VVar(aX ±b) = a
2
VVar(X).
VVar(aX ±bY ) = a
2
VVar(X) + b
2
VVar(Y ).
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 38
1.5.5. Coeficiente de Variaci´ on (C.V.(X)).
Definici´on 1.5.5 El coeficiente de variaci´on o de variabilidad relativa, es
una medida que entrega la dispersi´on relativa de los datos. Y permite com-
parar la homogeneidad de dos o m´as conjuntos de datos.
C.V.(X) =
σ
X
µ
X
×100 % .
El coeficeinte de variaci´on (CV ), nos entrega una forma de medir la ho-
mogeneidad de los datos, adem´as es un indicador sin unidad de medida, lo
que permite comparar distintos conjuntos de datos. Si el valor del coeficiente
de variaci´on es cercano a 0, diremos que los datos son muy homog´eneos, es
decir, son muy parecidos entre ellos, al contrario si el valor del coeficiente
de variaci´ on es muy alto, diremos que los datos son heterog´eneos, es decir,
muy diferentes entre ellos. De esa forma podemos comparar conjuntos de
datos distintos, ya sean de poblaciones o muestras distintas o de variables
con unidades de medida distintas. La interpretaci´ on ser´a:
Si 0 ≤ C.V.(X) < 25 %, los datos se dir´an Muy Homog´eneos.
Si 25 % ≤ C.V.(X) < 50 %, los datos se dir´an Homog´eneos.
Si 50 % ≤ C.V.(X) < 75 %, los datos se dir´an Heterog´eneos.
Si C.V.(X) ≥ 75 %, los datos se dir´an Muy Heterog´eneos.
Ejemplo 1.5.1 Modifiquemos la tabla del ejemplo.
Int. de Clase M. de C.x
i
n
i
x
i
n
i
x
2
i
x
2
i
n
i
[33,00, 36,63] 34,82 1 34,8 1212,08 1212,08
(36,63, 40,26] 38,45 1 38,4 1478,02 1478,02
(40,26, 43,89] 42,08 5 210,4 1770,31 8851,53
(43,89, 47,52] 45,71 13 594,2 2088,95 27156,31
(47,52, 51,15] 49,34 20 986,7 2433,94 48678,84
(51,15, 54,78] 52,97 11 582,6 2805,29 30858,20
(54,78, 58,41] 56,60 8 452,8 3202,99 25623,95
(58,41, 62,04] 60,23 1 60,2 3627,05 3627,05
Total 60 2960,1 147485,99
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 39
La µ
X
=
2960,1
60
= 49,34 a˜ nos, y el valor de la varianza es σ
2
X
=
147485,99
60

49,34
2
= 23,66 (a˜ nos)
2
, adem´as la desviaci´on est´andar es σ
X
=

23,66 =
4,87 a˜ nos, y el coeficiente de variaci´on C.V.(X) =
4,87
49,34
100 % = 9,87 %.
Ejemplo 1.5.2 Determine el coeficiente de variaci´on de Y = 3,2X + 4,
donde µ
X
= 12,1 y σ
X
= 4,3.
Como C.V.(Y ) =
σ
Y
µ
Y
× 100 %, necesitamos determinar la media de Y y
su desviaci´on est´andar.
Pero M(Y ) = M(3,2X + 4) = 3,2M(X) + 4 = 3,2 × 12,1 + 4 = 42,72.
Adem´as,
VVar(Y ) = VVar(3,2X + 4) = 3,2
2
VVar(X) = 10,24 ×4,3
2
,
= 10,24 ×18,49 = 189,3376 .
Entonces, el
C.V.(Y ) =

189,3376
42,72
×100 % =
13,76
42,72
×100 % ≈ 32,2 %.
1.6. An´alisis Bivariado
En todas las discusiones anteriores, hemos tratado las variables y su res-
pectiva informaci´on como variables aisladas, pero en general, no s´olo nos
interesa una variable espec´ıfica, sino varias de ellas, y poder descubrir las
posibles asociaciones entre dos o m´as variables.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 40
1.6.1. Tablas de Doble Entrada.
Definici´on 1.6.1 Estas tablas son un arreglo que consta de filas y columnas,
que corresponden a distintas categ´ıas, y en las celdas se anota la frecuencia
absoluta de la realizaci´on de dos variables aleatorias simult´aneamente.
Sean X e Y variables aleatorias, con I y J categor´ıas, respectivamente. Y
sea n
ij
la frecuencia absoluta de las caracter´ısticas (X
i
, Y
j
). La informaci´on
se puede resumir de la siguiente forma:
Y Total
n
11
n
12
· · · n
1J
n
1+
X n
21
n
22
· · · n
2J
n
2+
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
n
I1
n
I2
· · · n
IJ
n
1+
Total n
+1
n
+2
· · · n
+J
n
++
Note que n
i+
corresponde a la i-´esima frecuencia absoluta de la variable X
5
, y
n
+j
corresponde a la j-´esima frecuencia absoluta de la variable Y
6
. Adem´as,
n
i+
=
J

j=1
n
ij
, n
+j
=
I

i=1
n
ij
, n
++
=
I

i=1
J

j=1
n
ij
.
Ejemplo 1.6.1 Considere la siguiente tabla con la informaci´on de puntajes
obtenidos en un test, seg´ un tramo de edad.
5
Este total corresponde a la frecuencia marginal de X
6
Este total corresponde a la frecuencia marginal de Y .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 41
Y : Edades de postulantes
25 −27 27 −29 Frec. Marg.
X : Puntajes x
i
y
j
26 28 de X
30 −40 35 5 10 15
40 −50 45 6 10 16
50 −60 55 10 8 18
Frec. Marg. de Y 21 28 49
1.6.2. An´alisis Condicional.
En muchas ocasiones no interesa por completo la tabla de doble entrada
sino alg´ un aspecto espec´ıfico de ella, es decir, ya poseemos cierta informaci´on
que nos permite acotar el estudio.
Ejemplo 1.6.2 De la tabla anterior nos interesa saber la media de puntajes,
dado que las personas son menores de 27 a˜ nos.
En este caso debemos determinar la tabla de distribuci´on de frecuencias
condicional dado que Y ≤ 27.
Y ≤ 27
Puntajes x
i
25 −27 x
i
n
i
30 −40 35 5 175
40 −50 45 6 270
50 −60 55 10 550
Total 21 995
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 42
Entonces,
µ
X|Y ≤27
=
995
21
≈ 43,38puntos.
Ejemplo 1.6.3 De la tabla anterior, nos interesa saber la media de edad,
dado que las personas lograron menos de 45 puntos.
En este caso, debemos determinar la tabla de distribuci´on de frecuencias
condicional dado que X < 45.
X < 45
Edad y
j
30 −40 ∧ 40 −50 y
j
n
j
25 −27 26 5 + 6 = 11 286
27 −29 28 10 + 10 = 20 560
Total 31 846
Luego,
µ
Y |X<45
=
846
31
≈ 27,29a˜ nos.
Ejemplo 1.6.4 La siguiente tabla corresponde a las alturas de 151 personas
de una empresa, separadas por sexo. Donde X es la altura en cent´ımetros,
Y = 0 (Mujer) e Y = 1 (Hombre). Determine la media, moda y mediana de
X.
Y : Sexo
Muj. Hom. Frec. Marg.
X : Altura x
i
y
j
0 1 de X x
i
n
i
h
i
H
i
155 −160 157,5 30 15 45 7087,5 0,298 0,298
160 −165 162,5 25 32 57 9262,5 0,378 0,676
165 −170 167,5 17 20 37 6197,5 0,245 0,921
170 −175 172,5 3 9 12 2070 0,079 1,000
Frec. Marg. de Y 75 76 151 24617,5
µ
X
=
24617,5
151
≈ 163,03cm.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 43
Mo(X) = 160 +

57 −45
(57 −45) + (57 −37)
«
5 ,
= 160 +

12
12 + 20
«
5 ,
= 160 +

12
32
«
5 ,
≈ 160 + 1,875 ≈ 161,875cm.
Me(X) = 160 +

151
2
−45
«
5
57
,
= 160 + (75,5 −45)
5
57
,
≈ 160 + 30,5 ×0,088 ,
≈ 160 + 2,684 ≈ 162,684cm.
Ejemplo 1.6.5 Determine la distribuci´on condicional de X dado Y = 0 y
su respectiva media, moda y mediana.
Y = 0
Altura x
i
(Mujeres) x
i
n
i
h
i
H
i
155 −160 157,5 30 4725 0,400 0,400
160 −165 162,5 25 4062,5 0,333 0,733
165 −170 167,5 17 2847,5 0,227 0,960
170 −175 172,5 3 517,5 0,040 1,000
Total 75 12152,5
µ
X|Y =0
=
12152,5
75
≈ 162,03cm.
Mo(X|Y = 0) = 155 +

30 −0
(30 −0) + (30 −25)
«
5 ,
= 155 +

30
30 + 5
«
5 ,
= 155 +

30
35
«
5 ,
≈ 155 + 0,857 ≈ 159,286cm.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 44
Me(X|Y = 0) = 160 +

75
2
−30
«
5
25
,
= 160 + (37,5 −30)
5
25
,
≈ 160 + 7,50 ×0,20 ,
≈ 160 + 1,50 ≈ 161,50cm.
Ejemplo 1.6.6 Determine la distribuci´on condicional de X dado Y = 1 y
su respectiva media, moda y mediana.
Y = 1
Altura x
i
(Hombres) x
i
n
i
h
i
H
i
155 −160 157,5 15 2362,5 0,197 0,197
160 −165 162,5 32 5200 0,421 0,618
165 −170 167,5 20 3350 0,263 0,881
170 −175 172,5 9 51552,5 0,118 1,000
Total 76 12465
µ
X|Y =1
=
12465
76
≈ 164,01cm.
µ
X|Y =1
=
12465
76
≈ 164,01cm.
Mo(X|Y = 1) = 160 +

32 −15
(32 −15) + (32 −20)
«
5 ,
= 160 +

17
17 + 12
«
5 ,
= 160 +

17
29
«
5 ,
≈ 160 + 2,93 ≈ 162,93cm.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 45
Me(X|Y = 1) = 160 +

76
2
−15
«
5
32
,
= 160 + (38 −15)
5
32
,
≈ 160 + 23 ×0,156 ,
≈ 160 + 3,588 ≈ 163,588cm.
1.6.3. Covarianza
En los an´alisis bivariados obtenemos la informaci´on de las frecuencias
absolutas de un suceso bajo dos variables aleatorias, pero adem´as nos interesa
saber la relaci´on que existe entre estas dos variables.
As´ı como la varianza es una forma de medir la variabilidad de una variable
de inter´es, la covarianza nos permite medir la variabilidad conjunta de dos
variables X e Y
7
.
1. Datos no agrupados: Sean x
1
, . . . , x
n
e y
1
, . . . , y
n
las respectivas obser-
vaciones para las variables X e Y , adem´as sean µ
X
y µ
Y
, las respectivas
medias de las variables. La covarianza se denota por σ
XY
8
.
σ
XY
=
1
n
_
n

i=1
x
i
y
i
−nµ
X
µ
Y
_
=

n
i=1
x
i
y
i
n
−µ
X
µ
Y
.
2. Datos agrupados: En este caso se tiene una tabla con frecuencias con-
juntas para las variables X e Y , es decir, se tiene una tabla con I filas
7
El lector debe poner atenci´on en que, la covarianza de una variable X con sigo misma,
es decir, σ
XX
= σ
2
X
corresponde a la varianza de la variable X.
8
Tambi´en se suele utilizar Cov(X, Y ).
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 46
para X y J columnas para Y , donde n
ij
corresponde a la frecuencia
absoluta observada en la celda que se genera al intersectarse la fila i
con la columna j, con i = 1, . . . , I y j = 1, . . . , J.
σ
XY
=
1
n
_
I

i=1
J

j=1
n
ij
x
i
y
j
−nµ
X
µ
Y
_
=

I
i=1

J
j=1
n
ij
x
i
y
j
n
−µ
X
µ
Y
.
Ejemplo 1.6.7 Considere el siguiente ejemplo:
Edades de postulantes
25 −27 27 −29 Frec. Marg. x
i
n
i
Puntajes x
i
y
j
26 28 de X
30 −40 35 5 10 15 525
40 −50 45 6 10 16 720
50 −60 55 10 8 18 990
Frec. Marg. de Y 21 28 49 2235
y
j
n
j
546 784 1330
Luego, µ
X
=
2235
49
= 45,61a˜ nos y µ
Y
=
1330
49
= 27,14a˜ nos.
Entonces,
Cov(X, Y ) =
35 · 26 · 5 + 35 · 28 · 10 + 45 · 26 · 6 + 45 · 28 · 10 + 55 · 26 · 10 + 55 · 28 · 8
49
−45,61 · 27,14
=
60590
49
−45,61 · 27,14
= 1236,53 −45,61 · 27,14
= 1236,53 −1237,86
= −1,33a˜ nos ×puntos .
1.7. Correlaci´on
En la secci´on anterior hemos visto como las tablas bivariadas nos permiten
tener una idea del comportamiento de las observaciones cuando ´estas son
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 47
medidas de forma conjunta, y como determinar las respectivas distribuciones
condicionales de las variables.
Pero muchas veces nos interesa, adem´as, saber cu´al es la relaci´on que
existe entre estas dos variables, es decir, cu´anto se afectan la una a la otra.
Un indicador que nos permite responder a las necesidades anteriores, es
el coeficiente de correlaci´on.
1.7.1. Coeficiente de Correlaci´on Lineal de Pearson (ρ
XY
o r
XY
)
El coeficiente de correlaci´on lineal de Pearson, permite cuantificar el grado
de asociaci´on o relaci´on lineal entre las variables. Y se define como:
ρ
XY
=
σ
XY
_
σ
2
X
σ
2
Y
,
r
XY
=
n

i=1
x
i
y
i
−n¯ x¯ y
¸
¸
¸
_
_
n

i=1
x
2
i
−n¯ x
2
__
n

i=1
y
2
i
−n¯ y
2
_
.
El coeficiente de correlaci´on, cumple que: −1 ≤ r
XY
≤ 1.
Interpretaci´on:
Cuando los valores de r
XY
son cercanos a -1, se dice que las variables
X e Y tienen alta asociaci´on lineal inversa.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 48
Cuando los valores de r
XY
son cercanos a 1, se dice que las variables X
e Y tienen alta asociaci´on lineal directa
Cuando el valor de r
XY
es cero, se tienen dos situaciones, la primera si
estamos bajo normalidad en las variables, entonces se dir´a que X e Y
son independientes; en otro caso, simplemente no se sabe que tipo de
asociaci´on existe entre las variables, al menos no es lineal (p.e. puede
ser: cuadr´atica, c´ ubica, etc.).
Ejemplo 1.7.1 Consideremos los siguientes datos de un experimento sobre
mediciones espirom´etricas.
Individuo Edad (Z) Altura (X) FV C (Y ) XY X
2
Y
2
XZ Z
2
1 25 160 5.08 812.80 25600 25.8064 4000 625
2 25 159 4.89 777.51 25281 23.9121 3975 625
3 26 174 5.44 946.56 30276 29.5936 4524 676
4 26 171 4.12 704.52 29241 16.9744 4446 676
5 26 164 6.36 1043.04 26896 40.4496 4264 676
6 27 168 5.17 868.56 28224 26.7289 4536 729
7 27 170 5.52 938.40 28900 30.4704 4590 729
8 28 174 5.24 911.76 30276 27.4576 4872 784
Total 210 1340 41.82 7003.15 224694 221.3930 35207 5520
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 49
¯ x =
1340
8
≈ 167,5, ¯ y =
41,82
8
≈ 5,23
r
XY
=
7003,15 −8 ×167,5 ×5,23
_
(224694 −8 ×167,5
2
)(221,3930 −8 ×5,23
2
)
,
=
7003,15 −7008,2
_
(224694 −224450)(221,3930 −218,82)
,
=
−5,05

244 ×2,573
,
=
−5,05

627,812
,
=
−5,05
25,01
,
≈ −0,202 .
Ejemplo 1.7.2 Consideremos la tabla anterior y calculemos la correlaci´on
entre Edad y Altura.
¯ x =
1340
8
≈ 167,5, ¯ z =
210
8
≈ 26,25
r
XZ
=
35207 −8 ×167,5 ×26,25
_
(224694 −8 ×167,5
2
)(5520 −8 ×26,25
2
)
,
=
35207 −35175
_
(224694 −224450)(5520 −5512,5)
,
=
32

244 ×7,5
,
=
32

1830
,
=
32
42,78
,
≈ 0,75 .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 50
1.7.2. Matrix-Plot
La matriz dfe gr´aficos permite, determinar r´apidamente si dos variables
tienen alg´ un grado de asociaci´on lineal, pero m´as a´ un, permite visualizar
todas las combinaciones posibles de las variables.
1.7.3. Concepto de Rango
La idea es ordenar las observaciones de menor a mayor y asignarles un
n´ umero correlativo a la posici´on que ocupan, el cual se denomina rango.
Ejemplo 1.7.3 Consideremos las siguientes observaciones:
9, 2, 4, 6, 3, 12 .
Ordenemos los datos de menor a mayor y asignemos un n´ umero a la posici´on
que ocupan:
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 51
Observaci´on 2 3 4 6 9 12
Posici´on o Rango 1 2 3 4 5 6
Cuando existen observaciones repetidas, el procedimiento para asignar los
rangos es el siguiente:
Ejemplo 1.7.4 Consideremos las siguientes observaciones:
9, 2, 2, 2, 4, 6, 6, 3, 12 .
Ordenemos los datos de menor a mayor y asignemos un n´ umero a la posici´on
que ocupan.
Observaci´on 2 2 2 3 4 6 6 9 12
Posici´on o Rango 1 2 3 4 5 6 7 8 9
Ejemplo 1.7.5 Ahora, calculamos la media de las posiciones para las obser-
vaciones que est´an repetidas.
Rango de empatados (2) =
1 + 2 + 3
3
=
6
3
= 2 ,
y para
Rango de empatados (6) =
6 + 7
2
=
13
2
= 6,5 ,
entonces la tabla con los rangos es:
Observaci´on 2 2 2 3 4 6 6 9 12
Posici´on o Rango 2 2 2 4 5 6.5 6.5 8 9
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 52
1.7.4. Correlaci´on de Rangos de Spearman (r
S
).
Corresponde a un estad´ıgrafo no param´etrico, y se basa en la utilizaci´on
de los rangos asignados a los respectivos valores de las variables.
Su forma es la siguiente:
r
S
= 1 −
6
n

i=1
d
2
i
n(n
2
−1)
,
donde d
i
= Rango de x
i
− Rango de y
i
, y n es el n´ umero total de obser-
vaciones.
Ejemplo 1.7.6 Retomemos los datos de Espirometr´ıa, y determinemos sus
respectivos rangos:
Edad (Z) Altura (X) Z X d
i
d
2
i
25 160 1.5 2 0.5 0.25
25 159 1.5 1 -0.5 0.25
26 174 4 7.5 3.5 12.25
26 171 4 6 2.0 4.00
26 164 4 3 -1.0 1.00
27 168 6.5 4 -2.5 6.25
27 170 6.5 5 -1.5 2.25
28 174 7 7.5 0.5 0.25
Total 26.50
r
S
= 1 −
6 ×26,50
8(8
2
−1)
,
= 1 −
159
504
,
≈ 1 −0,316 ,
≈ 0,684 .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 53
De la misma forma que el coeficiente de correlaci´on de Pearson (r
XZ
= 0,75),
´este nos indica que existe asociaci´on positiva entre las variables.
1.7.5. Correlaci´on de Punto Biserial (r
pb
).
Permite establecer la relaci´on entre una variable dicot´omica (Nominal) y
una variable cuantitativa.
Su forma es la siguiente:
r
pb
=
(¯ x
A
− ¯ x
B
)
σ
t
_
n
A
n
B
n(n −1)
,
donde ¯ x
A
y ¯ x
B
corresponden a las medias de cada grupo, σ
t
es la desviaci´on
est´andar de todos los datos, n
A
y n
B
son los respectivos tama˜ nos de los
grupos, y n es el total de observaciones.
Se utiliza para saber si las personas “adecuada” son las que obtienen las
respuestas correctas.
Ejemplo 1.7.7 Consideremos los datos de disminuci´on de grasa, en por-
centaje, seg´ un si realizaron dieta o no.
Respuesta
SI 17 18 23 16 21 14 22 15
NO 11 10 17 23 13 20 18
En este caso debemos determinar las respectivas medias de cada grupo y
la desviaci´on est´andar total.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 54
Los valores son: ¯ x
S
= 18,3, ¯ x
N
= 16,0 y σ
t
= 4,13.
r
pb
=
(18,3 −16,0)
4,13
¸
8 ×7
15(15 −1)
,
=
2,3
4,13
_
56
210
,
≈ 0,557 ×
_
0,2667 ,
≈ 0,287 .
En este caso, aunque el valor de r
pb
es mayor que cero, no es muy claro que
exista una relaci´on lineal entre la dieta y la disminuci´on de grasa.
1.7.6. Correlaci´on Phi (φ).
Permite relacionar dos variables dicot´omicas del tipo nominal.
Sea la tabla bidimensional:
Variable 2
Atributo 1 Atributo 2 Total
Variable 1 Atributo 1 a b a +b
Atributo 2 c d c +d
Total a +c b +d
Entonces la forma del coeficiente esta dado por:
φ =
a · d −b · c

w · x · y · z
,
donde w = a + c, x = b + d, y = a +b y z = c + d.
Ejemplo 1.7.8 Consideremos los datos de participaci´on en la empresa y
nivel de reconocimiento.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 55
Reconocimiento
Alto Bajo Total
Participaci´on Alta 16 12 28
Baja 34 88 122
Total 50 100
En este caso debemos determinar: w = 50, x = 100, y = 28, z = 122.
φ =
16 · 88 −12 · 34

50 · 100 · 28 · 122
,
=
1408 −408

17080000
,

1000
4132,796
,
≈ 0,2420 .
Interpretaci´on:
Si el coeficiente resulta ser positivo, entonces los valores iguales est´an
asociados entre s´ı, reflejando una relaci´on directa entre ambos atributos
de ambas variables.
Si el coeficiente resulta ser negativo, entonces existen relaciones opues-
tas entre los atributos de las variables.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 56
1.8. Ejercicios Resueltos
1. La siguiente tabla muestra las frecuencias de un grupo de trabajadores
seg´ un su nivel educacional en una industria agricola.
Nivel educacional N´ umero de trabajadores
Educaci´on B´asica 33
Educaci´on Media 45
Educaci´on T´ecnico-Profesional 24
Educaci´on Universitaria 11
a) Determine el porcentaje de trabajadores que tienen s´olo educaci´on
media.
b) Determine el porcentaje de trabajadores que a lo m´as tienen edu-
caci´on media.
c) Determine el porcentaje de trabajadores que a lo menos tienen
educaci´on media.
d) Determine la mejor medida de tendencia central.
Des.
Primero completemos la tabla con las frecuencias relativas y acumu-
ladas.
Niveleducacional n
i
f
i
N
i
F
i
f
i
×100 % F
i
×100 %
Educaci´on B´asica 33 0,292 33 0,292 29,2 % 29,2 %
Educaci´on Media 45 0,398 78 0,690 39,8 % 69,0 %
Educaci´on T´ecnico-Profesional 24 0,212 102 0,903 21,2 % 90,3 %
Educaci´on Universitaria 11 0,097 113 1,000 9,7 % 100,0 %
Total 113 1,000 100,0 %
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 57
Directamente desde la tabla se obtinen los resultados pedidos.
a) El 39,8 % de los trabajadores tiene s´olo educaci´on B´asica.
b) En este caso necesitamos el porcentaje de trabajadores que a
lo m´as tienen educaci´on media, es decir, son todos aquellos que
tienen s´olo educaci´on B´asica (29,2 %) m´as los que s´olo tienen ed-
ucaci´on media (39,8 %) que es igual a 69,0 % es el porcentaje de
trabajadores que tiene a lo m´as educaci´on Media.
c) En este caso necesitamos los porcentajes de aquellos trabajadores
que tienen educaci´on Media (39,8 %) m´as los que tienen educacion
T´ecnico-Profesional (21,2 %) m´as los con educaci´on Universitaria
(9,7 %), lo que es igual a 70,7 %.
d) La tabla resume los resultados para la variable X:Nivel educa-
cional de los trabajadores, que es una variable cualitativa ordi-
nal, ya que los resultados de la variable tienen un orden natu-
ral, por lo cual podemos determinar la mediana, en este caso es
Med(X) = Educaci´on Media.
2. Al entrevistar a 30 personas se obtuvo las siguientes preferencias de
colores para un determinado envase de desodorante, seg´ un la tabla de
c´odigos.
Color Azul Verde Rojo Morado
C´odigo 1 2 3 4
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 58
1 1 1 2 3 3 1 1 2 3
2 2 3 3 1 1 3 4 3 4
2 3 1 4 2 3 1 1 2 2
a) Construya una tabla de frecuencias.
b) Determine el porcentaje de preferencias por el color Verde.
c) Determine el porcentaje de personas que prefieren el color Azul o
Verde.
d) Determine el color m´as frecuente.
Des.
a) Sea X:Color preferido, de esta forma la variable es cualitativa
nominal.
Color n
i
f
i
1 (Azul) 10 0,333
2 (Verde) 8 0,267
3 (Rojo) 9 0,300
4 (Morado) 3 0,100
Total 30 1,000
b) El 26,7 % de los entrevistados prefiere el color Verde.
c) Sumando los porcentajes de preferencias por Azul (33,3 %) y Verde
(26,7 %), el resultado es 60,0 %.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 59
d) En este caso la Moda corresponde al valor m´as frecuente, en este
caso Mod(X) = Azul.
3. En una encuesta realizada a 25 Ingenieros en USA respecto a la op-
timizaci´on en el uso del cobre, se consult´o ¿Cu´al cree usted que es la
mejor forma de utilizar el cobre?
Forma Combinado con oro Combinado con plata Puro l´ıquido Puro s´olido
C´odigo 1 2 3 4
y los resultados son los siguientes:
2 4 2 1 2 1 1 1 2 2
3 2 1 2 4 4 4 1 3 2
4 1 2 2 2
a) Identifique y clasifique la variable en estudio.
b) Construya una tabla de frecuencias.
c) ¿Qu´e proporci´on de Ingenieros considera que debe ser utilizado
combinado con plata?
d) ¿Qu´e porcentaje de Ingenieros cree que se puede utilizar mejor el
cobre en forma combinada?
e) ¿Qu´e porcentaje de Ingenieros estima que se optimiza su uso en
cualquiera de sus estados puros?
Des.
a) Sea X:forma de uso del cobre. Cualitativa nominal.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 60
b) .
C´odigo n
i
f
i
1 7 0,280
2 11 0,440
3 2 0,080
4 5 0,200
Total 25 1,000
c) La proporci´on de Ingenieros que considera que debe ser utilizado
combinado con plata es 11 de 25 o 11/25 = 0,44.
d) El porcentaje de Ingenieros que considera que se debe utilizar
combinado es la suma de los que consideran que debe ser utilizado
combinado con oro (28,0 %) con los que consideran que debe ser
utilizado combinado con plata (44,0 %) que es igual a un 72,0 %.
e) Al igual que en el caso anterior debemos sumar los porcentajes de
los que consideran que se optimiza su uso puro l´ıquido (8,0 %) con
el porcentaje de puro s´olido (20,0 %) que es igual a un 28,0 %.
4. La siguiente informaci´on corresponde a las notas obtenidas por un
grupo de alumnos de cierto curso.
Nota N´ umero de alumnos
1-3 15
3-5 38
5-7 12
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 61
a) Determine y clasifique la variable de inter´es.
b) ¿Cu´al es la nota m´as frecuente obtenida por los alumnos?
c) ¿Cu´al es la nota media obtenida por estos alumnos?
d) ¿Cu´antos alumnos tienen una nota inferior a la nota mediana?
Determine el valor del valor mediano para la nota.
Des.
a) Sea X:Nota obtenida por un alumno. Cuantitativa Continua
9
. Con-
struimos la tabla de frecuencias:
marca de clase X n
i
f
i
N
i
x
i
2 1 −3 15 0,230 15
4 3 −5 38 0,585 53
6 3 −7 12 0,185 65
Total 65 1,000
9
Una variable continua siempre es cuantitativa, por lo cual es equivalente decir que una
variable es cuantitativa continua con s´olo decir que es una variable continua
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 62
b) Necesitamos determinar la moda de la nota.
Mo(X) = LI
i
+
_
n
i
−n
i−1
(n
i
−n
i−1
) + (n
i
−n
i+1
)
_
a
i
,
= 3 +
_
38 −15
(38 −15) + (38 −12)
_
2 ,
= 3 +
_
23
(23) + (28)
_
2 ,
= 3 +
_
23
51
_
2 ,
= 3 +
46
51
,
= 3 + 0,90 ,
= 3,90 .
c) Como los datos estan tabulados necesitamos utilizar la marca de
clase (x
i
) para este c´alculo.
µ
X
=
1
65
(2 ×15 + 4 ×38 + 6 ×12) ,
=
254
65
,
= 3,91 .
d) Directamente de la definici´on de mediana se puede concluir que
bajo este valor est´a el 50 % de las observaciones, es decir, 65 ×
(50 %/100 %) = 32,5 ≈ 33 alumnos. Para determinar el valor de
la mediana, realizamos el c´alculo previo de 65/2 = 32,5, que esta
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 63
contenido en el segundo intervalo.
Me(X) = 3 +
_
65 ×50
100
−15
_
2
38
,
= 3 + (32,5 −15)
2
38
,
= 3 + 17,5 ×
2
38
,
= 3 +
35
38
,
= 3 + 0,921 ,
= 3,921 .
5. La siguiente tabla muestra la oferta de precios para departamentos en
el centro de la ciudad.
UF Cantidad de departamentos
920-990 140
990-1050 350
1050-1200 300
1200-1400 160
a) ¿Cu´al es el precio medio de los departamentos?
b) ¿Cu´antos departamentos tienen un precio inferior a 1150 UF?
c) Determine el valor modal de los departamentos.
d) ¿Cu´al es la variaci´on de los precios de los departamentos?
Des.
Sea X: precio de los departamentos en $UF.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 64
x
i
X n
i
f
i
N
i
955 920 −990 140 0,147 140
1050 990 −1050 350 0,368 490
1125 1050 −1200 300 0,316 790
1300 1200 −1400 160 0,168 950
Total 950 1,000
a)
µ
X
=
1
950
(955 ×140 + 1020 ×350 + 1125 ×300 + 1300 ×160) ,
=
1036200
950
,
= 1090,74 UF .
b)
1150 = 1050 +
_
α ×950
100
−490
_
150
300
,
(1150 −1050) =
_
α ×950
100
−490
_
150
300
,
100 ×
300
150
=
alpha ×950
100
−490 ,
200 + 490 =
α ×950
100
,
690 ×
100
950
= α ,
α = 72,63 % .
Luego el 72,63 % de los departamentos tiene un precio inferior a
1150, entonces 950 ×(72,63 %/100 %) = 690 departamentos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 65
c)
Mo(X) = 990 +
_
350 −140
(350 −140) + (350 −300)
_
60 ,
= 990 +
_
210
210 + 50
_
60 ,
= 990 +
210
260
×60 ,
= 990 +
12600
260
,
= 990 + 48,46 ,
= 1038,46 UF .
d)
σ
2
X
=
1
950
_
(140 ×955
2
+ 350 ×1020
2
+ 300 ×1125
2
+ 160 ×1300
2
) −950 ×1090,74
2
_
,
=
1
950
(1141911000 −1130228060) ,
=
11682940
950
,
= 12297,83 (UF)
2
,
σ
X
= 110,90 UF .
6. La siguiente tabla muestra el gasto anual en electricidad (en millones
de pesos) de 200 personas.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 66
Gasto anual N´ umero de personas
0.8-1.0 20
1.0-1.6 70
1.6-2.0
2.0-2.6 65
Total
a) Determine el gasto medio y su variaci´on.
b) ¿Cu´antas personas gastan m´as de $1800000, en electricidad al a˜ no?
c) Determine el valor modal de gasto.
Des.
Sea X:gasto anual en electricidad, en millones de pesos. Primero com-
pletamos la tabla. Por enunciado el total de personas es 200, luego
sabemos que la suma de la columna de frecuencias observadas debe ser
200, por lo cual restamos al total las frecuencias que aparecen en la
tabla y obtenemos el valor faltante.
x
i
X n
i
f
i
N
i
n
i
x
i
0,9 0,8 −1,0 20 0,100 20 18
1,3 1,0 −1,6 70 0,350 90 91
1,8 1,6 −2,0 45 0,225 135 81
2,3 2,0 −2,6 65 0,325 200 149,5
Total 200 1,000 339,5
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 67
a)
µ
X
=
339,5
200
= 1,70 millones de pesos.
b)
1,8 = 1,6 +
_
α ×200
100
−90
_
0,4
45
,
1,8 −1,6 =
_
α ×200
100
−90
_
0,4
45
,
0,2 ×
45
0,4
=
α ×200
100
−90 ,
22,5 + 90 =
α ×200
100
,
α = 112,5 ×
100
200
,
α = 56,25 % .
Luego el 56,25 % de las personas tiene un gasto inferior a 1.8 mil-
lones, entonces 100 %−56,25 % = 43,75 % tiene un gasto superior
a 1.8 millones, as´ı 200 ×(43,75 %/100 %) = 87,5 ≈ 88 personas.
c)
Mo(X) = 1,0 +
_
70 −20
(70 −20) + (70 −45)
_
0,6 ,
= 1,0 +
50
50 + 25
×0,6 ,
= 1,0 +
50
75
×0,6 ,
= 1,0 + 0,4 ,
= 1,4 millones de pesos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 68
7. En un estudio a 250 personas sobre su sueldo anual, se recopil´o la
siguiente informaci´on, en millones de pesos:
Sueldo anual N´ umero de personas
1.5-2.5 27
2.5-3.5 19
3.5-4.5 15
4.5-5.5
Total
a) Determine el ingreso medio para estas personas.
b) Determine su variaci´ on.
c) ¿Cu´antas personas ganan menos de $3200000 anualmente?
d) Determine si el valor modal es superior al valor mediano.
Des.
Sea X: sueldo anual, en millones de pesos. Completamos la tabla de
frecuencias.
x
i
X n
i
f
i
N
i
n
i
x
i
n
i
x
2
i
2,0 1,5 −2,5 27 0,108 27 54 108
3,0 2,5 −3,5 19 0,076 46 57 171
4,0 3,5 −4,5 25 0,100 71 100 400
5,0 4,5 −5,5 179 0,716 250 895 4475
Total 250 1,000 1106 5154
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 69
a)
µ
X
=
1106
250
= 4,42 millones de pesos.
b)
σ
2
X
=
1
250
_
5154 −250 ×4,42
2
_
,
=
269,9
250
,
= 1,08 (millones de pesos)
2
,
σ
X
= 1,34 millones de pesos.
c)
3,2 = 2,5 +
_
α ×250
100
−27
_
1,0
19
,
α =
_
(3,2 −2,5) ×
19
1,0
+ 27
_
100
250
,
= (13,3 + 27)
100
250
,
= 16,12 % .
d) Para el valor modal, primero identificamos el intervalo con la may-
or frecuencia observada.
Mo(X) = 4,5 +
_
179 −25
(179 −25) + (179 −0)
_
1,0 ,
= 4,5 +
154
154 + 179
×1,0 ,
= 4,5 +
154
333
,
= 4,5 + 0,46 ,
= 4,96 millones de pesos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 70
Para el valor mediano, primero determinamos el valor 250/2 =
125, para encontrar el intervalo de la mediana.
Me(X) = 4,5 +
_
250 ×50
100
−71
_
1,0
179
,
= 4,5 + (125 −71)
1,0
179
,
= 4,5 + 0,30 ,
= 4,80 millones de pesos.
Efectivamente el valor modal es superior al valor mediano.
8. La siguiente tabla muestra el gasto mensual en locomoci´on de un grupo
de 30 familias expresado en miles de pesos.
Gasto mensual N´ umero de
(miles de pesos) familias
5-12 7
12-18 9
18-25
25-33 7
a) ¿Cu´al es el gasto mensual medio en locomoci´on de estas familias?
b) ¿Cu´antas familias gastan mensualmente m´as de $19000 en loco-
moci´on?
c) ¿Cu´al es el gasto m´as frecuente en locomoci´on?
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 71
d) ¿Cu´al es la variabilidad respecto a la media del gasto en locomo-
ci´on?
e) ¿Cu´al es el monto de gasto mensual que deja por bajo este valor
al 75 % de los montos?
Des.
Sea X: gasto mensual en locomoci´on.
x
i
X n
i
f
i
N
i
n
i
x
i
n
i
x
2
i
8,5 5 −12 7 0,233 7 59,5 505,75
15 12 −18 9 0,300 16 135 2025
21,5 18 −25 7 0,233 23 150,5 3235,75
29 25 −33 7 0,233 30 203 5887
Total 30 1,000 548 11653,5
a)
µ
X
=
548
30
= 18,27 millones de pesos.
b)
19 = 18 +
_
α ×30
100
−16
_
7
7
,
α = ((19 −18)1 + 16)
100
30
,
= 56,67 % .
Entonces el 56,67 % de las familias tienen un gasto inferior a
$19000 mensuales en locomoci´on, as´ı el (100 %−56,67 %) = 43,33 %
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 72
tienen un gasto superior, es decir, 30 × (43,33 %/100 %) = 13 fa-
milias.
c)
Mo(X) = 12 +
_
9 −7
(9 −7) + (9 −7)
_
6 ,
= 12 +
2
2 + 2
6 ,
= 12 + 3 ,
= 15 miles de pesos.
d)
σ
2
X
=
1
30
(11653,5 −30 ×18,27
2
) =
1639,71
30
= 54,66 (miles de pesos)
2
e)
P
75
= 18 +
_
30 ×75
100
−16
_
7
7
,
= 18 + (22,5 −16) ,
= 24,5 miles de pesos.
9. En una encuesta realizada a 200 personas sobre su edad se registraron
los siguientes resultados.
Edad N´ umero de personas
18-21 16
21-27 42
27-30
30-35 25
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 73
a) Determine la edad media de los entrevistados.
b) Determine si la edad mediana es superior a la edad m´as frecuentes.
c) Determine la variabilidad respecto a la media de las edades para
estos entrevistados.
d) ¿Cu´antas personas de las entrevistadas tienen entre 25 y 31 a˜ nos?
Des.
Sea X: edad, en a˜ nos.
x
i
X n
i
f
i
N
i
n
i
x
i
n
i
x
2
i
19,5 18 −21 16 0,080 16 312 6084
24 21 −27 42 0,210 58 1008 24192
28,5 27 −30 117 0,585 175 3334,5 95033,25
32,5 30 −35 25 0,125 200 812,5 26406,25
Total 200 1,000 5467 151715,5
a)
µ
X
=
5467
200
= 27,34 a˜ nos.
b)
Me(X) = 27 +
_
200 ×50
100
−58
_
3
117
,
= 27 + (100 −58)
3
117
,
= 27 + 1,08 ,
= 28,08 a˜ nos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 74
Mo(X) = 27 +
_
117 −42
(117 −42) + (117 −25)
_
3 ,
= 27 +
75
75 + 92
3 ,
= 27 + 1,35 ,
= 28,35 a˜ nos.
Entonces, se puede observar que la edad mediana no es mayor a
la edad m´as frecuente.
c)
σ
2
X
=
1
200
(151715,5 −200 ×27,34
2
) =
2220,38
200
= 11,10 (a˜ nos)
2
,
σ
X
= 3,33 a˜ nos.
d) Primero determinaremos el porcentaje de personas que se encuen-
tra en el intervalo, para ello determinaremos el porcentaje de per-
sonas que est´an por bajo los 31 a˜ nos y luego lo restaremos con
el porcentaje que deja por bajo los 25 a˜ nos, para posteriormente
determinar la cantidad de personas.
31 = 30 +
_
α ×200
100
−175
_
5
25
,
α =
_
(31 −30)
25
5
+ 175
_
100
200
,
= 180 ×
100
200
,
= 90 % .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 75
25 = 21 +
_
α ×200
100
−16
_
6
42
,
α =
_
(25 −21)
42
6
+ 16
_
100
200
,
= (28 + 18)
100
200
,
= 22 % .
Entonces, el porcentaje de personas que tiene entre 25 y 31 a˜ nos
es 90 % − 22 % = 68 %, as´ı la cantidad de personas es 200 ×
(68 %/100 %) = 136 personas.
10. La siguiente tabla resume a un grupo de profesionales j´ovenes respecto
a la cantidad de dinero que gastan en diversi´ on mensualmente, en miles
de pesos.
Gasto mensual n´ umero de j´ovenes
5-15 91
15-28 105
28-32 70
32-50 56
a) ¿Cu´ale es el gasto promedio de dinero en diversi´ on?
b) ¿Cu´antos j´ovenes gastas m´as de $30000 mensuales en diversi´ on?
c) ¿Cu´al es el m´aximo que gasta el 75 % de los entrevistados que
menos gasta?
d) Determine el coeficiente de variaci´on para estos j´ovenes?
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 76
Des.
Sea X: cantidad de dinero que gastan en diversi´on, en miles de pesos.
x
i
X n
i
f
i
N
i
n
i
x
i
n
i
x
2
i
10 5 −15 91 0,283 91 910 9100
21,5 15 −28 105 0,326 196 2257,5 48536,25
30 28 −32 70 0,217 266 2100 63000
41 32 −50 56 0,174 322 2296 94136
Total 322 1,000 7563,5 214772,25
a)
µ
X
=
7563,5
322
= 23,49 miles de pesos.
b)
30 = 28 +
_
α ×322
100
−196
_
4
70
,
α =
_
(30 −28)
70
4
+ 196
_
100
322
,
= (35 + 196)
100
322
,
= 71,74 % .
Entonces, el 71,74 % de los entrevistados gasta menos de $30000 al
mes en diversi´on, as´ı el 28,26 % gasta m´as de $30000 en diversi´ on,
y estos son 322 ×(28,26 %/100 %) = 91 j´ovenes.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 77
c)
P
75
= 28 +
_
75 ×322
100
−196
_
4
70
,
= 28 + (241,5 −196)
4
70
,
= 28 + 2,6 ,
= 30,6 miles de pesos.
d)
σ
2
X
=
1
322
(214772,25 −322 ×23,49
2
) ,
=
37099,06
322
,
= 115,21 (miles de pesos)
2
,
σ
X
= 10,73 miles de pesos.
C.V.(X) =
10,73
23,49
×100 % = 45,7 % .
11. Las utilidades en millones de pesos que tienen dos empresas, est´an
relacionadas con el n´ umero de proyectos que realizan anualmente, la
siguiente tabla muestra las utilidades de los ´ ultimos a˜ nos de ambas
empresas.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 78
Utlidades N´ umero de Proyectos
millones de $ Empresa 1 Empresa 2
4.5-6.0 40 35
6.0-7.8 81 16
7.8-9.0 82 20
9.0-10.2 38 45
a) ¿En qu´e empresa la utilidad presenta una mayor variabilidad re-
specto a la media?
b) ¿Cu´al es la cantidad de proyectos que presentan una utlidad menor
a $8000000 anual?
c) ¿Cu´al es el monto m´aximo de utilidad que presentan la mayoria
de los proyectos de la empresa 2?
d) Si la empresa 1 aumentara en un 7 % sus utilidades, y la empresa
2 disminuye en un 6 %, pero lo intenta compensar aumentando en
3 proyectos adicionales, ¿Cu´ales ser´ıan los nuevos coeficientes de
variaci´ on para las empresas?
Des.
Sea E
i
: utilidades de la empresa i = 1, 2.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 79
e
1i
E
1
n
1i
f
1i
N
1i
n
1i
e
1i
n
1i
e
2
1i
n
2i
f
2i
N
2i
n
2i
e
2i
n
2i
e
2
2i
5,25 4,5 −6,0 40 0,166 40 210 1102,5 35 0,302 35 183,75 964,69
6,90 6,0 −7,8 81 0,336 121 558,9 3856,41 16 0,138 51 110,4 761,76
8,40 7,8 −9,0 82 0,340 203 688,8 5785,92 20 0,172 71 168 1411,2
9,60 9,0 −10,2 38 0,158 241 364,8 3502,08 45 0,388 116 432 4147,2
Total 241 1,000 1822,5 14246,91 116 1,000 794,15 7284,85
a)
µ
E
1
=
1822,5
241
,
= 7,56 millones de pesos.
µ
E
2
=
794,15
116
,
= 6,85 millones de pesos.
σ
2
E
1
=
1
241
_
14246,91 −241 ×7,56
2
_
,
=
472,89
241
,
= 1,96 (millones de pesos)
2
: .
σ
2
E
2
=
1
116
_
7284,85 −116 ×6,85
2
_
,
=
1841,84
116
,
= 15,88 (millones de pesos)
2
.
La empresa 2 presenta una mayor variabilidad en sus utilidades.
b) Sea E: utilidad de las empresas, en millones de pesos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 80
e
i
E n
i
f
i
N
i
5,25 4,5 −6,0 75 0,210 75
6,90 6,0 −7,8 97 0,272 172
8,40 7,8 −9,0 102 0,286 274
9,60 9,0 −10,2 83 0,232 357
Total 357 1,000
8,0 = 7,8 +
_
α ×357
100
−172
_
1,2
102
,
α =
_
(8,0 −7,8)
102
1,2
+ 172
_
100
357
,
α = (17 + 172)
100
357
,
α = 52,94 % .
Entonces el 52,94 % de los proyectos tienen una utilidad menor
a 8.0 millones de pesos, es decir, 357 × (52,94 %/100 %) = 189
proyectos.
c)
Me(E
2
) = 7,8 +
_
116 ×50
100
−51
_
1,2
20
,
= 7,8 + (58 −51)
1,2
20
,
= 7,8 + 0,42 ,
= 8,22 millones de pesos.
d) Determinemos los respectivos coeficientes de variaci´ on (CV )para
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 81
cada empresa.
C.V.(E
1
) =

1,96
7,56
100 % = 18,5 %, C.V.(E
2
) =

15,88
6,82
100 % = 58,2 %.
Por propiedades de la varianza y la media se tiene que luego de
los ajustes los nuevos coeficientes de variaci´ on para las empresas
son:
C.V.(E
1
) =
(1 + 0,07)

1,96
(1 + 0,07) ×7,56
100 % =
1,07

1,96
1,07 ×7,56
100 % =

1,96
7,56
100 % = 18,5 %,
C.V.(E
2
) =
(1 −0,06)

15,88
(1 −0,06) ×6,82 + 3
100 % =
0,94

15,88
0,94 ×6,82 + 3
100 % =
3,74
9,41
100 % = 39,7 %.
12. La siguiente tabla muestra la distribuci´on del nivel de ingresos, en mil-
lones de pesos, de un grupo de Profesionales seg´ un su sexo.
Sueldo mensual Sexo
(millones de pesos) Hombres Mujeres
0.4-0.6 2 3
0.6-0.8 8 2
0.8-1.2 9 4
1.2-1.5 10 6
1.5-1.8 5 3
1.8-2.0 2 1
a) ¿Cu´ales son los ingresos medios de hombres y mujeres?
b) ¿Qu´e cantidad de mujeres tiene un ingreso entre $650000 y $1250000?
c) Comparativamente, ¿Qui´enes tiene sueldos m´as homog´eneos?
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 82
d) ¿El sueldo m´as frecuente de los hombres es mayor al m´as frecuente
de las mujeres?
e) Si el sueldo de los hombres aumentara en un 3 %, y el de las mu-
jeres fuera reajustado en un 5 % m´as un bono mensual de $10000.
¿Qui´enes tendr´ıan un sueldo medio superior?
Des.
Sean X: sueldo mensual, en miles de pesos, H: Hombres y M: Mujeres.
Hombres
x
i
X n
i
f
i
N
i
n
i
x
i
n
i
x
2
i
0,5 0,4 −0,6 2 0,056 2 1,0 0,5
0,7 0,6 −0,8 8 0,222 10 5,6 3,92
1,0 0,8 −1,2 9 0,250 19 9 9
1,35 1,2 −1,5 10 0,278 29 13,5 18,23
1,65 1,5 −1,8 5 0,139 34 8,25 13,61
1,9 1,8 −2,0 2 0,056 36 3,8 7,22
Total 36 1,000 41,15 52,48
Mujeres
x
i
X n
i
f
i
N
i
n
i
x
i
n
i
x
2
i
0,5 0,4 −0,6 3 0,158 3 1,5 0,75
0,7 0,6 −0,8 2 0,105 5 1,4 0,98
1,0 0,8 −1,2 4 0,211 9 4 4
1,35 1,2 −1,5 6 0,316 15 8,1 10,94
1,65 1,5 −1,8 3 0,158 18 4,95 8,17
1,9 1,8 −2,0 1 0,053 19 1,9 3,61
Total 19 1,000 21,75 28,45
a)
µ
H
=
41,15
36
= 1,143 millones de pesos.
µ
M
=
21,75
19
= 1,145 millones de pesos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 83
b)
1,25 = 1,2 +
_
α ×19
100
−9
_
0,3
6
,
α =
_
(1,25 −1,2)
6
0,3
+ 9
_
100
19
,
= (1 + 9)
100
19
,
= 52,63 % .
0,65 = 0,6 +
_
α ×19
100
−3
_
0,2
2
,
α =
_
(0,65 −0,6)
2
0,2
+ 3
_
100
19
,
= (0,5 + 3)
100
19
,
= 18,42 % .
Entonces, El porcentaje de mujeres que est´a en el intervalo es
52,63 %−18,42 % = 34,21 %, es decir, hay 19×(34,21 %/100 %) =
6,5 ≈ 7 mujeres.
c)
σ
2
H
=
1
36
(52,48 −36 ×1,143
2
) =
5,448
36
= 0,151 (millones de pesos)
2
,
σ
H
= 0,389 millones de pesos.
σ
2
M
=
1
19
(28,45 −19 ×1,145
2
) =
3,541
19
= 0,186 (millones de pesos)
2
,
σ
H
= 0,431 millones de pesos.
C.V.(H) =
0,389
1,143
100 % = 34,0 % , C.V.(M) =
0,431
1,145
100 % = 37,6 .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 84
d)
Mo(X)
H
= 1,2 +
_
10 −9
(10 −9) + (10 −5)
_
0,3 ,
= 1,2 +
1
1 + 5
0,3 ,
= 1,2 + 0,05 ,
= 1,25 millones de pesos.
Mo(X)
M
= 1,2 +
_
6 −4
(6 −4) + (6 −3)
_
0,3 ,
= 1,2 +
2
2 + 3
0,3 ,
= 1,2 + 0,2 ,
= 1,4 millones de pesos.
Entonces, como se puede observar el sueldo m´as frecuente de los
varones no es superior al sueldo m´as frecuente de las damas.
e)
µ
H
= (1 + 0,03)1,143 = 1,03 ×1,143 = 1,177 millones de pesos. ,
µ
M
= (1 + 0,05)1,145 + 0,01 = 1,05 ×1,145 + 0,01 = 1,212 millones de pesos.
13. Las demanda mensual de cajas (X) de cierto producto en los superme-
rcados de dos comunas se resume en la siguiente tabla.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 85
Cantidad (X) Comuna A Comuna B
30-70 12 5
70-100 21 8
100-130 36 19
130-150 29 10
a) Determine las demandas m´as frecuentes para ambas comunas.
b) ¿Es mayor la demanda promedio de la Comuna A comparado con
la Comuna B de este producto?
c) Determine la cantidad de demanda m´ınima de 25 % de las mayores
demandas.
d) ¿Qu´e comuna tiene una demanda m´as homog´enea?
e) Si para el pr´oximo mes se determina que la comuna B tendr´a un
crecimiento en su poblaci´on, que involucrar´ a un aumento en la
demanda de este producto en un 15 %, en cambio la comuna A
disminuir´ a su consumo en un 5 % menos 7 cajas. ¿Cu´ales ser´ıan
las nuevas demandas medias?
Des.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 86
x
i
X A B Total N
i
50 30 −70 12 5 17 17
85 70 −100 21 8 29 46
115 100 −130 36 19 55 101
140 130 −150 29 10 39 140
Total 98 42 140
a)
Mo(X|A) = 100 +
_
36 −21
(36 −21) + (36 −29)
_
30 ,
= 100 +
15
15 + 7
30 ,
= 100 + 20,45 ,
= 120,45 cajas mensuales.
Mo(X|B) = 100 +
_
19 −8
(19 −8) + (19 −10)
_
30 ,
= 100 +
11
11 + 9
30 ,
= 100 + 16,50 ,
= 116,50 cajas mensuales.
b)
µ
X|A
=
50 ×12 + 85 ×21 + 115 ×36 + 140 ×29
98
=
10585
98
= 108,01 cajas mensuales.
µ
X|B
=
50 ×5 + 85 ×8 + 115 ×19 + 140 ×10
42
=
4515
42
= 107,50 cajas mensuales.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 87
Efectivamente, la Comuna A tiene una mayor demanda media de
cajas mensuales de este producto en comparaci´on a la Comuna B.
c)
P
75
= 130 +
_
140 ×75
100
−101
_
20
39
,
= 130 + (105 −101)
20
39
,
= 130 + 2,05 ,
= 132,05 cajas mensuales.
La m´axima demanda de cajas del 75 % de las demandas inferiores
es 132,05 ≈ 132, entonces este valor tambi´en corresponde a la
demanda m´ınima del 25 % de las mayores demandas.
d)
σ
2
X|A
=
1
98
_
(50
2
×12 + 85
2
×21 + 115
2
×36 + 140
2
×29) −98 ×108,01
2
_
,
=
1
98
(1226225 −1143283,69) ,
=
82941,31
98
,
= 846,34 (cajas mensuales)
2
,
σ
X|A
= 29,09 cajas mensuales.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 88
σ
2
X|B
=
1
42
_
(50
2
×5 + 85
2
×8 + 115
2
×19 + 140
2
×10) −42 ×107,50
2
_
,
=
1
42
(517575 −485362,50) ,
=
32212,50
42
,
= 766,96 (cajas mensuales)
2
,
σ
X|B
= 27,69 cajas mensuales.
C.V.(X|A) =
29,09
108,01
100 % = 26,9 % C.V.(X|B) =
27,69
107,50
100 % = 25,8 % .
La Comuna B tiene una demanda m´as homog´enea en comparaci´on
a la Comuna A.
e)
µ
X|A
= (1 −0,05) ×108,01 −7 = 95,61 cajas mensuales.
µ
X|B
= (1 + 0,15) ×107,50 = 123,63 cajas mensuales.
14. En una encuesta realizada a 800 familias, se les consulta sobre dos
puntos: si est´an inscritos en los registros electorales y sobre el nivel de
ingresos, de donde se obtiene la siguiente tabla.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 89
Nivel de Inscripci´on
Ingresos en registros Total
(miles de pesos) SI NO
100-400 120 320
400-700 150 240
700-1000 210
Total
a) ¿Es superior el ingreso medio de las familias inscritas en los reg-
istros electorales que las no inscritas?
b) ¿Cu´antas familias no inscritas en los registros electorales tienen
un ingreso superior a 500 mil?
c) ¿Son m´as homog´eneas los ingresos de las familias inscritas en los
registros electores que las no inscritas?
Des.
Y
x
i
X SI NO Total
250 100 −400 120 200 320
550 400 −700 90 150 240
850 700 −1000 210 30 240
Total 420 380 800
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 90
a)
µ
X|Y =SI
=
250 ×120 + 550 ×90 + 850 ×210
420
=
258000
420
= 614,29 miles de pesos.
µ
X|Y =NO
=
250 ×200 + 550 ×150 + 850 ×30
380
=
158000
380
= 415,79 miles de pesos.
El ingreso medio de las familias que estan inscritas en los registros
electorales es mayor que las familas no inscritas.
b)
500 = 400 +
_
α ×380
100
−200
_
300
150
α =
_
(500 −400)
150
300
+ 200
_
100
380
= 250
100
380
= 65,79
El 65,79 % de las familias no inscritas en los registros electorales
tiene un ingreso menor a $500000, entonces, el 34,21 % tiene un
ingreso superior, es decir, 380 ×(34,21 %/100 %) = 130 familias.
c)
σ
2
X|Y =SI
=
1
420
_
(250
2
×120 + 550
2
×90 + 850
2
×210) −420 ×614,29
2
_
,
=
1
420
(186450000 −158487925,7) ,
=
27962074,28
420
,
= 66576,37 (miles de pesos)
2
,
σ
X|Y =SI
= 258,02 miles de pesos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 91
σ
2
X|Y =NO
=
1
380
_
(250
2
×200 + 550
2
×150 + 850
2
×30) −380 ×415,79
2
_
,
=
1
380
(79550000 −65694903,16) ,
=
13855096,84
380
,
= 36460,78 (miles de pesos)
2
,
σ
X|Y =NO
= 190,95 miles de pesos.
C.V.(X|Y = SI) =
258,02
614,29
100 % = 42,0 % C.V.(X|Y = NO) =
190,95
415,79
100 % = 45,9 % .
Las familias inscritas en los registros electorales tienen sueldos
m´as homog´eneos que las familias no inscritas en los registros elec-
torales.
15. El siguiente cuadro muestra el n´ umero de horas semanales dedicadas
al estudio de un grupo de alumnos y la nota final que obtuvieron al
termino del curso.
Horas de estudio Nota final
1-3 3-5 5-7
0-2 3 1 4
2-4 5 5 6
4-6 6 4 9
6-8 1 4 7
a) Determine el numero medio de horas de estudio y de nota final.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 92
b) ¿Cu´al es la cantidad de horas de estudios m´as frecuente de este
grupo de estudiantes?
c) ¿Cu´antos de estos estudiantes aprobaron el curso?
d) Determine la nota m´ınima que obtuvo el 50 % de los mejores alum-
nos.
e) ¿Cu´antas horas en promedio estudiaron aquellos alumnos que ob-
tuvieron una nota superior a 5.0?
f ) ¿Qu´e nota obtuvieron los alumnos que estudiaron menos de 4
horas?
g) Determine si los alumnos son m´as parecidos respecto a las horas
que estudian en comparaci´on a la nota final que obtuvieron.
h) Determine el tipo y fuerza de asociaci´on entre las variables.
Des.
Y
y
i
2 4 6
x
i
X 1 −3 3 −5 5 −7 Total
1 0 −2 3 1 4 8
3 2 −4 5 5 6 16
5 4 −6 6 4 9 19
7 6 −8 1 4 7 12
Total 15 14 26 55
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 93
a)
µ
X
=
1 ×8 + 3 ×16 + 5 ×19 + 4 ×12
55
,
=
235
55
,
= 4,27 horas.
µ
Y
=
2 ×15 + 4 ×14 + 6 ×26
55
,
=
242
55
,
= 4,40 .
b)
Mo(X) = 4 +
_
19 −16
(19 −16) + (19 −12)
_
2 ,
= 4 +
3
3 + 7
2 ,
= 4 + 0,6 ,
= 4,6 horas.
c)
4 = 3 +
_
α ×55
100
−15
_
2
14
,
α =
_
(4 −3)
14
2
+ 15
_
100
55
,
α = 22
100
55
,
= 40 % .
Como el 40 % de las observaciones tiene una nota final inferior
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 94
a 4.0, entonces el 60 % tiene una nota superior a 4.0, es decir,
55 ×(60 %/100 %) = 33 alumnos aprobaron el curso.
d)
P
50
= 3 +
_
50 ×55
100
−15
_
2
14
,
= 3 + (27,5 −15)
2
14
,
= 3 + 1,79 ,
= 4,79 .
e) .
x
i
X|Y > 5
1 0 −2 4
3 2 −4 6
5 4 −6 9
7 6 −8 7
Total 26
µ
X|Y >5
=
1×4+3×6+5×9+7×7
26
=
116
26
= 4,46 horas.
f ) .
x
i
Y |X < 4
2 1 −3 3 + 5 = 8
4 3 −5 1 + 5 = 6
6 5 −7 4 + 6 = 10
Total 24
µ
Y |X<4
=
2×8+4×6+6×10
24
=
100
24
= 4,17
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 95
g)
σ
2
X
=
1
55
_
(1
2
×8 + 3
2
×16 + 5
2
×19 + 7
2
×12) −55 ×4,27
2
_
,
=
1
55
(1215 −1002,81) ,
= 3,86 (horas)
2
,
σ
X
= 1,96 horas.
σ
2
Y
=
1
55
_
(2
2
×15 + 4
2
×14 + 6
2
×26) −55 ×4,40
2
_
,
=
1
55
(1220 −1064,80) ,
= 2,82 ,
σ
Y
= 1,68 .
C.V.(X) =
1,96 horas
4,27 horas
100 % = 45,9 % C.V.(Y ) =
1,68
4,40
100 % = 38,2 % .
Como el C.V.(X) > C.V.(Y ) los alumnos son m´as homog´eneos en
la nota que obtuvieron que en las horas de estudio.
h)
σ
XY
=
1
55
((1 ×3 ×2 + 1 ×1 ×4 + 1 ×4 ×6 + 3 ×5 ×2 + 3 ×5 ×4 + 3 ×6 ×6 ,
+5 ×6 ×2 + 5 ×4 ×4 + 5 ×9 ×6 + 7 ×1 ×2 + 7 ×4 ×4 + 7 ×7 ×6) ,
−55 ×4,27 ×4,40) ,
=
1
55
(1062 −55 ×4,27 ×4,40) ,
=
28,66
55
,
= 0,52 ,
r
XY
=
0,52
1,96 ×1,68
= 0,158 .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 96
Las variables tienen una baja asociaci´on lineal directa.
16. El Subgerente de refrigeraci´on y aire acondicionado de una empresa,
debe decidir entre instalar calefactores a parafina o a gas, en las nuevas
dependencias de bodega. Con el prop´osito de tomar una decisi´on in-
teligente, solicit´o la siguiente informaci´on.
Antecedentes Parafina (P) Gas (G)
N´ umero de calefactores 4 2 5 6 3 3 2 3 4 1
Precio de calefactores (US$) 90 85 91 100 95 93 112 86 95 98
Importados (I) 3 1 3 4 2 3 1 1 2 0
Nacionales (N) 1 1 2 2 1 0 1 2 2 1
a) ¿Es el precio medio de los calefactores a Parafina superior al de
los a Gas?
b) Determine de los calefactores nacionales, si el precio mediano de
los a Parafina es superior a los de Gas.
c) ¿Es el precio medio de los calefactores a Parafina nacioanales
menor al de los importados?
d) ¿Cu´ales calefactores tienen precios m´as homog´eneos, los nacionales
a Gas o los nacionales a Parafina?
e) ¿Cu´al es precio m´as com´ un de los calefactores nacionales a Gas?
Des.
a)
µ
P
=
4 ×90 + 2 ×85 + 5 ×91 + 6 ×100 + 3 ×95
20
=
1870
20
= 93,5 US$ ,
µ
G
=
3 ×93 + 2 ×112 + 3 ×86 + 4 ×95 + 1 ×98
13
=
1239
13
= 95,31 US$ .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 97
En este caso el precio medio de los calefactores a Gas es superior
al precio medio de los calefactores a Parafina.
b) .
P|N
85 1 1
90 1 2
91 2 4
95 1 5
100 2 7
G|N
86 2 2
93 0 2
95 2 4
98 1 5
112 1 6
Me(P|N) = 91 US$ Med(G|N) = 95 US$ .
En este caso el pecio mediano de los calefactores nacionales a
Gas es superior al precio mediano de los calefactores nacionales a
Parafina.
c) .
N|P I|P
85 1 1
90 1 3
91 2 3
95 1 2
100 2 4
Total 7 13
µ
N|P
=
85×1+90×1+91×2+95×1+100×2
7
,
=
652
7
,
= 93,14 US$ ,
µ
I|P
=
85×1+90×3+91×3+95×2+100×4
13
,
=
1218
13
,
= 93,69 US$ .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 98
Efectivamente el precio medio de los calefactores a Parafina Na-
cionales es menor al precio medio de los calefactores a Parafina
Importados.
d) Utilizando las resultados de b) y c), se tienen:
µ
P|N
= 93,14 US$ ,
µ
G|N
=
86 ×2 + 93 ×0 + 95 ×2 + 98 ×1 + 112 ×1
6
=
572
6
= 95,33 US$ .
σ
2
P|N
=
1
7
_
(85
2
×1 + 90
2
×1 + 91
2
×2 + 95
2
×1 + 100
2
×2) −7 ×93,14
2
_
,
=
1
7
(60912 −60725,42) ,
= 26,65 (US$)
2
,
σ
P|N
= 5,76 US$ .
σ
2
G|N
=
1
6
_
(86
2
×2 + 93
2
×0 + 95
2
×2 + 98
2
×1 + 112
2
×1) −6 ×95,33
2
_
,
=
1
6
(54990 −54526,85) ,
= 77,19 (US$)
2
,
σ
G|N
= 8,79 US$ .
C.V.(P|N) =
5,76 US$
93,14 US$
100 % = 5,5 % , C.V.(G|N) =
8,79 US$
95,33 US$
100 % = 9,2 % .
Los calefactores Nacionales a Parafina tienen precios m´as homog´eneos
que los calefactores Nacionales a Gas.
e)
Mo
1
(G|N) = 86 US$ , Mo
2
(G|N) = 95 US$ .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 99
17. La siguiente tabla muestra los ingresos mensuales (X), en miles de
pesos, y el nivel educacional (Y) de un grupo de empleados de una
empresa de asesoria computacional.
X Y
Media (M) T´ecnico-Profesional (TP) Universitaria(U)
150-350 9 12 3
350-600 8 15 5
600-1100 2 7 5
a) ¿Cu´al es el sueldo m´as frecuente de estos empleados?
b) ¿Cu´al es el sueldo promedio de estos empleados?
c) ¿Cu´al es el sueldo medio de los empleados con eduaci´on Universi-
taria?
d) ¿Cu´al sueldo es m´as homog´eneo respecto al nivel educacional?
Des.
Y
x
i
X M TP U Total
250 150 −350 9 12 3 24
475 350 −600 8 15 5 28
850 600 −1100 2 7 5 14
Total 19 34 13 66
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 100
a)
Mo(X) = 350 +
_
28 −24
(28 −24) + (28 −14)
_
250 ,
= 350 +
4
4 + 14
250 ,
= 350 + 55,56 ,
= 405,56 miles de pesos.
b)
µ
X
=
250 ×24 + 475 ×28 + 850 ×14
66
,
=
31200
66
,
= 472,73 miles de pesos.
c)
µ
X|Y =U
=
250 ×3 + 475 ×5 + 850 ×5
13
=
7375
13
= 567,31 miles de pesos.
d)
µ
X|Y =M
=
250 ×9 + 475 ×8 + 850 ×2
19
=
7750
19
= 407,89 miles de pesos.
µ
X|Y =TP
=
250 ×12 + 475 ×15 + 850 ×7
34
=
16075
34
= 472,79 miles de pesos.
σ
2
X|Y =M
=
1
19
_
(250
2
×9 + 475
2
×8 + 850
2
×2) −19 ×407,89
2
_
,
=
1
19
(3812500 −3161110,79) ,
= 34283,64 (miles de pesos)
2
,
σ
X|Y =M
= 185,16 miles de pesos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 101
σ
2
X|Y =TP
=
1
34
_
(250
2
×12 + 475
2
×15 + 850
2
×7) −34 ×472,79
2
_
,
=
1
34
(9191875 −7600033,06) ,
= 46818,89 (miles de pesos)
2
,
σ
X|Y =TP
= 216,38 miles de pesos.
σ
2
X|Y =U
=
1
13
_
(250
2
×3 + 475
2
×5 + 850
2
×5) −13 ×567,31
2
_
,
=
1
13
(4928125 −4183928,27) ,
= 57245,90 (miles de pesos)
2
,
σ
X|Y =M
= 239,26 miles de pesos.
C.V.(M) =
185,16
407,89
100 % = 45,4 % , C.V.(TP) =
216,38
472,79
100 % = 45,8 % , C.V.(U) =
239,26
567,31
100 % = 42,2 % .
Los empleados con educaci´on Universitaria tienen sueldos m´as ho-
mog´eneos, en comparaci´on a los otros trabajadores.
18. Una empresa dedicada a la venta de departamentos en la Quinta regi´on,
resume en la siguiente tabla los valores de departamentos seg´ un sus
contribuciones.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 102
Precio de venta (X) Contribuciones en miles de pesos (Y)
(millones de pesos) 50-100 100-200 200-300 300-400
10-15 10 4 3 1
15-20 3 6 1 3
20-30 4 3 5 7
30-40 0 2 5 2
40-50 0 1 6 9
a) ¿Cu´al es el precio y monto de contribuciones promedio de estos
departamentos?
b) ¿Qu´e porcentaje de departamentos tiene un precio de venta a lo
menos de 30 millones y sus contribuciones son superiores a los 200
mil?
c) ¿Cu´al es el valor m´as frecuente de los departamentos que pagan
contribuciones entre los 100 y 300 mil?
d) Calcule el coeficiente de asociaci´on lineal para las variables en
estudio e interprete.
Des.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 103
Y
y
i
75 150 250 350
x
i
X 50 −100 100 −200 200 −300 300 −400 Total
12,5 10 −15 10 4 3 1 18
17,5 15 −20 3 6 1 3 13
25 20 −30 4 3 5 7 19
35 30 −40 0 2 5 2 9
45 40 −50 0 1 6 9 16
Total 17 16 20 22 75
a)
µ
X
=
12,5 ×18 + 17,5 ×13 + 25 ×19 + 35 ×9 + 45 ×16
75
,
=
1764,5
75
= 23,53 millones de pesos.
µ
Y
=
75 ×17 + 150 ×16 + 250 ×20 + 350 ×22
75
,
=
16375
75
= 218,33 miles de pesos.
b)
5 + 2 + 6 + 9
75
100 % =
22
75
100 % = 29,3 % .
c) .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 104
x
i
X|100 < Y < 300
12,5 10 −15 4 + 3 = 7
17,5 15 −20 6 + 1 = 7
25 20 −30 3 + 5 = 8
35 30 −40 2 + 5 = 7
45 40 −50 1 + 6 = 7
Total 26
Mo(X|100 < Y < 300) = 20 +
_
8 −7
(8 −7) + (8 −7)
_
10 ,
= 20 +
1
1 + 1
10 ,
= 25 millones de pesos.
d)
σ
XY
=
1
75
((12,5 ×10 ×75 + 12,5 ×4 ×150 + 12,5 ×3 ×250 + 12,5 ×1 ×350
+17,5 ×3 ×75 + 17,5 ×6 ×150 + 17,5 ×1 ×250 + 17,5 ×3 ×350
+25 ×4 ×75 + 25 ×3 ×150 + 25 ×5 ×250 + 25 ×7 ×350
+35 ×0 ×75 + 35 ×2 ×150 + 35 ×5 ×250 + 35 ×2 ×350
+45 ×0 ×75 + 45 ×1 ×150 + 45 ×6 ×250 + 45 ×9 ×350)
−75 ×23,53 ×218,33) ,
=
1
75
(479062,5 −75 ×23,53 ×218,33) ,
=
93764,63
75
,
= 1250,20 .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 105
σ
2
X
=
1
75
`
(12,5
2
×18 + 17,5
2
×13 + 25
2
×19 + 35
2
×9 + 45
2
×16) −17 ×23,53
2
´
,
=
1
75
(62093,75 −41524,57) ,
=
20569,18
75
,
= 274,26 (millones de pesos)
2
,
σ
X
= 16,56 millones de pesos.
σ
2
Y
=
1
75
`
(75
2
×17 + 150
2
×16 + 250
2
×20 + 350
2
×22) −75 ×218,33
2
´
,
=
1
75
(4400625 −3575099,17) ,
=
825525,83
75
,
= 11007,01 (miles de pesos)
2
,
σ
Y
= 104,91 miles de pesos.
r
XY
=
1250,20
16,56 ×104,91
= 0,720 .
En este caso existe una mediana asociacin lineal directa entre las variables.
19. En un curso de 50 alumnos, 15 de ellos obtuvieron una nota final menor
a 3.5 y s´olo 4 de ellos una nota superior a 6.2.
a) Determine la nota media y su variabilidad.
b) ¿Supera la nota mediana a la m´as frecuente?
c) ¿Cu´antos alumnos aprobaron el curso?
Des.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 106
x
i
X n
i
N
i
2,25 1,0 −3,5 15 15
4,85 3,5 −6,2 31 46
6,6 6,2 −7,0 4 50
Total 50
a)
µ
X
=
2,25 ×15 + 4,85 ×31 + 6,6 ×4
50
=
210,5
50
= 4,21 ,
σ
2
X
=
1
50
_
(2,25
2
×15 + 4,85
2
×31 + 6,6
2
×4) −50 ×4,21
2
_
,
=
1
50
(979,38 −886,21) ,
=
93,17
50
,
= 1,86 .
b)
Me(X) = 3,5 +
_
50 ×50
100
−15
_
2,7
31
,
= 3,5 + (25 −15)
2,7
31
,
= 3,5 + 0,87 ,
= 4,37 ,
Mo(X) = 3,5 +
_
31 −15
(31 −15) + (31 −4)
_
2,7 ,
= 3,5 +
16
16 + 27
2,7 ,
= 3,5 + 1,0 ,
= 4,5 .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 107
Como se puede observar la nota mediana es menor a la nota m´as
frecuente.
c)
4,0 = 3,5 +
_
α ×50
100
−15
_
2,7
31
,
α =
_
(4,0 −3,5)
31
2,7
+ 15
_
100
50
,
= (5,74 + 15)
100
50
,
= 41,48 % .
El 41,48 % de los alumnos obtuvo una nota inferior a 4,0, entonces,
el 58,52 % tiene aprobaron el curso, es decir, 50×(58,52 %/100 %) =
29,26 ≈ 29 alumnos.
20. Los siguientes datos corresponden al sueldo mensual(X) en miles de
pesos de un grupo de trabajadores de una empresa metal´ urgica respecto
a las horas de trabajo semanal (Y).
X Y
30-35 35-40 40-46
250-450 6 4 5
450-650 3 2 6
650-850 1 8 9
a) Determine el sueldo y horas de trabajo promedio para este grupo
de trabajadores.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 108
b) ¿Cu´al es el sueldo medio de aquellos que trabajan m´as de 40 horas?
c) ¿Cu´antas horas en promedio trabajan aquellos que tienen un suel-
do entre 450 y 650 mil?
d) Determine el coeficiente de correlaci´on lineal para las variables.
Des.
Y
y
i
32,5 37,5 43
x
i
X 30 −35 35 −40 40 −46 Total
350 250 −450 6 4 5 15
550 450 −650 3 2 6 11
750 650 −850 1 8 9 18
Total 10 14 20 44
a)
µ
X
=
350 ×15 + 550 ×11 + 750 ×18
44
=
24800
44
,
= 563,64 miles de pesos.
µ
Y
=
32,5 ×10 + 37,5 ×14 + 43 ×20
44
=
1710
44
,
= 38,86 horas.
b)
µ
X|Y >40
=
350 ×5 + 550 ×6 + 750 ×9
20
,
=
11800
20
= 590 miles de pesos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 109
c)
µ
Y |450<X<650
=
32,5 ×3 + 37,5 ×2 + 43 ×6
11
,
=
430,5
11
= 39,14 horas.
d)
σ
XY
=
1
44
((350 ×10 ×32,5 + 350 ×4 ×37,5 + 350 ×5 ×43
+550 ×3 ×32,5 + 550 ×2 ×37,5 + 550 ×6 ×43
+750 ×1 ×32,5 + 750 ×8 ×37,5 + 750 ×9 ×43) ,
−44 ×563,64 ×38,86) ,
=
1
44
(972400 −44 ×563,64 ×38,86) ,
=
8665,78
44
,
= 196,95 .
σ
2
X
=
1
44
_
(350
2
×15 + 550
2
×11 + 750
2
×18) −44 ×563,64
2
_
,
=
1
44
(15290000 −13978362,18) ,
=
1311637,82
44
,
= 29809,95 (miles de pesos)
2
,
σ
X
= 172,66 miles de pesos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 110
σ
2
Y
=
1
44
_
(32,5
2
×10 + 37,5
2
×14 + 43
2
×20) −44 ×38,86
2
_
,
=
1
44
(67230 −66444,38) ,
=
785,62
44
,
= 17,85 (horas)
2
,
σ
Y
= 4,23 horas.
r
XY
=
196,95
172,66 ×4,23
= 0,270 .
21. La siguiente tabla resume el resultados de 54 postulantes a un cargo
ejecutivo de una gran empresa, seg´ un sus edades.
Puntajes Edad (Y)
(X) 25-28 28-32
30-45 5 12
45-50 7 10
50-65 11 9
a) Calcule el valor medio de los puntajes y de las edades.
b) Determine el valor m´as frecuente de la edad dado que los postu-
lantes obtuvieron menos de 50 puntos.
c) Determine el puntaje que obtuvieron como m´aximo el 25 % de los
m´as bajos, dado que tienen menos de 28 a˜ nos.
d) Determine el coeficiente de correlaci´on lineal entre las variables.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 111
Des.
Y
y
i
26,5 30
x
i
X 25 −28 28 −32 Total
37,5 30 −45 5 12 17
47,5 45 −50 7 10 17
57,5 50 −65 11 9 20
Total 23 31 54
a)
µ
X
=
37,5 ×17 + 47,5 ×17 + 57,5 ×20
54
=
2595
54
= 48,06 puntos.
µ
Y
=
26,5 ×23 + 30 ×31
54
=
1539,5
54
= 28,51 a˜ nos.
b) .
Y |X < 50
25 −28 5 + 7 = 12
28 −32 12 + 10 = 22
Total 34
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 112
Mo(Y |X < 50) = 28 +
_
22 −12
(22 −12) + (22 −0)
_
4 ,
= 28 +
10
10 + 22
4 ,
= 28 + 1,25 ,
= 29,25 a˜ nos.
c) .
X|Y < 28 N
i
30 −45 5 5
45 −50 7 12
50 −65 11 23
Total 23
P
25
= 45 +
_
25 ×23
100
−5
_
5
7
,
= 45 + (5,75 −5)
5
7
,
= 45 + 0,54 ,
= 45,54 puntos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 113
d)
σ
XY
=
1
54
((37,5 ×5 ×26,5 + 37,5 ×12 ×30
+47,5 ×7 ×26,5 + 47,5 ×10 ×30
+57,5 ×11 ×26,5 + 57,5 ×9 ×30)
−54 ×48,06 ×28,51) ,
=
1
54
(73816,25 −54 ×48,06 ×28,51) ,
=
−174,04
54
,
= −3,22 .
σ
2
X
=
1
54
_
(37,5
2
×17 + 47,5
2
×17 + 57,5
2
×20) −54 ×48,06
2
_
,
=
1
54
(128387,50 −124727,23) ,
=
3660,27
54
,
= 67,78 (puntos)
2
,
σ
X
= 8,23 puntos.
σ
2
Y
=
1
54
_
(26,5
2
×23 + 30
2
×31) −54 ×28,51
2
_
,
=
1
54
(44051,75 −43892,29) ,
=
159,46
54
,
= 2,95 (a˜ nos)
2
,
σ
Y
= 1,72 a˜ nos.
r
XY
=
−3,22
8,23 ×1,72
= −0,227 .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 114
Existe una baja asociaci´on lineal inversa entre las variables.
22. La siguiente tabla resume la informaci´on de un grupo de estudiantes
universitarios seg´ un su edad y peso.
Edad Peso (Y)
(X) 65-75 75-85
18-22 6 11
22-25 7 14
25-28 10 16
a) Determine la edad m´as frecuente de los que pesan menos de 75
kilos.
b) Determine el peso medio, de los alumnos que tienen m´as de 22
a˜ nos.
c) Determine si el peso medio de todos los alumnos, supera al peso
medio de los alumnos con edades inferiores a los 25 a˜ nos.
d) Determine el coeficiente de correlaci´on lineal para las variables.
Des.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 115
Y
y
i
70 80
x
i
X 65 −75 75 −85 Total
20 18 −22 6 11 17
23,5 22 −25 7 14 21
26,5 25 −28 10 16 26
Total 23 41 64
a)
Mo(X|Y < 75) = 25 +
_
10 −7
(10 −7) + (10 −0)
_
3 ,
= 25 +
3
3 + 10
3 ,
= 25 + 0,69 ,
= 25,69 a˜ nos.
b) .
y
i
Y |X > 22
70 65 −75 7 + 10 = 17
80 75 −85 14 + 16 = 30
Total 47
µ
Y |X>22
=
70 ×17 + 80 ×30
47
=
3590
47
= 76,41 Kgrs.
c)
µ
Y
=
70 ×23 + 80 ×41
64
=
4890
64
= 76,41 Kgrs.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 116
y
i
Y |X < 25
70 65 −75 6 + 7 = 13
80 75 −85 11 + 14 = 25
Total 38
µ
Y |X<25
=
70 ×13 + 80 ×25
38
=
2910
38
= 76,58 Kgrs.
El peso medio de todos los alumnos es menor que el peso de los
alumnos menores de 25 a˜ nos.
d)
µ
X
=
20 ×17 + 23,5 ×21 + 26,5 ×26
64
=
1522,5
64
= 23,79 a˜ nos.
σ
XY
=
1
64
((20 ×6 ×70 + 20 ×11 ×80
+23,5 ×7 ×70 + 23,5 ×14 ×80
+26,5 ×10 ×70 + 26,5 ×16 ×80)
−64 ×23,79 ×76,41)
=
1
64
(116305 −64 ×23,79 ×76,41)
=
−33,81
64
= −0,528
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 117
σ
2
X
=
1
64
_
(20
2
×17 + 23,5
2
×21 + 26,5
2
×26) −64 ×23,79
2
_
=
1
64
(36655,75 −36221,70)
=
434,05
64
= 6,78 (a˜ nos)
2
σ
X
= 2,60 a˜ nos.
σ
2
Y
=
1
64
_
(70
2
×23 + 80
2
×41) −64 ×76,41
2
_
=
1
64
(375100 −373663,24)
=
1436,76
64
= 22,45 (Kgrs.)
2
σ
Y
= 4,74 kgrs.
r
XY
=
−0,528
2,60 ×4,74
= −0,056
Existe una baja asociaci´on lineal inversa entre las variables.
23. La siguiente tabla muestra los puntajes (X) obtenidos por un grupo de
alumnos de un colegio seg´ un el tramo de edad (Y ).
Puntajes Edad (Y)
(X) 9-11 11-14 14-16
0-30 3 6 10
30-50 8 4 11
50-70 9 7 5
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 118
a) Obtenga la edad media y puntaje medio de estos alumnos.
b) Obtenga las varianzas de la edad y del puntaje.
c) Determine el coeficiente de correlaci´on lineal.
d) ¿Cu´al es la edad media de los alumnos que obtuvieron puntajes
mayores a 30 puntos?
e) ¿Cu´al es el puntaje medio de aquellos alumnos que tienen m´as de
11 a˜ nos?
Des.
Y
y
i
10 12,5 15
x
i
X 9 −11 11 −14 14 −16 Total
15 0 −30 3 6 10 19
40 30 −50 8 4 11 23
60 50 −70 9 7 5 21
Total 20 17 26 63
a)
µ
X
=
15 ×19 + 40 ×23 + 60 ×21
63
=
2465
63
= 39,13 puntos.
µ
Y
=
10 ×20 + 12,5 ×17 + 15 ×26
63
=
802,5
63
= 12,74 a˜ nos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 119
b)
σ
2
X
=
1
63
_
(15
2
×19 + 40
2
×23 + 60
2
×21) −63 ×39,13
2
_
,
=
1
63
(116675 −96462,88) ,
=
20212,12
63
= 320,83 (puntos)
2
,
σ
X
= 17,91 puntos.
σ
2
Y
=
1
63
_
(10
2
×20 + 12,5
2
×17 + 15
2
×26) −63 ×12,74
2
_
,
=
1
63
(10506,25 −10225,38) ,
=
280,87
63
,
= 4,46 (a˜ nos)
2
,
σ
Y
= 2,11 a˜ nos.
c)
σ
XY
=
1
63
((15 ×3 ×10 + 15 ×6 ×12,5 + 15 ×10 ×15
+40 ×8 ×10 + 40 ×4 ×12,5 + 40 ×11 ×15
+60 ×9 ×10 + 60 ×7 ×12,5 + 60 ×5 ×12,5)
−63 ×39,13 ×12,74) ,
=
1
63
(30775 −63 ×39,13 ×12,74) ,
=
−631,52
63
,
= −10,02 .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 120
r
XY
=
−10,02
17,91 ×2,11
= −0,265 .
d) .
y
i
Y |X > 30
10 9 −11 8 + 7 = 17
12,5 11 −14 4 + 7 = 11
15 14 −16 11 + 5 = 16
Total 44
µ
Y |X>30
=
10 ×17 + 12,5 ×11 + 15 ×16
44
=
547,5
44
= 12,44 a˜ nos.
e) .
x
i
X|Y > 11
15 0 −30 6 + 10 = 16
40 30 −50 4 + 11 = 15
60 50 −70 7 + 5 = 12
Total 43
µ
X|Y >11
=
15 ×16 + 40 ×15 + 60 ×12
43
=
1560
43
= 36,28 puntos.
24. La siguiente tabla resume las horas semanales que un grupo de ni˜ nos
pasa frente al computador (Y ) respecto a su edad (X).
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 121
X Y
2-4 4-6 6-8
12-14 13 14 15
14-16 12 15 16
a) Determine el promedio de horas a la semana y de edad de este
grupo de ni˜ nos.
b) Determine la cantidad de horas m´as frecuentes que pasan frente
al computador los ni˜ nos mayores de 14 a˜ nos?
c) ¿Cu´al es la edad media de los ni˜ nos que pasan menos de 6 horas
frente al computador?
d) Determine el coeficiente de correlaci´on lineal.
Des.
Y
y
i
3 5 7
x
i
X 2 −4 4 −6 6 −8 Total
13 12 −14 13 14 15 42
15 14 −16 12 15 16 43
Total 25 29 31 85
a)
µ
X
=
13 ×42 + 15 ×43
85
=
1191
85
= 14,01 a˜ nos.
µ
Y
=
3 ×25 + 5 ×29 + 7 ×31
85
=
437
85
= 5,14 horas.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 122
b) .
y
i
Y |X > 14
3 2 −4 12
5 4 −6 15
7 6 −8 16
Total 43
Mo(Y |X > 14) = 6 +
_
16 −15
(16 −15) + (16 −0)
_
2 ,
= 6 +
1
1 + 16
2 ,
= 6 + 0,12 ,
= 6,12 horas.
c) .
x
i
X|Y < 6
13 12 −14 13 + 14 = 27
15 14 −16 12 + 15 = 27
Total 54
µ
X|Y <6
=
13 ×27 + 15 ×27
54
=
756
54
= 14 a˜ nos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 123
d)
σ
XY
=
1
85
((13 ×13 ×3 + 13 ×14 ×5 + 13 ×15 ×7
+15 ×12 ×3 + 15 ×15 ×5 + 15 ×16 ×7)
−85 ×14,01 ×5,14)
=
1
85
(6127 −85 ×14,01 ×5,14) ,
=
6,03
85
,
= 0,071 (a˜ nos)× (horas).
σ
2
X
=
1
85
_
(13
2
×42 + 15
2
×43) −85 ×14,01
2
_
,
=
1
85
(16773 −16683,81) ,
=
89,19
85
,
= 1,05 (a˜ nos)
2
,
σ
X
= 1,02 a˜ nos.
σ
2
Y
=
1
85
_
(3
2
×25 + 5
2
×29 + 7
2
×31) −85 ×5,14
2
_
,
=
1
85
(2469 −2245,67) ,
=
223,33
85
,
= 2,63 (horas)
2
,
σ
Y
= 1,62 horas.
r
XY
=
0,071
1,02 ×1,62
= 0,043 .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 124
25. La tabla muestra el gasto mensual en diarios y revistas de 45 familias
en miles de pesos, diferenciadas seg´ un si tienen autom´ovil o no.
Gasto mensual Con autom´ovil Sin autom´ovil
1-5 7 3
5-10 5 4
10-15 10 6
15-25 6 4
a) ¿Cu´al es el gasto mensual medio en diarios y revistas de estas
familias?
b) ¿Qu´e porcentaje de familias gastan mensualmente m´as de $12000
en diarios y revistas?
c) ¿Cu´al es el gasto medio de las familias que no tienen autom´ovil?
d) ¿Son los gastos en diarios y revistas de las familias con autom´ovil
m´as homog´eneos que las sin autom´ovil?
Des.
Y
x
i
X CA SA Total
3 1 −5 7 3 10
7,5 5 −10 5 4 9
12,5 10 −15 10 6 16
20 15 −25 6 5 10
Total 18 17 45
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 125
a)
µ
X
=
3 ×10 + 7,5 ×9 + 12,5 ×16 + 20 ×10
45
,
=
497,5
45
= 11,06 miles de pesos.
b)
12 = 10 +
_
α ×45
100
−9
_
5
16
,
α =
_
(12 −10)
16
5
+ 9
_
100
45
,
= (6,4 + 9)
100
45
,
= 15,4
100
45
,
= 34,22 % .
El 34,22 % de las familias gasta mensualmente menos de $12000,
luego el 65,78 % de las familas gasta m´as de $12000 mensualmente.
c)
µ
X|Y =SA
=
3 ×3 + 7,5 ×4 + 12,5 ×6 + 20 ×4
17
,
=
194
17
= 11,41 miles de pesos.
d)
µ
X|Y =CA
=
3 ×7 + 7,5 ×5 + 12,5 ×10 + 20 ×6
28
,
=
303,5
28
= 10,84 miles de pesos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 126
σ
2
X|Y =CA
=
1
28
_
(3
2
×7 + 7,5
2
×5 + 12,5
2
×10 + 20
2
×6) −28 ×10,84
2
_
,
=
1
28
(4306,75 −3290,16) ,
=
1016,59
28
,
= 36,31 (miles de pesos)
2
,
σ
X|Y =CA
= 6,03 miles de pesos.
σ
2
X|Y =SA
=
1
17
_
(3
2
×3 + 7,5
2
×4 + 12,5
2
×6 + 20
2
×4) −17 ×11,41
2
_
,
=
1
17
(2789,50 −2213,20) ,
=
576,30
17
,
= 33,90 (miles de pesos)
2
,
σ
X|Y =SA
= 5,82 miles de pesos.
CV
X|Y =CA
=
6,03
10,84
100 % = 55,6 % .
CV
X|Y =SA
=
5,82
11,41
100 % = 51,0 % .
Los gastos en diarios y revistas de las familias sin autom´ovil son
m´as homog´eneos que las familias con autom´ovil.
26. La siguiente tabla muestra las alturas y pesos de un grupo de j´ovenes
deportistas.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 127
Altura (X) Edades (Y)
(en mt.) 13-17 17-20
1.4-1.5 14 10
1.5-1.7 20 15
1.7-1.8 12 17
a) ¿Cu´al es la edad m´as com´ un de aquellos que miden como m´ınimo
1.5 mt.?
b) ¿Cu´al es la altura media de los que tienen a lo m´as 17 a˜ nos?
c) ¿Qu´e porcentaje de estos j´ovenes tienen entre 17 y 20 a˜ nos y miden
entre 1.5 y 1.8 mt.?
d) Determine la variabilidad de las edades y las alturas.
Des.
Y
y
i
15 18,5
x
i
X 13 −17 17 −20 Total
1,45 1,4 −1,5 14 10 24
1,60 1,5 −1,7 20 15 35
1,75 1,7 −1,8 12 17 29
Total 46 42 88
a) .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 128
y
i
Y |X > 15
15 13 −17 20 + 12 = 32
18,5 17 −20 15 + 17 = 32
Total 64
Mo(Y |X > 15)
1
= 13 +
_
32 −0
(32 −0) + (32 −32)
_
4100 %
= 17 a˜ nos.
Mo(Y |X > 15)
2
= 17 +
_
32 −32
(32 −32) + (32 −0)
_
3100 %
= 17 a˜ nos.
En este caso si tienen dos modas y ambas iguales.
b) .
x
i
X|Y < 17
1,45 1,4 −1,5 14
1,60 1,5 −1,7 20
1,75 1,7 −1,8 12
Total 46
µ
X|Y <17
=
1,45 ×14 + 1,60 ×20 + 1,75 ×12
46
=
73,3
46
= 1,59 mt.
c)
15 + 17
88
=
32
88
= 0,3636100 .
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 129
Equivalentemente, el 36,36 % de estos j´ovenes tiene entre 17 y 20
a˜ nos y miden entre 1.5 y 1.8 mt.
d)
µ
X
=
1,45 ×24 + 1,60 ×35 + 1,75 ×29
88
=
141,55
88
= 1,61 mt.
µ
Y
=
15 ×46 + 18,5 ×42
88
=
1467
88
= 16,67 a˜ nos.
σ
2
X
=
1
88
_
(1,45
2
×24 + 1,60
2
×35 + 1,75
2
×29) −88 ×1,61
2
_
,
=
1
88
(228,87 −228,10) ,
=
0,77
88
,
= 0,0087 (mt)
2
,
σ
X
= 0,093 mt.
σ
2
Y
=
1
88
_
(15
2
×46 + 18,5
2
×42) −88 ×16,67
2
_
,
=
1
88
(24724,50 −24454,22) ,
=
270,28
88
,
= 3,07 (a˜ nos)
2
,
σ
X
= 1,75 a˜ nos.
27. La tabla siguiente muestra los litros de alcohol (X) utilizados en un pro-
ceso de limpieza de ciertos filtos, por algunas farmacias y el presupuesto
disponible de ellas (Y), en miles de pesos.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 130
X Y
35-60 60-110 110-180
1-6 18 7 8
6-12 4 1 6
12-15 7 8 4
a) ¿Cu´al es el presupuesto medio de estas farmacias? ¿Cu´al es la
cantidad promedio de litros de alcohol utilizados?
b) ¿Cu´antos litros utilizan en promedio las farmacias con unpre-
supuesto inferior a los 110 mil?
c) De las farmacias que utilizan m´as de 6 litros de alcohol, ¿qu´e por-
centaje de ellas tienen un presupuesto inferior a los 60 mil?
d) Determine el coeficiente de correlaci´on lineal.
Des.
Y
y
i
47,5 85 145
x
i
X 35 −60 60 −110 110 −180 Total
3,5 1 −6 18 7 8 33
9,0 6 −12 4 1 6 11
13,5 12 −15 7 8 4 19
Total 29 16 18 63
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 131
a)
µ
X
=
3,5 ×33 + 9,0 ×11 + 13,5 ×19
63
=
471
63
= 7,48 litros.
µ
Y
=
47,5 ×29 + 85 ×16 + 145 ×18
63
=
5347,5
63
= 84,88 miles de pesos.
b) .
x
i
X|Y < 110
3,5 1 −6 18 + 7 = 25
9,0 6 −12 4 + 1 = 5
13,5 12 −15 7 + 8 = 15
Total 45
µ
X|Y <110
=
3,5 ×25 + 9,0 ×5 + 13,5 ×15
45
=
335
45
= 7,44 litros.
c) .
y
i
Y |X > 6
47,5 35 −60 4 + 7 = 11
85 60 −110 1 + 8 = 9
145 110 −180 6 + 4 = 10
Total 30
11
30
= 0,367
El 36,7 % de las farmacias que utilizan m´as de 6 litros de alcohol
en la limpieza de sus filtros, tiene un presupuesto inferior a $60000.
Carlos Bustos-L´opez
CAP
´
ITULO 1. ESTAD
´
ISTICAS DESCRIPTIVAS: DEFINICIONES 132
d)
σ
XY
=
1
63
((3,5 ×18 ×47,5 + 3,5 ×7 ×85 + 3,5 ×8 ×145
+9,0 ×4 ×47,5 + 9 ×1 ×85 + 9 ×6 ×145
+13,5 ×7 ×47,5 + 13,5 ×8 ×85 + 13,5 ×4 ×145)
−63 ×7,48 ×84,88) ,
=
1
63
(40938,75 −63 ×7,48 ×84,88) ,
=
939,90
63
,
= 14,92 .
σ
2
X
=
1
63
_
(3,5
2
×33 + 9
2
×11 + 13,5
2
×19) −63 ×7,48
2
_
,
=
1
63
(4758 −3524,88) ,
=
1233,12
63
,
= 19,57 (litros)
2
,
σ
X
= 4,42 litros.
σ
2
Y
=
1
63
_
(47,5
2
×29 + 85
2
×16 + 145
2
×18) −63 ×84,88
2
_
,
=
1
63
(559481,25 −453890,71) ,
=
105590,54
63
,
= 1676,04 (miles de pesos)
2
,
σ
Y
= 40,94 miles de pesos.
r
XY
=
14,92
4,42 ×40,94
= 0,082 .
Carlos Bustos-L´opez
Cap´ıtulo 2
Regresi´on Lineal
2.1. Modelo de Regresi´on Lineal
La idea fundamental de los modelos de regresi´on es, poder representar
de la mejor forma posible el comportamiento de los datos. Los datos tienen
distintos comportamientos dependiendo del tipo de variable que se est´e in-
vestigando. Si se observan dos variables al mismo tiempo, se puede estar
interesado en el comportamiento conjunto de estas variables y a trav´es del
coeficientes de correlaci´on podriamos conocer el tipo de asociaci´on que exis-
te entre ellas. El modelo matem´atico m´as simple que intenta representar el
comportamiento de los datos es el modelo lineal, el cual parte de la base que
es posible ajustar una linea recta a las observaciones, siendo esta ecuaci´on
una forma de resumir y representar la informaci´on. El modelo de regresi´on
lineal simple en la versi´ on frecuentista, considera las observaciones de pares
ordenados (x
i
, y
i
), con i =, . . . , n. Para el modelo
y = β
0

1
x + ε ,
133
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 134
en general, el inter´es se concentra en la estimaci´on de los par´ametros =
¯

0
, β
1
),
los cuales se pueden obtener mediante los EMCO
1
al resolver la equaci´on:
m´ın
β

n
i=1
ε
2
i
= m´ın
β

n
i=1
(y
i
−β
0
−β
1
x
i
)
2
,
derivando con respecto a β
0
y β
1
e igualando a cero se obtienen:
ˆ
β
0
=
¯
Y −
ˆ
β
1
¯
X ,
ˆ
β
1
=
S
XY
S
XX
,
donde S
XY
=

n
i=1
(x
i

¯
X)(y
i

¯
Y ) y S
XX
=

n
i=1
(x
i

¯
X)
2
, siendo (
¯
X,
¯
Y ),
las medias muestrales respectivas. De esa forma el modelo de regresi´on lineal
estimado est´a dado por:
ˆ y
i
=
ˆ
β
0
+
ˆ
β
1
x
i
,
para todo i = 1, . . . , n.
Adem´as, se puede determinar el grado de asociaci´on representada por el
modelo de regresi´on lineal estimado para las observaciones, este coeficiente
es denominado R
2
y corresponde exactamente al cuadrado del coeficiente de
correlaci´on lineal de Pearson, que adem´as puede ser calculado por:
R
2
= (r
XY
)
2
=
S
2
XY
S
XX
S
Y Y
,
donde S
Y Y
=

n
i=1
(y
i

¯
Y )
2
, y su interpretaci´ on es que el modelo explica a
los observaciones (o representa) en un R
2
× 100 %. Con un poco de algebra
se puede llegar a las siguientes expresiones simplificadas de S:
S
XY
=
n

i=1
x
i
y
i
−n
¯
X
¯
Y , S
XX
=
n

i=1
x
2
i
−n
¯
X
2
, S
Y Y
=
n

i=1
y
2
i
−n
¯
Y
2
.
1
Estimadores de m´ınimos cuadrados ordinarios.
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 135
2.2. Ejercicios Resueltos
1. La siguiente tabla muestra el flujo diario de autom´oviles (X) en miles,
y su cantidad de part´ıculas que emiten en mg/cm
3
.
X Y
19,09 522,10
27,83 1198,30
39,10 1472,00
39,10 1239,70
39,10 1674,40
55,89 2173,50
55,89 1697,40
76,36 1745,70
a) Determine el modelo de regresi´on lineal simple asociado.
b) Determine el grado de explicaci´on del modelo.
c) Para un flujo de 20000 autom´oviles diarios, ¿Cu´al ser´ıa la cantidad
esperada de particulas en suspenci´on dadas por este flujo?
d) Determine la cantidad de autom´oviles que generan 1000 mg/cm
3
en un d´ıa.
Des.
Completamos la tabla con las respectivas multiplicaciones y sumas para
determinar los par´ametros del modelo.
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 136
X Y XY X
2
Y
2
19,09 522,10 9966,89 364,43 272588,41
27,83 1198,30 33348,69 774,51 1435922,89
39,10 1472,00 57555,20 1528,81 2166784,00
39,10 1239,70 48472,27 1528,81 1536856,09
39,10 1674,40 65469,04 1528,81 2803615,36
55,89 2173,50 121476,92 3123,69 4724102,25
55,89 1697,40 94867,69 3123,69 2881166,76
76,36 1745,70 133301,65 5830,85 3047468,49
352,36 11723,10 564458,34 17803,60 18868504,25
a)
¯
X =
352,36
8
= 44,05
¯
Y =
11723,10
8
= 1465,39
S
XY
= 564458,34 −8 ×44,05 ×1465,39 = 48054,90
S
XX
= 17803,60 −8 ×44,05
2
= 2280,38
S
Y Y
= 18868504,25 −8 ×1465,39
2
= 1689561,43
ˆ
β
1
=
48054,90
2280,38
= 21,07
ˆ
β
0
= 1465,39 −21,07 ×44,05 = 537,26
ˆ y = 537,26 + 21,07x
b)
R
2
=
48054,90
2
2280,38 ×1689561,43
= 0,5994
El modelo representa a las observaciones en un 59,94 %.
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 137
c)
ˆ y = 537,26 + 21,07 ×20
= 958,66 mg/cm
3
.
d)
1000 = 537,26 + 21,07x
x =
1000 −537,26
21,07
= 21,96 miles de autom´oviles.
2. Una empresa desea determinar como la inversi´on que ha realizado en
publicidad (X) en UF, de los ltimos meses ha afectado la demanda de
su producto (Y ) en miles de unidades. Para tal efecto ha recopilado la
siguiente informaci´on dque se resume en la tabla.
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 138
X Y
105,80 27,60
121,90 32,20
85,10 25,30
75,90 29,90
92,00 23,00
92,00 18,40
96,60 39,10
78,20 27,60
66,70 23,00
138,00 34,50
101,20 20,70
94,30 29,90
110,40 34,50
a) Determine un modelo de regresi´on lineal.
b) La empresa est´a interesada en determinar cu´al debe ser la cantidad
que debe invertir en publicidad de tal forma que espere tener una
venta de 30000 unidades de su producto.
c) Si no quiere invertir m´as de 80 UF en publicidad, ¿Cu´al ser´ıa la
cantidad m´axima de unidades que esperar´ıa vender?
d) ¿Cu´al es el grado de ajuste del modelo?
Des.
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 139
X Y XY X
2
Y
2
105,80 27,60 2920,08 11193,64 761,76
121,90 32,20 3925,18 14859,61 1036,84
85,10 25,30 2153,03 7242,01 640,09
75,90 29,90 2269,41 5760,81 894,01
92,00 23,00 2116,00 8464,00 529,00
92,00 18,40 1692,80 8464,00 338,56
96,60 39,10 3777,06 9331,56 1528,81
78,20 27,60 2158,32 6115,24 761,76
66,70 23,00 1534,10 4448,89 529,00
138,00 34,50 4761,00 19044,00 1190,25
101,20 20,70 2094,84 10241,44 428,49
94,30 29,90 2819,57 8892,49 894,01
110,40 34,50 3808,80 12188,16 1190,25
1258,10 365,70 36030,19 126245,85 10722,83
a)
¯
X =
1258,10
13
= 96,78
¯
Y =
365,70
13
= 28,13
S
XY
= 36030,19 −13 ×96,78 ×28,13 = 638,71
S
XX
= 126245,85 −13 ×96,78
2
= 4483,06
S
Y Y
= 10722,83 −13 ×28,13
2
= 435,97
ˆ
β
1
=
638,71
4483,06
= 0,142
ˆ
β
0
= 28,13 −0,142 ×96,78 = 14,39
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 140
ˆ y = 14,39 + 0,142x
b)
30 = 14,39 + 0,142x
x =
30 −14,39
0,142
= 109,93 UF
c)
ˆ y = 14,39 + 0,142 ×80
= 25,75 miles de unidades.
d)
R
2
=
638,71
2
4483,06 ×435,97
= 0,2087
El modelo explica a las observaciones en un 20,87 %.
3. En un estudio realizado al contenido de calor´ıas (X) en kcal, respecto al
nivel de grasas (Y ) en g, de cierto producto, se recopilaron los siguientes
datos:
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 141
X Y
103,50 161,00
46,00 115,00
92,00 138,00
92,00 115,00
108,10 207,00
69,00 126,50
57,50 126,50
46,00 80,50
34,50 92,00
80,50 149,50
a) Determine un modelo de regresi´on, que permita determinar el
comportamiento de los niveles grasa por calir´ıas.
b) ¿Cu´antas calor´ıas contiene 110 g de grasa?
c) ¿Cu´antos gramos de grasa se necesitan para tener 100 kcal?
d) Determine el nivel de ajuste del modelo estimado.
Des.
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 142
X Y XY X
2
Y
2
103,50 161,00 16663,50 10712,25 25921,00
46,00 115,00 5290,00 2116,00 13225,00
92,00 138,00 12696,00 8464,00 19044,00
92,00 115,00 10580,00 8464,00 13225,00
108,10 207,00 22376,70 11685,61 42849,00
69,00 126,50 8728,50 4761,00 16002,25
57,50 126,50 7273,75 3306,25 16002,25
46,00 80,50 3703,00 2116,00 6480,25
34,50 92,00 3174,00 1190,25 8464,00
80,50 149,50 12034,75 6480,25 22350,25
729,10 1311,00 102520,20 59295,61 183563,00
a)
¯
X =
729,10
10
= 72,91
¯
Y =
1311,00
10
= 131,10
S
XY
= 102520,20 −10 ×72,91 ×131,10 = 6935,19
S
XX
= 59295,61 −10 ×72,91
2
= 6136,93
S
Y Y
= 183563,00 −10 ×131,10
2
= 11690,9
ˆ
β
1
=
6935,19
6136,93
= 1,13
ˆ
β
0
= 131,10 −1,13 ×72,91 = 48,71
ˆ y = 48,71 + 1,13x
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 143
b)
110 = 48,71 + 1,13x
x =
110 −48,71
1,13
= 54,24 kcal.
c)
ˆ y = 48,71 + 1,13 ×100
= 161,71 g.
d)
R
2
=
6935,19
2
6136,93 ×11690,9
= 0,6704
El modelo tiene un ajuste del 67,04 % de los datos.
4. En un centro hospilatario se ha implementado una nueva campa˜a de
provenci´on para disminuir el porcentaje de afecciones respiratorias en
el periodo invernal, para ello han distribuido una serie de folletos ex-
plicativos donde una de las medidas m´as importantes es disminci´on de
niveles de toxicidad derivados del humo del cigarrillo por lo cual se les
recomienda a las personas que no fumen dentro de su hogar. A contin-
uaci´on se muestra una tabla con los porcentajes de personas que han
dejado de fumar al interior de sus hogares (X) y el porcentaje de per-
sonas al interior del hogar que han sufrido de afecciones respiratorias
durante el periodo (Y ).
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 144
X( %) Y ( %)
23,00 43,70
27,60 41,40
29,90 36,80
32,20 34,50
34,50 34,50
39,10 32,20
46,00 32,20
48,30 29,90
50,60 27,60
46,00 29,90
a) Determine si se puede establecer alg´ un modelo simple que refleje
el comportamiento de estas medidas.
b) Establezca el porcentaje esperado de personas por hogar que ten-
dr´ıan alg´ un problema respiratorio, si el 30 % de ellas ha dejado de
fumar al interior de sus hogares.
c) Si el porcentaje de personas afectadas por problemas respiratorios
ha sido de un 30 %, ¿Cu´al ha sido el porcentaje de personas que
ha seguido las sugerencias del centro de salud?
d) ¿Cu´al es el nivel de ajuste del modelo de regresi´on lineal estimado?
Des.
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 145
X Y XY X
2
Y
2
23,00 43,70 1005,10 529,00 1909,69
27,60 41,40 1142,64 761,76 1713,96
29,90 36,80 1100,32 894,01 1354,24
32,20 34,50 1110,90 1036,84 1190,25
34,50 34,50 1190,25 1190,25 1190,25
39,10 32,20 1259,02 1528,81 1036,84
46,00 32,20 1481,20 2116,00 1036,84
48,30 29,90 1444,17 2332,89 894,01
50,60 27,60 1396,56 2560,36 761,76
46,00 29,90 1375,40 2116,00 894,01
377,20 342,70 12505,56 15065,92 11981,85
a)
¯
X =
377,20
10
= 37,72
¯
Y =
342,70
10
= 34,27
S
XY
= 12505,56 −10 ×37,72 ×34,27 = −421,08
S
XX
= 15065,92 −10 ×37,72
2
= 837,94
S
Y Y
= 11981,85 −10 ×34,27
2
= 237,52
ˆ
β
1
=
−421,08
837,94
= −0,503
ˆ
β
0
= 34,27 −(−0,503) ×37,72 = 53,24
ˆ y = 53,24 −0,503x
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 146
b)
ˆ y = 53,24 −0,503 ×30
= 38,15 %
c)
30 = 53,24 −0,503x
x =
30 −53,24
−0,503
=
−23,24
−0,503
= 46,20 %
d)
R
2
=
(−421,08)
2
837,94 ×237,52
= 0,8909
El modelo explica el 89,09 % del comportamiento de las observa-
ciones.
5. En un experimento con ratas de laboratorio sobre el nivel de glucosa
en la sangre (Y ), en mg/dL, bajo la administraci´on de cierto f´armaco
(X), en g/Kgr, se recopil´o la siguiente informaci´on
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 147
X(g/Kgr) Y (mg/dL)
8,28 55,20
7,59 48,30
6,44 50,60
5,98 50,60
6,21 41,40
5,98 52,90
6,21 43,70
6,67 29,90
4,60 20,70
5,98 13,80
8,51 57,50
7,82 48,30
a) Estime el modelo de regresi´on para la respuesta nivel de glicemia
en la sangre de estas ratas.
b) Determine el nivel de ajuste del modelo estimado.
c) ¿Qu´e dosis es necesaria ser administrada a las ratas para que su
nivel de glucosa sea de 50 mg/dL?
d) ¿Qu´e nivel de glicemia tendr´ıa una rata a la que se le administre
8 g/kgr?
Des.
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 148
X Y XY X
2
Y
2
8,28 55,20 457,06 68,56 3047,04
7,59 48,30 366,60 57,61 2332,89
6,44 50,60 325,86 41,47 2560,36
5,98 50,60 302,59 35,76 2560,36
6,21 41,40 257,09 38,56 1713,96
5,98 52,90 316,34 35,76 2798,41
6,21 43,70 271,38 38,56 1909,69
6,67 29,90 199,43 44,49 894,01
4,60 20,70 95,22 21,16 428,49
5,98 13,80 82,52 35,76 190,44
8,51 57,50 489,33 72,42 3306,25
7,82 48,30 377,71 61,15 2332,89
80,27 512,90 3541,13 551,27 24074,79
a)
¯
X =
80,27
12
= 6,69
¯
Y =
512,90
12
= 42,74
S
XY
= 3541,13 −12 ×6,69 ×42,74 = 109,96
S
XX
= 551,27 −12 ×6,69
2
= 14,20
S
Y Y
= 24074,79 −12 ×42,74
2
= 2154,30
ˆ
β
1
=
109,96
14,20
= 7,74
ˆ
β
0
= 42,74 −7,74 ×6,69 = −9,04
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 149
ˆ y = −9,04 + 7,74x
b)
R
2
=
109,96
2
14,20 ×2154,30
= 0,3953
El modelo explica s´olo el 39,53 % de las observaciones.
c)
50 = −9,04 + 7,74x
x =
50 + 9,04
7,74
= 7,63 g/Kgr.
d)
ˆ y = −9,04 + 7,74 ×8
= 52,88 mg/dL.
6. En un estudio realizado sobre el gasto en electricidad (Y , en miles de
pesos) derivado del uso de aire acondicionado, respecto al incremento
en grados de temperatura ambiental (X, en grados celsius), arrojo los
siguientes resultados:
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 150
X Y
2,30 7,89
2,76 8,63
3,22 10,40
3,68 11,80
4,14 13,66
4,60 14,61
5,52 18,38
5,98 18,93
6,44 21,76
6,90 23,81
8,05 26,59
8,28 28,84
8,51 29,69
a) Estime el mejor modelo de regresi´on lineal para estas variables.
b) ¿Cu´al es el nivel de ajuste del modelo?
c) Si la temperatura ha sufrido un incremento de 6,5 grados celsius,
¿Cu´al es gasto en electricidad esperado por el concepto de aire
acondicionado?
d) Si los departamentos tuvieron un gasto en electricidad de $30000,
¿Cu´anto fue el incremento en la temperatura?
Des.
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 151
X Y XY X
2
Y
2
2,30 7,89 18,14 5,29 62,24
2,76 8,63 23,81 7,62 74,39
3,22 10,40 33,48 10,37 108,08
3,68 11,80 43,42 13,54 139,22
4,14 13,66 56,56 17,14 186,65
4,60 14,61 67,18 21,16 213,31
5,52 18,38 101,44 30,47 337,71
5,98 18,93 113,20 35,76 358,31
6,44 21,76 140,12 41,47 473,41
6,90 23,81 164,25 47,61 566,68
8,05 26,59 214,03 64,80 706,92
8,28 28,84 238,81 68,56 831,86
8,51 29,69 252,69 72,42 881,67
70,38 234,97 1467,13 436,21 4940,44
a)
¯
X =
70,38
13
= 5,41
¯
Y =
234,97
13
= 18,07
S
XY
= 1467,13 −13 ×5,41 ×18,07 = 196,27
S
XX
= 436,21 −13 ×5,41
2
= 55,72
S
Y Y
= 4940,44 −13 ×18,07
2
= 695,62
ˆ
β
1
=
196,27
55,72
= 3,52
ˆ
β
0
= 18,07 −3,52 ×5,41 = −0,973
Carlos Bustos-L´opez
CAP
´
ITULO 2. REGRESI
´
ON LINEAL 152
ˆ y = −0,973 + 3,52x
b)
R
2
=
196,27
2
55,72 ×695,62
= 0,9939
El modelo explica el 99,39 % de los datos.
c)
ˆ y = −0,973 + 3,52 ×6,5
= 21,907 miles de pesos.
d)
30 = −0,973 + 3,52x
x =
30 + 0,973
3,52
= 8,80 grados celsius.
Carlos Bustos-L´opez
Cap´ıtulo 3
Probabilidades
3.1. Probabilidades
3.1.1. Introducci´on
El concepto de Probabilidades no es ajeno a la vida cotidiana, siempre
estamos, de una forma u otra, utilizando las probabilidades, por ejemplo,
cuando nos preguntamos en la ma˜ nana antes de salir de casa, “¿llover´a o
no?”, lo hacemos bajo un contexto determinado, es decir, si creemos que
existen posibilidades de que ese fen´omeno ocurra.
Adem´as de ciertas evidencias cualitativas que favorezcan el realizar la
pregunta, por ejemplo, si es invierno, si est´a nublado, etc.
Bajo lo anterior, uno trata de responder la pregunta en condiciones de
incerteza, asignando un valor a aquella afirmaci´on, es decir, “s´ı , creo que
llover´a”, o simplemente “no creo que llueva”. Esta asignaci´on subjetiva, le
dar´a mayor, menor o igual peso a cada una de las posibilidades.
153
CAP
´
ITULO 3. PROBABILIDADES 154
La pregunta anterior y sus respectivas respuestas, nos permiten determi-
nar un conjunto de posibilidades y de respectivos valores a cada una de las
respuestas y que pueden ser distintas de sujeto a sujeto.
La forma de medir, objetivamente, la ocurrencia de un evento, dentro
de todas las posibilidades que existen para ese fen´omeno, es a trav´es de la
medida de probabilidad.
3.1.2. Definiciones
Experimento (E)
Definici´on 3.1.1 Un experimento ser´a aquel, que permite recopilar infor-
maci´on sobre alg´ un evento o fen´omeno que tengamos incerteza sobre su com-
portamiento. Es decir, est´a involucrado el azar, por eso denominamos a este
experimento como aleatorio.
La idea de realizar un experimento es: “si el experimento se puede repetir
una cantidad infinita de veces, ´este nos permitir´a descubrir la ley que sostiene
sus resultados”.
Ejemplo 3.1.1 Experimentos aleatorios.
1. El lanzar una moneda al aire y observar su resultado.
2. El lanzamiento de un dado c´ ubico y observar su resultado.
3. Sacar una carta de un mazo al azar y observar su resultado.
Carlos Bustos-L´opez
CAP
´
ITULO 3. PROBABILIDADES 155
Espacio Muestral (Ω)
Definici´on 3.1.2 Es el conjunto de todos los posibles resultados de un ex-
perimento aleatorio. El cual denotaremos con la letra Ω.
Ejemplo 3.1.2 Espacio Muestral de experimentos aleatorios.
1. Ω = {cara, sello}
2. Ω = {1, 2, 3, 4, 5, 6}
3. Ω = {As, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K} ×{♣, ♦, ♥, ♠}
Suceso o Evento
Definici´on 3.1.3 Es un subconjunto del espacio muestral, el cual lo deno-
taremos con letras may´ usculas. (p.e. A ⊆ Ω).
Ejemplo 3.1.3 El experimento E= Lanzar un dado y observar sus resulta-
dos.
Espacio muestral Ω = {1, 2, 3, 4, 5, 6}.
Sucesos:
A= {Sale n´ umero impar}.
B= {Sale n´ umero par}.
C= {Sale un n´ umero menor o igual a 3}.
D= {Sale un n´ umero mayor o igual a 4}.
Carlos Bustos-L´opez
CAP
´
ITULO 3. PROBABILIDADES 156
3.1.3. Probabilidad
La definici´on cl´asica (equiprobable) de probabilidad considera lo siguien-
te:
Definici´on 3.1.4 Si E es un experimento y Ω su espacio muestral asociado,
siempre que Ω est´e formado por un n´ umero contable o numerable de elemen-
tos; entonces, para un suceso A ∈ Ω, se puede escribir la probabilidad de que
ocurra A, como:
IP(A) =
N´ umero de elementos de A
N´ umero de elementos de Ω
,
y que corresponde a:
IP(A) =
Casos Favorables asociados a A
Casos Totales
=
CF(A)
CT(Ω)
.
Ejemplo 3.1.4 Sea el siguiente experimento E: “Tirar un dado c´ ubico y
observar su resultado”.
A: sale 2.
B: sale n´ umero par.
C: el n´ umero es menor o igual a 4.
Determinemos el espacio muestral:
Ω = {1, 2, 3, 4, 5, 6} ,
y los casos totales son:
CT(Ω) = 6 ,
Carlos Bustos-L´opez
CAP
´
ITULO 3. PROBABILIDADES 157
ahora, los casos favorables para cada item:
CF(A) = 1.
CF(B) = 3.
CF(C) = 4.
y c´alculemos las respectivas probabilidades asociadas a estos eventos:
P(A) =
CF(A)
CT(Ω)
=
1
6
.
P(B) =
CF(B)
CT(Ω)
=
3
6
=
1
2
.
P(C) =
CF(C)
CT(Ω)
=
4
6
=
2
3
.
Axiomas
Sean, Ω espacio muestral del experimento E, A un evento en Ω, A
c
el
complemento de A y IP una medida de probabilidad.
1. 0 ≤ IP(A) ≤ 1.
2. IP(Ω) = 1, donde Ω se denomina evento seguro.
3. IP(A) = 1 −IP(A
c
).
4. IP(Ω
c
) = IP(φ) = 0, donde φ se denomina evento imposible.
Carlos Bustos-L´opez
CAP
´
ITULO 3. PROBABILIDADES 158
Teoremas y Definiciones
Definici´on 3.1.5 Sean A y B dos sucesos cualquiera, entonces la probabili-
dad de que ocurra A ´o B, est´a dada por:
IP(A ∪ B) = IP(A) + IP(B) −IP(A ∩ B) .
Definici´on 3.1.6 Si A y B son dos sucesos independientes (estoc´asti-
camente), es decir, la ocurrencia de uno no afecta la ocurrencia del otro y
vice versa, entonces, la probabilidad de que ocurra A y B est´a dada por:
IP(A ∩ B) = IP(A) · IP(B) .
Definici´on 3.1.7 Si A y B son dos sucesos excluyentes, es decir, la ocur-
rencia de uno impide la ocurrencia del otro y vice versa, entonces, la proba-
bilidad de que ocurra A y B est´a dada por:
P(A ∩ B) = 0 ⇒IP(A ∪ B) = IP(A) + IP(B) .
Ejemplo 3.1.5 Sea el siguiente experimento E: “Sacar una carta de un mazo
de 52”.
Adem´as, sean los siguientes eventos:
A: Sale tr´ebol.
B: Sale K.
Determinemos ahora sus respectivas probabilidades asociadas:
Carlos Bustos-L´opez
CAP
´
ITULO 3. PROBABILIDADES 159
CT(Ω) = 52.
CF(A) = 13 =⇒IP(A) =
13
52
=
1
4
.
CF(B) = 4 =⇒IP(B) =
4
52
=
1
13
.
a) Ahora, ¿qu´e ser´a el evento “sale el rey de tr´ebol”?
Lo anterior corresponde al evento A∩ B, y la probabilidad de su ocur-
rencia es:
CF(A ∩ B) = 1 =⇒IP(A ∩ B) =
1
52
,
pero la ocurrencia del evento A no afecta la ocurrencia del evento B,
luego, se tiene que:
IP(A ∩ B) = IP(A) · IP(B) =
1
4
×
1
13
=
1
52
.
∴ A y B son eventos independientes.
b) El evento “Sale rey o sale tr´ebol”, tiene una probabilidad asociada:
CF(A ∪ B) = 4 + 13 −1 =⇒IP(A ∪ B) =
16
52
,
pero por el teorema, se tiene:
IP(A ∪ B) = IP(A) + IP(B) −IP(A ∩ B) =
13
52
+
4
52

1
52
=
16
52
.
c) Sea el evento C: “Sale diamante”, ¿cu´al ser´a la probabilidad del evento
A ∩ C?
Carlos Bustos-L´opez
CAP
´
ITULO 3. PROBABILIDADES 160
Notemos que la ocurrencia del evento C, impide la ocurrencia del evento
A, luego:
P(A ∩ C) = 0 .
∴ A y C son eventos excluyentes.
Definici´on 3.1.8 (Probabilidad Condicional) Si se tienen dos sucesos
posibles A y B en Ω, con IP(B) > 0, entonces la probabilidad de que ocurra
A dado que ya ocurri´o B, est´a dada por:
IP(A|B) =
IP(A ∩ B)
IP(B)
.
Teorema 3.1.1 (Teorema de Probabilidad Total) Sean los siguientes even-
tos B
i
en Ω, con i = 1, 2, . . . , n, se dir´a que son una partici´on del espacio
muestral Ω, exhaustiva y excluyente, si:
i)
n
_
i=1
B
i
= Ω.
ii) B
i
∩ B
j
= φ, ∀ i = j.
Adem´as, sea A un suceso cualquiera en Ω, de tal forma que podemos escribir
el suceso A como:
A = A ∩ Ω ,
= A ∩ (B
1
∪ B
2
∪ · · · ∪ B
n
) ,
= (A ∩ B
1
) ∪ (A ∩ B
2
) ∪ · · · ∪ (A ∩ B
n
) =
n
_
i=1
(A ∩ B
i
) ,
Carlos Bustos-L´opez
CAP
´
ITULO 3. PROBABILIDADES 161
entonces, utilizando
IP(A|B
i
) =
IP(A ∩ B
i
)
IP(B
i
)
, ∀ i = 1, 2, . . . , n ,
se tiene que:
IP(A) = IP
_
n
_
i=1
(A ∩ B
i
)
_
,
= IP(A ∩ B
1
) + IP(A ∩ B
2
) +· · · + IP(A ∩ B
n
) ,
= IP(A|B
1
)IP(B
1
) + IP(A|B
2
)P(B
2
) +· · · + IP(A|B
n
)P(B
n
) ,
=
n

i=1
IP(A|B
i
)IP(B
i
) .
Ejemplo 3.1.6 Sea el siguiente experimento E: “Se lanzan dos dados c´ ubicos
equilibrados y se observan sus resultados”, adem´as se ha observado que la
suma T es impar. Determinar la probabilidad de que la suma sea menor a 8.
Definamos los siguientes eventos:
A := T < 8, es decir, la suma es menor a 8.
B := T impar.
Entonces, el evento A ∩ B (“la suma es menor que 8 y es impar”) tiene
los siguientes elementos:
A ∩ B = {3, 5, 7} .
Adem´as, el espacio muestral Ω es el siguiente:
Carlos Bustos-L´opez
CAP
´
ITULO 3. PROBABILIDADES 162
Dado 1
+ 1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
Dado 2 3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Entonces las probabilidades asociadas a los eventos son:
P(B) =
18
36
=
1
2
.
P(A ∩ B) =
12
36
=
1
3
.
Reemplazando se tiene que,
IP(A|B) =
IP(A ∩ B)
IP(B)
=
1/3
1/2
=
2
3
.
Teorema 3.1.2 (Teorema de la Multiplicaci´on) Sean A
1
, A
2
, . . . , A
n

Ω, eventos cualquiera, entonces:
IP

n
\
i=1
A
i
!
=
8
>
<
>
:
Q
n
i=1
IP(A
i
) , si los A
i
son independientes.
IP(A
1
)IP(A
2
|A
1
)IP(A
3
|A
1
∩ A
2
) · · · IP

A
n
|
T
n−1
i=1
A
i

, si los A
i
no son independientes.
Teorema 3.1.3 (Teorema de Bayes) Si un espacio muestral Ω est´a for-
mado por A
1
, A
2
, . . . , A
n
particiones y conocemos la ocurrencia de un suceso
B, que est´a en Ω; entonces para determinar la probabilidad de que un suceso
cualquiera de la partici´on ocurra dado que ocurri´o B, est´a dado por:
IP(A
i
|B) =
IP(B|A
i
)IP(A
i
)
n

j=1
IP(B|A
j
)IP(A
j
)
, ∀ i = 1, 2, . . . , n .
Carlos Bustos-L´opez
CAP
´
ITULO 3. PROBABILIDADES 163
Ejemplo 3.1.7 En la fabricaci´on de un lote de art´ıculos, intervienen tres
m´aquinas: M
1
, M
2
y M
3
. Se sabe que el 20 % de los art´ıculos del lote provienen
de M
1
, el 30 % de M
2
y el resto de M
3
. Adem´as, la m´aquina M
1
produce un
1 % de art´ıculos defectuosos, M
2
un 2 % y M
3
un 3 %. Se selecciona un art´ıcu-
lo al azar del lote y se observa que es defectuoso. Determinar la probabilidad
de que el art´ıculo haya sido fabricado por M
2
.
Definamos los siguientes eventos:
A
i
:= el art´ıculo seleccionado proviene de la m´aquina M
i
, con i = 1, 2, 3.
B:= el art´ıculo es defectuoso.
Del enunciado se tiene que:
IP(A
1
) = 0,2 , IP(A
2
) = 0,3 , IP(A
3
) = 0,5
IP(B|A
1
) = 0,01 , IP(B|A
2
) = 0,02 , IP(B|A
3
) = 0,03 .
Luego, la probabilidad pedida es:
IP(A
2
|B) =
IP(B|A
2
)IP(A
2
)
3

i=1
IP(B|A
i
)IP(A
i
)
,
=
0,02 ×0,3
0,01 ×0,2 + 0,02 ×0,3 + 0,03 ×0,5
,
=
0,006
0,023
,
≈ 0,26 .
Carlos Bustos-L´opez
Cap´ıtulo 4
Variables Aleatorias
4.1. Variable Aleatoria
Sea (Ω, A, IP) un espacio de probabilidad. Una variable aleatoria X es
una funci´on medible desde (Ω, A) hasta (IR, B(IR)). Adem´as, sea A cualquier
subconjunto de la recta real y sea IP(X ∈ A la probabilidad de que el valor
de X pertenezca al subconjunto A. Entonces IP(X ∈ A) es igual a la proba-
bilidad de que el resultado s ∈ B del experimento, sea tal que X(s) ∈ A, es
decir
1
:
IP(X ∈ A) = IP({s : X(s) ∈ A}) .
Existen b´asicamente dos tipos de variables aleatorias (v.a.), las discretas
y las continuas, que se diferencias en el recorrido de sus posibles resultados.
1
Definici´on de distribuci´on de una variable aleatoria, DeGroot, 1988.
164
CAP
´
ITULO 4. VARIABLES ALEATORIAS 165
4.1.1. Varaibles Aleatorias Discretas
La v.a. X se dice que es discreta, si su conjunto de posibles resultados
(soporte) B ∈ Ω (subconjunto numerable de los reales) es un conjunto finito
o infinito numerable.
Definici´on 4.1.1 Llamaremos funci´on de distribuci´on de probabili-
dad (f.d.p.) de la v.a. X a:
p
X
(x) = IP(X = x) , ∀ x ∈ B .
La cual cumple:
0 ≤ p
X
(x) ≤ 1 , ∀ x ∈ B .

x∈B
p
X
(x) =

x∈B
IP(X = x) = 1 .
4.1.2. Varaibles Aleatorias Continuas
La v.a. X se dice que es continua, si su conjunto de posibles resultados
(soporte) B ∈ Ω es un conjunto infinito no numerable.
Definici´on 4.1.2 Llamaremos funci´on de distribuci´on acumulada (f.d.a.)
de la v.a. X, si existe una funci´on no negativa f, definida sobre la recta real,
tal que para cualquier intervalo A:
F
X
(x) = IP(X ∈ A) =
_
A
f
X
(x)dx .
l´ım
x→−∞
F
X
(x) = 0 .
Carlos Bustos-L´opez
CAP
´
ITULO 4. VARIABLES ALEATORIAS 166
l´ım
x→+∞
F
X
(x) = 1 .
La funci´on f se denomina funci´on de distribuci´on de probabilidad (f.d.p.) de
X. La cual cumple:
f
X
(x) ≥ 0 , ∀ x ∈ B .
_

−∞
f
X
(x)dx = 1 .
Adem´as, se define para todo a < b ∈ IR que la probabilidad que el valor
de X se encuentre en el intervalo [a, b] esta dada por:
IP(a ≤ X ≤ b) =
_
b
a
f
X
(x)dx .
4.2. Valor Esperado
Definici´on 4.2.1 Llamaremos Valor Esperado o Esperanza Matem´atica
de la v.a. X a:
IE(X) =

x∈B
xIP(X = x) .
La cual cumple, que si a, b ∈ IR, y X una v.a.,
IE(aX + b) = aIE(X) + b .
Definici´on 4.2.2 Llamaremos Momento de Orden k de la v.a. X a:
IE(X
k
) =

x∈B
x
k
IP(X = x) .
Carlos Bustos-L´opez
CAP
´
ITULO 4. VARIABLES ALEATORIAS 167
Se dice que el momento de orden k existe si, y s´olo si, IE(|x|
k
) < ∞. Adem´as, si
la v.a. es acotada, es decir, si existen a, b ∈ IR tales que IP(a ≤ X ≤ b) = 1,
entonces deben existir todos los momentos de X. Sin embargo, es posible
que todos los momentos de orden k existan, sin necesidad que la v.a. X sea
acotada.
Teorema 4.2.1 Si IE(|X|
k
) < ∞para un entero positivo k, entonces IE(|X|
j
) <
∞ para cualquier entero positivo j tal que j < k.
Definici´on 4.2.3 Llamaremos Varianza de la v.a. X a:
VVar(X) = IE((X −IE(X))
2
) .
La cual cumple, que si a, b ∈ IR, y X una v.a.,
VVar(aX + b) = a
2
VVar(X) .
Una forma m´as f´acil de determinar el valor de la varianza de X es consideran-
do la siguiente igualdad:
VVar(X) = IE((X −IE(X))
2
) ,
= IE(X
2
−2XIE(X) + IE
2
(X)) ,
= IE(X
2
) −2IE(X)IE(X) + IE(IE
2
(X)) ,
= IE(X
2
) −2IE
2
(X) + IE
2
(X) ,
= IE(X
2
) −IE
2
(X) .
Carlos Bustos-L´opez
CAP
´
ITULO 4. VARIABLES ALEATORIAS 168
Definici´on 4.2.4 Llamaremos Funci´on Generadora de Momentos (f.g.m.)
de la v.a. X, para cada valor de t ∈ IR a:
ψ(t) = IE(e
tX
) .
Adem´as, se tiene que:
ψ

(0) =
_
d
dt
IE(e
tX
)

¸
¸
¸
t=0
,
= IE
__
d
dt
e
tX

¸
¸
¸
t=0
_
,
= IE
__
Xe
tX

¸
t=0
¸
,
= IE[X] .
De donde se tiene que la f.g.m. ψ(t) en el punto t = 0 corresponde al primer
momento de la v.a. X. As´ı se tiene que:
ψ
(n)
(0) =
_
d
n
dt
n
IE(e
tX
)

¸
¸
¸
t=0
,
= IE
__
d
n
dt
n
e
tX

¸
¸
¸
t=0
_
,
= IE
__
X
n
e
tX

¸
t=0
¸
,
= IE[X
n
] .
Entonces, ψ

(0) = IE(X), ψ

(0) = IE(X
2
), ψ

(0) = IE(X
3
), y as´ı sucesiva-
mente.
Teorema 4.2.2 Sea X una variable acleatoria cuya f.g.m., es ψ
1
; sea Y =
aX +b, donde a y b son constantes; y sea ψ
2
la f.g.m. de Y . Entonces, para
Carlos Bustos-L´opez
CAP
´
ITULO 4. VARIABLES ALEATORIAS 169
cualquier valor de t tal que existe ψ
1
(at),
ψ
2
(t) = e
bt
ψ
1
(at) .
Dem.
ψ
2
(t) = IE(e
tY
) = IE(e
t(aX+b)
) = IE(e
taX
e
tb
) = e
tb
IE(e
taX
) = e
bt
ψ
1
(at) .
Teorema 4.2.3 Si las f.g.m., de dos variables aleatorias X
1
y X
2
son id´enti-
cas para todos los valores de t en un intervalo alrededor del punto t = 0,
entonces las distribuciones de probabilidad de X
1
y X
2
deben ser id´enticas.
Carlos Bustos-L´opez
Cap´ıtulo 5
Inferencia Estad´ıstica
5.1. Estimaci´on
En las secciones anteriores hemos visto distintas formas de como describir
una o dos variables poblacionales, pero en general, tabajamos con una mues-
tra que corresponde a una parte de la poblaci´on y nuestro inter´es es poder
concluir algo sobre el comportamiento de la poblaci´on.
Para responder a las necesidades anteriores, es necesario que utilicemos
la Estad´ıstica Inferencial.
Definici´on 5.1.1 La Estad´ıstica Inferencial, permite concluir, inferir y
deducir aspectos importantes de una poblaci´on mediante el an´alisis de una
muestra de ella.
Definici´on 5.1.2 Muestra Aleatoria (m.a.): Consiste en un conjunto
de variables aleatorias independientes X
1
, X
2
, . . . , X
n
que tienen la misma
densidad de probabilidad f
X
(x|θ) de la variable X asociada a la poblaci´on.
170
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 171
Definici´on 5.1.3 Espacio de Informaci´on (⊃⊂ – ): Es el conjunto de to-
das las posibles muestras aleatorias de tama˜ no n que se pueden obtener de la
poblaci´on. Es decir:
⊃⊂ – = {(x
1
, x
2
, . . . , x
n
) ∈ IR
n
|(x
1
, x
2
, . . . , x
n
) es una m.a. de X}.
Definici´on 5.1.4 Estad´ıstico o estad´ıgrafo (T(X

)): Es cualquier fun-
ci´on de las variables aleatorias que forman la muestra aleatoria y que no
depende de cantidades desconocidas.
p.e.
1. T
1
=
1
n
n

i=1
X
i
2. T
2
=
1
n
n

i=1
X
2
i
3. T
3
=
1
n
n

i=1
(X
i

¯
X)
2
Definici´on 5.1.5 Espacio Param´etrico (Θ): El espacio param´etrico es
el conjunto de todos los valores posibles que puede asumir un par´ametro pobla-
cional.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 172
5.2. Estimaci´on Puntual
Definici´on 5.2.1 Par´ametro: Un par´ametro es una caracter´ıstica de in-
ter´es en la poblaci´on, que tiene un valor fijo, pero desconocido. Generalmente,
se denota con letras griegas (p.e. θ, µ, σ, π, ρ, etc.).
Una de las t´ecnicas m´as utilizadas para poder describir el comportamien-
to de la poblaci´on es la estimaci´on del verdadero valor del par´ametro pobla-
cional, mediante un s´olo valor.
Existen numerosas t´ecnicas de estimaci´on puntual de los par´ametros, las
m´as utilizadas son:
1. M´etodo de los Momentos.
2. M´etodo de M´axima Verosimilitud.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 173
3. M´etodo de los M´ınimos Cuadrados.
4. M´etodos Bayesianos.
5. M´etodos Robustos.
6. M´etodos Computacionales.
5.2.1. M´etodo de M´axima Verosimilitud
Definici´on 5.2.2 La Funci´on de Verosimilitud, corresponde a la fun-
ci´on de probabilidad conjunta de la muestra X

= (X
1
, . . . , X
n
) y est´a dada
por:
L(θ|x

) =
n

i=1
f
X
i
(x
i
|θ) .
Ejemplo 5.2.1 Suponga que x

= (x
1
, x
2
, . . . , x
n
) son los datos asociados a
una muestra aleatoria (X
1
, X
2
, . . . , X
n
) de una poblaci´on Poisson, con fun-
ci´on de probabilidad dada por:
f
X
(x|λ) =
λ
x
e
−λ
x!
.
La funci´on de verosimilitud es:
L(λ|x

) =
n

i=1
f
X
i
(x
i
|λ) =
n

i=1
λ
X
i
e
−λ
X
i
!
= λ
P
n
i=1
X
i
e
−nλ

n
i=1
X
i
!
.
El objetivo es determinar el valor del par´ametro que maximiza la funci´on
de verosimilitud. Donde tambi´en se define la funci´on de log-verosimilitud
como:
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 174
l(λ) = ln
_
λ
P
n
i=1
X
i
e
−nλ

n
i=1
X
i
!
_
,
=
n

i=1
X
i
ln(λ) −nλ −ln
_
n

i=1
X
i
!
_
,
=
n

i=1
X
i
ln(λ) −nλ −
n

i=1
ln X
i
! ,
∂l
∂λ
=
1
λ
n

i=1
X
i
−n = 0
ˆ
λ
MV
=

n
i=1
X
i
n
.
Luego,
ˆ
λ =
¯
X es el estimador m´aximo verosimail de λ.
Ejemplo 5.2.2 Sea una poblaci´on con funci´on de densidad:
f
X
(x|θ) =

1 −θ
x
3θ−1
1−θ
, si 0 ≤ x ≤ 1 .
El estimador m´aximo verosimil de θ es:
L(θ|X
1
, . . . , X
n
) =
n

i=1

1 −θ
X
3θ−1
1−θ
i
,
=
_

1 −θ
_
n
_
n

i=1
X
i
_3θ−1
1−θ
,
l(θ|X
1
, . . . , X
n
) = nln 2 + nln θ −nln(1 −θ) +
3θ −1
1 −θ
n

i=1
ln X
i
,
∂l
∂θ
=
n
θ
+
n
1 −θ
+
3(1 −θ) + (3θ −1)
(1 −θ)
2
n

i=1
ln X
i
= 0 ,
0 =
n
θ
+
n
1 −θ
+
2
(1 −θ)
2
n

i=1
ln X
i
,
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 175
2
(1 −θ)
2
n

i=1
ln X
i
= −
n
θ

n
1 −θ
,
2
(1 −θ)
2
n

i=1
ln X
i
= −
n(1 −θ) + nθ
θ(1 −θ)
,
2
(1 −θ)
2
n

i=1
ln X
i
= −
n
θ(1 −θ)
,
2
(1 −θ)
n

i=1
ln X
i
= −
n
θ
,
ˆ
θ
MV
=
n
n −2

n
i=1
ln X
i
.
Ejercicos Resueltos
1. Despu´es de varios reclamos de diferentes consumidores formulados al
SERNAC, la empresa de productos l´acteos ZOPROLIN ha sido someti-
da a varias inspecciones para verificar la calidad del estado de conser-
vaci´on de la leche en envases tetra pack. Para ello a tomado una caja
al azar con 10 de estos envases donde se ha observado lo siguiente:
B, B, D, B, B, B, D, B, D, B ,
donde B la leche est´a en buen estado, y D la leche est´a descompuesta.
Con estos resultados, ¿Cu´al es la probabilidad de que al tomar cualquier
otra caja se registren 2 envases con leche descompuesta?
Des.
Claramente, el estado de la leche B o D es una variable con un com-
portamiento que puede ser representado mediante un modelo Bernoulli
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 176
(X
i
∼ Ber(p)), entonces el problema se reduce a determinar la mejor
estrategia para estimar p. De esa forma, el estimador MV, se puede
extraer de:
L(p|X
1
, . . . , X
n
) =
n

i=1
p
X
i
(1 −p)
1−X
i
,
= p
P
n
i=1
X
i
(1 −p)
n−
P
n
i=1
X
i
,
l(p|X
1
, . . . , X
n
) =
n

i=1
X
i
ln(p) + (n −
n

i=1
X
i
) ln(1 −p) ,
∂l
∂p
=

n
i=1
X
i
p
+
n −

n
i=1
X
i
(1 −p)
(−1) = 0 ,
0 = (1 −p)
n

i=1
X
i
−p(n −
n

i=1
X
i
) ,
ˆ p =
1
n
n

i=1
X
i
.
2. Considere una m.a., proveniente de una distribuci´on Poisson de par´ametro
λ. Determine el EMV de λ. Des.
L(λ|X
1
, . . . , X
n
) =
n

i=1
λ
X
i
e
−λ
X
i
!
=
λ
P
n
i=1
X
i
e
−nλ

n
i=1
X
i
!
,
l(λ|X
1
, . . . , X
n
) =
n

i=1
X
i
ln(λ) −nλ −ln
_
n

i=1
X
i
!
_
,
∂l
∂λ
=
1
λ
n

i=1
X
i
−n = 0 ,
ˆ
λ =
1
n
n

i=1
X
i
.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 177
3. Considere una m.a., proveniente de una distribuci´on Rayleigh de par´ametro
σ
2
. Determine el EMV de σ
2
. Des.
L(σ
2
|X
1
, . . . , X
n
) =
n

i=1
X
i
σ
2
e

X
2
i

2
,
=
1
σ
2n
n

i=1
X
i
e

1

2
P
n
i=1
X
2
i
,
l(σ
2
|X
1
, . . . , X
n
) =
n

i=1
ln X
i
−nln σ
2

1

2
n

i=1
X
2
i
,
∂l
∂σ
2
= −
n
σ
2

n
i=1
X
2
i
2
(−1)

2
)
2
= 0 ,
ˆ
σ
2
=

n
i=1
X
2
i
2n
.
4. Considere una m.a., proveniente de una distribuci´on Exponencial de
par´ametro λ. Determine el EMV de λ. Des.
L(λ|X
1
, . . . , X
n
) =
n

i=1
λe
−λX
i
= λ
n
e
−λ
P
n
i=1
X
i
,
l(λ|X
1
, . . . , X
n
) = nln λ −λ
n

i=1
X
i
,
∂l
∂λ
=
n
λ

n

i=1
X
i
= 0 ,
ˆ
λ =
n

n
i=1
X
i
.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 178
5. Considere una m.a., proveniente de una distribuci´on Gama de par´amet-
ros α y β. Determine el EMV de β. Des.
L(α|β, X
1
, . . . , X
n
) =
n

i=1
β
α
Γ(α)
X
α−1
i
e
−βX
i
,
=
β

Γ(α)
n
_
n

i=1
X
i
_
α−1
e
−β
P
n
i=1
X
i
,
l(α|β, X
1
, . . . , X
n
) = nαln β −nln Γ(α) + (α + 1)
n

i=1
ln X
i
−β
n

i=1
X
i
,
∂l
∂β
=

β

n

i=1
X
i
= 0 ,
ˆ
β =

n
i=1
X
i
.
6. Considere una m.a., proveniente de una distribuci´on Weibull de par´amet-
ros α y θ. Determine el EMV de θ. Des.
L(θ|α, X
1
, . . . , X
n
) =
n

i=1
α
β
α
X
α−1
i
e

(
X
i
θ
)
α
,
=
α
n
β

_
n

i=1
X
i
_
α−1
e

P
n
i=1
(
X
i
θ
)
α
,
l(α|β, X
1
, . . . , X
n
) = nln α −nαln θ + (α −1)
n

i=1
ln X
i

n

i=1
X
α
i
θ
α
,
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 179
∂l
∂θ
= −

θ

n

i=1
X
α
i
(−α)
θ
α+1
= 0 ,
n

i=1
X
α
i
α
θ
α+1
=

θ
,
θ
α
=

n
i=1
X
α
i
n
,
ˆ
θ =
_
n
i=1
X
α
i
n
_
1/α
.
7. Considere una m.a., proveniente de una distribuci´on Normal de par´amet-
ros µ y σ. Determine los EMV de µ y σ. Des.
L(µ, σ
2
|X
1
, . . . , X
n
) =
n

i=1
1

2πσ
2
e

1

2
(X
i
−µ)
2
,
=
_
1

_
n/2
1

2
)
n/2
e

1

2
P
n
i=1
(X
i
−µ)
2
,
l(µ, σ
2
|X
1
, . . . , X
n
) = −
n
2
ln 2π −
n
2
ln σ
2

1

2
n

i=1
(X
i
−µ)
2
,
∂l
∂µ
= −
1

2
2
n

i=1
(X
i
−µ)(−1) = 0 ,
∂l
∂σ
2
= −
n

2

1
2
n

i=1
(X
i
−µ)
2
(−1)

2
)
2
= 0 ,

n
i=1
(X
i
−µ)
σ
2
= 0 ⇒ ˆ µ =
1
n
n

i=1
X
i
,

n
i=1
(X
i
−µ)
2
2(σ
2
)
2
=
n

2

ˆ
σ
2
=
1
n
n

i=1
(X
i
− ˆ µ)
2
.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 180
8. Considere una m.a., proveniente de una distribuci´on f
X
(x|θ) = (β +
1)x
β
de par´ametro β. Determine el EMV de β. Des.
L(β|X
1
, . . . , X
n
) =
n

i=1
(β + 1)X
β
i
,
= (β + 1)
n
n

i=1
X
β
i
,
l(β|X
1
, . . . , X
n
) = nln(β + 1) + β
n

i=1
ln X
i
,
∂l
∂β
=
n
β + 1
+
n

i=1
= ln X
i
= 0 ,
ˆ
β = −
_
n

n
i=1
ln X
i
+ 1
_
.
5.2.2. M´etodo de los Momentos
Consiste en sustituir los momentos poblacionales de la distribuci´on con
los respectivos momentos muestrales. Luego se construye un sistema de ecua-
ciones p-dimencional
1
.
Definici´on 5.2.3 Sea x

= (x
1
, x
2
, . . . , x
n
) los datos asociados a una m.a.,
(X
1
, X
2
, . . . , X
n
), se define el momento muestral de orden k (k ∈ IN),
como:
m
k
=
1
n
n

i=1
x
k
i
.
1
El fundamento de esta t´ecnica es la convergencia de los momentos muestrales a los
momentos poblacionales a medida que el tama˜ no de la muestra n aumenta.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 181
Definici´on 5.2.4 Sea X una v.a., se define el momento poblacional de
orden k (k ∈ IN), como:
µ
k
= IE(X
k
) =
_
¸
_
¸
_

x∈B
x
k
p
X
(x) , si X es discreta.
_

−∞
x
k
f
X
(x|θ) , si X es continua.
Si p es el n´ umero de par´ametros a estimar, entonces el estimador de momentos
de θ se obtiene al resolver el sistema
2
:
µ
1
= m
1
µ
2
= m
2
.
.
.
µ
p
= m
p
Ejemplo 5.2.3 Suponga que (X
1
, X
2
, . . . , X
n
) es una m.a., de una poblaci´on
Poisson, con par´ametro λ. En este caso hay un s´olo par´ametro y se necesita
s´olo una ecuaci´on:
µ
1
= m
1
=⇒λ =
1
n
n

i=1
x
i
=⇒
ˆ
λ = ¯ x .
Ejemplo 5.2.4 Sea una poblaci´on con funci´on de densidad:
f
X
(x|θ) =

1 −θ
x
3θ−1
1−θ
, si 0 ≤ x ≤ 1 .
2
Este sistema podr´ıa ser no lineal.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 182
El estimador por el m´etodo de los momentos de θ es:
IE(X) =

1 −θ
_
1
0
x · x
3θ−1
1−θ
dx ,
=

1 −θ
_
1
0
x

1−θ
dx ,
=

1 −θ
x

1−θ
+1

1−θ
+ 1
¸
¸
¸
¸
¸
1
0
,
=

1 −θ
1
θ−1
1−θ
,
=

1 +θ
.
=⇒

1 + θ
=
¯
X ,
2θ =
¯
X(θ + 1) ,
2θ =
¯
Xθ +
¯
X ,
2θ −
¯
Xθ =
¯
X ,
θ(2 −
¯
X) =
¯
X ,
ˆ
θ =
¯
X
2 −
¯
X
.
5.2.3. Propiedades de los Estimadores Puntuales
1. Insesgamiento
Definici´on 5.2.5 Un estimador es Insesgado, si el valor medio
de todas sus estimaciones obtenidas con una muestra de tama˜ no n, es
igual al par´ametro que estima. Por lo tanto, si θ es el par´ametro y
ˆ
θ su
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 183
estimador insesgado, se debe cumplir que:
IE(
ˆ
θ) = θ .
Teorema 5.2.1 Si X
1
, X
2
, . . . , X
n
es una m.a., de n variables que
tienen la misma media µ y la misma varianza σ
2
, se cumple que
¯
X, la
media de la muestra, es un estimador insesgado de µ y su varianza es
σ
2
/n.
Proof: Sea
¯
X =
1
n

n
i=1
X
i
, entonces,
IE(
¯
X) = IE
_
n
i=1
X
i
n
_
,
=
1
n
n

i=1
IE(X
i
) ,
=
1
n
n

i=1
µ ,
=
n
n
µ ,
= µ .
Luego,
¯
X es un estimador insesgado del par´ametro µ.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 184
Por otra parte:
VVar(
¯
X) = VVar
_
n
i=1
X
i
n
_
,
=
1
n
2
n

i=1
VVar(X
i
) ,
=
1
n
2
n

i=1
σ
2
,
=
n
n
2
σ
2
,
=
σ
2
n
.
Teorema 5.2.2 Si la varianza S
2
de una m.a., de tama˜ no n, de una
poblaci´on con media µ y varianza σ
2
, se define como:
S
2
=
1
n −1
n

i=1
(X
i

¯
X)
2
,
se cumple que IE(S
2
) = σ
2
, es decir S
2
es un estimador insesgado de
la varianza de la poblaci´on.
Proof:
IE(S
2
) = IE
_
1
n −1
n

i=1
(X
i

¯
X)
2
_
,
=
1
n −1
n

i=1
IE(X
i

¯
X)
2
,
=
1
n −1
n

i=1
IE(X
2
i
−2X
i
¯
X +
¯
X
2
) ,
=
1
n −1
n

i=1
_
IE(X
2
i
) −2IE(X
i
¯
X) + IE(
¯
X
2
)
_
,
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 185
Pero,
IE(X
2
i
) = σ
2
+ µ
2
,
IE(
¯
X
2
) =
σ
2
n
+ µ
2
,
IE(X
i
¯
X) = IE
_
X
i

n
j=1
X
j
n
_
,
=
1
n
n

j=1
IE(X
i
X
j
) ,
=
1
n
_
n

j=1,i=j
IE(X
i
X
j
) + IE(X
2
i
)
_
,
=
1
n
_
(n −1)µ
2

2
+ µ
2
_
,
=
n
n
µ
2
+
σ
2
n
,
= µ
2
+
σ
2
n
,
IE(S
2
) =
1
n −1
n

i=1
_
σ
2
+ µ
2
−2
_
µ
2
+
σ
2
n
_
+
σ
2
n
+ µ
2
_
,
= σ
2
.
Teorema 5.2.3 Si el estimador ˆ p de la proporci´on p de elementos de
una poblaci´on que tienen cierto atributo se define como:
ˆ p =

n
i=1
X
i
n
, X
i
=
_
¸
_
¸
_
1 elemento i-´esimo posee el atributo.
0 si no.
Se cumple que ˆ p es un estimador insesgado de p, y la varianza de ˆ p es
p(1 −p)/n.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 186
Proof:
IE(ˆ p) = IE
_
n
i=1
X
i
n
_
=
1
n
n

i=1
X
i
,
pero
IE(X
i
) = 1 · p + 0 · (1 −p) = p ,
entonces,
IE(ˆ p) =
1
n
n

i=1
p =
n
n
p = p .
VVar(ˆ p) = VVar
_
1
n
n

i=1
X
i
_
=
1
n
2
n

i=1
VVar(X
i
) ,
pero
VVar(X
i
) = IE(X
2
i
) −IE
2
(X
i
) = p −p
2
= p(1 −p) ,
entonces,
VVar(ˆ p) =
1
n
2
n

i=1
p(1 −p) =
n
n
2
p(1 −p) =
p(1 −p)
n
.
Ejemplo 5.2.5 Consideremos la siguiente poblaci´on P{1, 2, 3, 4}. La
media y la varianza poblacionales son respectivamente 2.5 y 1.25. Sacare-
mos todas las muestras posibles con sustituci´on de tama˜ no 2 y evalua-
remos en cada una la media y su varianza y verificaremos que son
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 187
estimadores insesgados.
Muestra
¯
X
i
S
2
i
Muestra
¯
X
i
S
2
i
(1, 1) 1 0 (3, 1) 2 2
(1, 2) 1, 5 0, 5 (3, 2) 2, 5 0, 5
(1, 3) 2 2 (3, 3) 3 0
(1, 4) 2, 5 4, 5 (3, 4) 3, 5 0, 5
(2, 1) 1, 5 0, 5 (4, 1) 2, 5 4, 5
(2, 2) 2 0 (4, 2) 3 2
(2, 3) 2, 5 0, 5 (4, 3) 3, 5 0, 5
(2, 4) 3 2 (4, 4) 4 0
Note que,
¯
¯
X =

16
i=1
¯
X
i
/16 = 40/16 = 2,5, que corresponde a la media
poblacional. Adem´as,

16
i=1
S
2
i
/16 = 20/16 = 1,25, que es la varianza
de la poblaci´on.
2. Consistencia
La consistencia de un estimador est´a relacionada con su proximidad al
par´ametro que estima cuando el tama˜ no de la muestra que se utiliza
tiende a ser infinita. Este es el concepto de convergencia en probabili-
dad.
Definici´on 5.2.6 Un estimador
ˆ
θ de un par´ametro θ es consistente
si se cumple que:
l´ım
n−→∞
IP(|
ˆ
θ −θ| ≤ ε) = 1 .
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 188
Teorema 5.2.4 Si
ˆ
θ es un estimador del par´ametro θ que cumple:
a) l´ım
n−→∞
IP(IE(
ˆ
θ) −θ) = 0.
b) l´ım
n−→∞
VVar(
ˆ
θ) = 0.
entonces,
ˆ
θ es un estimador consistente.
Ejemplo 5.2.6 De una poblaci´on con media IE(X) = µ y varianza
VVar(X) = σ
2
, se extrae una m.a., (X
1
, X
2
, . . . , X
n
). Determine que
¯
X
y S
2
son consistente.
l´ım
n−→∞
IP(IE(
¯
X) −µ) = l´ım
n−→∞
IP(µ −µ) = 0 ,
l´ım
n−→∞
VVar(
ˆ
θ) = l´ım
n−→∞
σ
2
n
= 0 .

¯
X es consistente.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 189
l´ım
n−→∞
IP(IE(S
2
) −σ
2
) = l´ım
n−→∞
VVar
_
n
i=1
(X
i

¯
X)
2
n −1
_
,
= l´ım
n−→∞
1
(n −1)
2
VVar
_
n

i=1
(X
i

¯
X)
2
_
,
= l´ım
n−→∞
1
(n −1)
2
VVar
_
n

i=1
(X
2
i
−2X
i
¯
X +
¯
X
2
)
_
,
= l´ım
n−→∞
1
(n −1)
2
VVar
_
n

i=1
X
2
i
−n
¯
X
2
_
,
= l´ım
n−→∞
1
(n −1)
2
VVar
_
n

i=1
X
2
i
_
,
= l´ım
n−→∞
1
(n −1)
2
_
n

i=1
VVar(X
2
i
) + 2

i<j
Cov(X
i
, X
j
)
_
,
= l´ım
n−→∞
1
(n −1)
2
_
n

i=1

2
+ µ
2
)
_
,
= l´ım
n−→∞
n
(n −1)
2
_
σ
2
+ µ
2
_
= 0 .
Teorema 5.2.5 Si
ˆ
θ
1
es un estimador consistente del par´ametro θ
1
y
θ
2
es un estimador consistente del par´ametro θ
2
se cumple que:
a)
ˆ
θ
1
+
ˆ
θ
2
es un estimador consistente de θ
1

2
.
b)
ˆ
θ
1
ˆ
θ
2
es un estimador consistente de θ
1
θ
2
.
c)
ˆ
θ
1
/
ˆ
θ
2
es un estimador consistente de θ
1

2
.
3. Varianza M´ınima
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 190
Definici´on 5.2.7 Un estimador insesgado de un par´ametro es llamado
de varianza m´ınima, cuando tiene la menor varianza entre todos los
posibles estimadores insesgados del par´ametro
3
.
Ejemplo 5.2.7 Suponga que de una poblaci´on con IE(X) = θ y VVar(X) =
σ
2
se saca una muestra de tama˜ no 3. Decida cu´al de los siguientes es-
timadores es mejor:
ˆ
θ
1
=
1
4
X
1
+
1
2
X
2
+
1
4
X
3
.
ˆ
θ
2
=
¯
X .
Des.
IE(
ˆ
θ
1
) = IE
_
1
4
X
1
+
1
2
X
2
+
1
4
X
3
_
,
=
1
4
IE(X
1
) +
1
2
IE(X
2
) +
1
4
IE(X
3
) ,
=
1
4
θ +
1
2
θ +
1
4
θ ,
= θ .
3
El estimador que tenga la menor varianza es tambi´en llamado el mejor de todos los
estimadores.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 191
Luego
ˆ
θ
1
es insesgado.
IE(
ˆ
θ
2
) = IE
_
¯
X
_
= IE
_
1
3
3

i=1
X
i
_
,
=
1
3
3

i=1
IE(X
i
) ,
=
1
3
3

i=1
θ ,
= θ .
Luego
ˆ
θ
2
es insesgado.
VVar(
ˆ
θ
1
) = VVar
_
1
4
X
1
+
1
2
X
2
+
1
4
X
3
_
,
=
1
4
2
VVar(X
1
) +
1
2
2
VVar(X
2
) +
1
4
2
VVar(X
3
) ,
=
1
4
2
σ
2
+
1
2
2
σ
2
+
1
4
2
σ
2
,
=
3
8
σ
2
.
VVar(
ˆ
θ
2
) = VVar
_
¯
X
_
= VVar
_
1
3
3

i=1
X
i
_
,
=
1
3
2
3

i=1
VVar(X
i
) ,
=
1
3
2
3

i=1
σ
2
,
=
σ
2
3
.
Luego
ˆ
θ
2
es mejor, puesto que tiene menor varianza.
4. Error Cuadr´atico Medio
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 192
Definici´on 5.2.8 El error cuadr´atico medio es el valor esperado
de la desviaci´on cuadr´atica entre el estimador y el par´ametro que esti-
ma.
MSE(θ) = IE(
ˆ
θ −θ)
2
,
= VVar(
ˆ
θ) + b
2
(θ) ,
= IE[(
ˆ
θ −IE(
ˆ
θ))
2
] + (IE(
ˆ
θ) −θ)
2
.
De acuerdo a los valores que pueda tomar el par´ametro, es posible que
un estimador sesgado sea mejor que uno insesgado.
Ejemplo 5.2.8 Suponga que
ˆ
θ
1
y
ˆ
θ
2
son dos estimadores del par´ametro
θ. Sebemos que:
IE(
ˆ
θ
1
) = θ VVar(
ˆ
θ
1
) = 3 ,
IE(
ˆ
θ
2
) = 0,9θ VVar(
ˆ
θ
1
) = 2 .
Des.
MSE(
ˆ
θ
1
) = 3 + (θ −θ)
2
= 3 ,
IE(
ˆ
θ
2
) = 2 + (0,9θ −θ)
2
= 2 + 0,01θ
2
.
Si |θ| > 10,
ˆ
θ
1
es mejor que
ˆ
θ
2
.
Si |θ| < 10,
ˆ
θ
2
es mejor que
ˆ
θ
1
.
5. Suficiencia
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 193
Dada una poblaci´on distribuida f
X
(x|θ), que depende de un s´olo par´ametro
θ se saca una muestra aleatoria (X
1
, X
2
, . . . , X
n
) y una estad´ıstica
ˆ
θ = g(X
1
, X
2
, . . . , X
n
) es utilizada para estimar θ.
Dado que
ˆ
θ es una sola variable aleatoria, y dispon´ıamos de n variables
aleatorias, cabe preguntarse si se “perdi´o” alguna informaci´on al usar
ˆ
θ.
Por ejemplo, si
ˆ
θ = X
1
, es evidente que no fue usada toda la informa-
ci´on.
Definici´on 5.2.9 Una estad´ıstica
ˆ
θ que contenga toda la “informa-
ci´on” respecto al par´ametro que est´a en la muestra, recibe el nombre
de Estad´ıstica Suficiente. Ning´ un otro estimador definido con la
misma muestra puede suministrar informaci´on adicional respecto a θ.
Teorema 5.2.6 Sea (X
1
, X
2
, . . . , X
n
) una m.a., sacada de la poblaci´on
f
X
(x|θ). Si:
g(X
1
, X
2
, . . . , X
n
|θ) =
n

i=1
f
X
(x
i
|θ) ,
y
n

i=1
f
X
(x
i
|θ) = h(
ˆ
θ, θ)g(x
1
, x
2
, . . . , x
n
) ,
en donde g(x
1
, x
2
, . . . , x
n
) no depende de θ, entonces
ˆ
θ es una estad´ısti-
ca suficiente para θ.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 194
Ejemplo 5.2.9 Sea (X
1
, X
2
, . . . , X
n
) de X N(µ, 1).
n

i=1
1


e

1
2
(x
i
−µ)
2
= (2π)

n
2
e

1
2
P
n
i=1
(x
i
−µ)
2
,
= (2π)

n
2
e

1
2
P
n
i=1
((x
i
−¯ x)(¯ x−µ))
2
,
= (2π)

n
2
e

1
2
[
P
n
i=1
(x
i
−¯ x)
2
+n(¯ x−µ)
2
]
,
= (2π)

n
2
e

1
2
P
n
i=1
(x
i
−¯ x)
2
e

1
2
n(¯ x−µ)
2
.
Luego ¯ x es estad´ıstica suficiente para µ.
6. Suficiente Minimal
Una estad´ıstica suficiente que resume los datos tanto como sea posible
es llamada Estad´ıstica Suficiente Minimal.
Para encontrar estad´ısticas suficientes minimales uasaremos m´etodos
de Lehmann y Scheffe.
Definici´on 5.2.10 Sean x
1
, x
2
, . . . , x
n
e y
1
, y
2
, . . . , y
n
dos conjuntos de
valores que toman todas las variables (X
1
, X
2
, . . . , X
n
) de la m. a. Si
se forma la raz´on:
f(x
1
|θ)f(x
2
|θ) · · · f(x
n
|θ)
f(y
1
|θ)f(y
2
|θ) · · · f(y
n
|θ)
,
esta raz´on no incluir´a al par´ametro θ si existe una funci´on g tal que:
g(x
1
, x
2
, . . . , x
n
) = g(y
1
, y
2
, . . . , y
n
) ,
en tal caso g(y
1
, y
2
, . . . , y
n
) es la estad´ıstica suficiente minimal para θ.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 195
Ejemplo 5.2.10 Sea X Ber(n, p), se forma la raz´on:
p
x
1
(1 −p)
1−x
1
· · · p
x
n
(1 −p)
1−x
n
p
y
1
(1 −p)
1−y
1
· · · p
y
n
(1 −p)
1−y
n
=
p
P
n
i=1
x
i
(1 −p)
n−
P
n
i=1
x
i
p
P
n
i=1
y
i
(1 −p)
n−
P
n
i=1
y
i
,
=
p
P
n
i=1
x
i

P
n
i=1
y
i
(1 −p)
n−
P
n
i=1
y
i

(
n−
P
n
i=1
x
i)
,
=
p
P
n
i=1
x
i

P
n
i=1
y
i
(1 −p)
P
n
i=1
x
i

P
n
i=1
y
i
,
=
_
p
1 −p
_
P
n
i=1
x
i

P
n
i=1
y
i
,
si

n
i=1
x
i
=

n
i=1
y
i
la raz´on es independiente de p. Luego g =

n
i=1
y
i
es estad´ıstica minimal suficiente. Es decir, ˆ p =

n
i=1
y
i
/n es estimador
que contiene toda la informaci´on de la muestra con un m´ınimo de
datos
4
.
7. Eficiencia
En el estudio de la consistencia de un estimador se percibe que mientras
menor es la varianza de un estimador incrementa la posibilidad de
obtener estimaciones m´as pr´oximas al verdadero valor del par´ametro
que se estima. Luego, mientras m´as peque˜ na es su varianza, mayor es
la eficiencia del estimador.
Definici´on 5.2.11 Un estimador insesgado
ˆ
θ es el m´as eficiente de
todos los estimadores insesgados si su varianza satisface la cota inferior
4
Este es, por lo tanto, un estimador insesgado lineal de m´ınima varianza (MVUE).
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 196
de la desigualdad de Rao-Cramer.
VVar(
ˆ
θ) ≥
1
nIE
_
_
∂lnf
X
(x|θ)
∂θ
_
2
_ .
Ejemplo 5.2.11 Si
¯
X es evaluado con valores de una m. a., (X
1
, X
2
, . . . , X
n
)
sacada de una distribuci´on normal con varianza σ
2
0
conocida, demostrar
que
¯
X es el estimador m´as eficiente para estimar la media µ.
f
X
(x|µ) =
1
_
2πσ
2
0
e

1

2
0
(x−µ)
2
,
lnf
X
(x|µ) =
1
2
ln(2πσ
2
0
) −
1

2
0
(x −µ)
2
,
∂lnf
X
(x|µ)
∂µ
= −
2(x −µ)

2
0
(−1) ,
IE
_
_
∂lnf
X
(x|µ)
∂µ
_
2
_
= IE
_
_
2(x −µ)

2
0
_
2
_
=
1
σ
4
0
IE[(x −µ)
2
] ,
IE
_
_
∂lnf
X
(x|µ)
∂µ
_
2
_
=
σ
2
0
σ
4
0
,
nIE
_
_
∂lnf
X
(x|µ)
∂µ
_
2
_
=
n
σ
2
0
,
1
nIE
_
_
∂lnf
X
(x|µ)
∂µ
_
2
_ =
σ
2
0
n
= VVar(
¯
X) .
Luego
¯
X es un estimador eficiente de la media poblacional µ, puesto
que alcanza la cota de Rao-Cramer.
8. Eficiencia Relativa
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 197
Definici´on 5.2.12 Si hay dos estimadores
ˆ
θ
1
y
ˆ
θ
2
insesgado, para el
mismo par´ametro θ el estimador
ˆ
θ
2
es m´as eficiente que
ˆ
θ
1
si:
VVar(
ˆ
θ
2
) < VVar(
ˆ
θ
1
) ,

VVar(
ˆ
θ
2
)
VVar(
ˆ
θ
1
)
< 1 .
Nos enfocaremos principalmente en el m´etodo de M´axima Verosimili-
tud
Propiedades de los estimadores de M´axima Verosimilitud (MV).
1. Insesgamiento: Los estimadores MV pueden ser sesgados, pero al incre-
mentar el tama˜ no de la muestra n se hacen asint´oticamente insesgados.
2. Consistencia: Bajo condiciones regulares los estimadors MV son con-
sistentes.
3. Invarianza: Si existe una funci´on de un par´ametro, se obtiene un esti-
mador de la funci´on sustituyendo el par´ametro por su estimador MV.
p.e. g(θ) es estimada por ˆ g(θ) = g(
ˆ
θ) . Distribuci´on Asint´ oticamente
Normal
ˆ
θ ∼ N(θ, VVar(θ)) .
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 198
Par´ ametro Estimador Puntual
Media µ ⇒
¯
X =
P
n
i=1
X
i
n
Varianza σ
2
⇒ S
2
=
P
n
i=1
(X
i

¯
X)
2
n−1
Proporci´on π ⇒ ˆ p =
P
n
i=1
Y
i
n
, donde Y
i
=
_
¸
_
¸
_
1 cumple condici´on
0 si no
Correlaci´on ρ ⇒ r
XY
=
P
n
i=1
X
i
Y
i
−n
¯
X
¯
Y
q
(
P
n
i=1
X
2
i
−n
¯
X
2
)(
P
n
i=1
Y
2
i
−n
¯
Y
2
)
5.2.4. Estimaci´on Intervalar
Otro procedimiento que permite tener una estimaci´on del verdadero va-
lor del par´ametro poblacional es, mediante intervalos de confianza, es decir,
construir rangos de valores posibles para el verdadero valor del par´ametro
mediante la distribuci´on asociada al estimador del par´ametro de inter´es.
Definici´on 5.2.13 Un intervalo de confianza de un nivel de (1−α)×100 %,
para el par´ametro θ, est´a dado por:
P (LI
θ
≤ θ ≤ LS
θ
) = 1 −α ,
donde LI
θ
corresponde al l´ımite inferior de la estimaci´on para el par´ametro
θ y LS
θ
corresponde al l´ımite superior de la estimaci´on para el par´ametro θ.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 199
De esa forma, si se desea construir un intervalo de confianza con un nivel de
(1−α) ×100 % para θ, es necesario conocer la distribuci´on muestral de
ˆ
θ que
es el estimador puntual de θ.
En general, los estimadosres de m´axima verosimilitud tienen las siguientes
distribuciones:
¯
X ∼ N
_
µ,
σ
2
n
_
, si n es grande.
(
¯
X−µ)

n
S
∼ t
(n−1)
, si n es peque˜ no.
ˆ p ∼ N
_
π,
π(1−π)
n
_
.
S
2

σ
2
(n−1)
χ
2
(n−1)
.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 200
Intervalo de confianza para la media con varianza conocida:
IC(µ) =
_
¯
X −Z
1−
α
2
σ

n
;
¯
X + Z
1−
α
2
σ

n
_
⇔IP
_
¯
X −Z
1−
α
2
σ

n
≤ µ ≤
¯
X + Z
1−
α
2
σ

n
_
= 1 −α
Intervalo de confianza para la media con varianza desconocida y n lo
suficientemente grande
5
(n →∞):
IC(µ) =
_
¯
X −Z
1−
α
2
S

n
;
¯
X + Z
1−
α
2
S

n
_
5
Tama˜ nos muestrales de al menos 30 observaciones, han entregado buenos resultados
al ser considerados como grandes.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 201
⇔IP
_
¯
X −Z
1−
α
2
S

n
≤ µ ≤
¯
X + Z
1−
α
2
S

n
_
= 1 −α
Intervalo de confianza para la media con varianza desconocida y n
peque˜ no:
IC(µ) =
_
¯
X −t
(
n−1 , 1−
α
2
)
S

n
;
¯
X + t
(
n−1 , 1−
α
2
)
S

n
_
⇔IP
_
¯
X −t
(
n−1 , 1−
α
2
)
S

n
≤ µ ≤
¯
X + t
(
n−1 , 1−
α
2
)
S

n
_
= 1 −α
Intervalo de confianza para la varianza:
IC(σ
2
) =
_
_
(n −1)S
2
χ
2
(
n−1 , 1−
α
2
)
;
(n −1)S
2
χ
2
(
n−1 ,
α
2
)
_
_
⇔IP
_
_
(n −1)S
2
χ
2
(
n−1 , 1−
α
2
)
≤ σ
2

(n −1)S
2
χ
2
(
n−1 ,
α
2
)
_
_
= 1 −α
Intervalo de confianza para la proporci´on:
IC(π) =
_
ˆ p −Z
1−
α
2
_
ˆ p(1 − ˆ p)
n
; ˆ p + Z
1−
α
2
_
ˆ p(1 − ˆ p)
n
_
⇔IP
_
ˆ p −Z
1−
α
2
_
ˆ p(1 − ˆ p)
n
≤ π ≤ ˆ p + Z
1−
α
2
_
ˆ p(1 − ˆ p)
n
_
= 1 −α
Ejemplo 5.2.12 Las manadas de lobos son territoriales, con territorios de
130km
2
o m´as. Se piensa que los aullidos de los lobos, que comunican tanto
de la situaci´on como de la composici´on de la manada, est´an relacionados
con la territorialidad. Se obtuvieron los siguientes valores para la duraci´on
en minutos de una sesi´on de aullidos de una determinada manada sometida
a estudio.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 202
1.0 1.8 1.6 1.5 2.0 1.8
1.2 1.9 1.7 1.6 1.6
1.7 1.5 1.4 1.4 1.4
Una estimaci´on puntual para la duraci´on media de una sesi´on de aullidos
en esta manada es ¯ x = 1,57 minutos.
La varianza muestral para estos datos es s
2
= 0,066(minutos)
2
.
Nos interesa determinar los rangos m´aximo y m´ınimo de la duraci´on
promedio de los aullidos.
Si consideramos un intervalo de confianza del 95 %, se tiene que:
IC(µ) = 1,57 ∓2,131
0,26

16
,
= 1,57 ∓0,14 ,
= (1,43 minutos; 1,71 minutos) .
Si consideramos un intervalo de confianza del 99 %, se tiene que:
IC(µ) = 1,57 ∓2,947
0,26

16
,
= 1,57 ∓0,19 ,
= (1,38 minutos; 1,76 minutos) .
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 203
5.3. D´ocima de Hip´otesis
5.3.1. Introducci´on
Definici´on 5.3.1 Una D´ocima de hip´otesis estad´ıstica es, la comprobaci´on
de una afirmaci´on o conjetura sobre alg´ un par´ametro de la poblaci´on. B´asica-
mente se pueden distinguir dos tipos de hip´otesis:
Hip´otesis Nula (H
0
): Es el verdadero estado de la naturaleza (Sin
cambio).
Hip´otesis Alternativa (H
1
): Es el posible estado de la naturaleza
(Despu´es del cambio).
B´asicamente, existen dos formas de d´ocimas de hip´otesis, las d´ocimas
unilaterales (una cola) y las bilaterales (dos colas).
H
0
: θ ≥ θ
0
v/s H
1
: θ < θ
0
H
0
: θ ≤ θ
0
v/s H
1
: θ > θ
0
H
0
: θ = θ
0
v/s H
1
: θ = θ
0
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 204
5.3.2. D´ocimas
Para plantear una hip´otesis estad´ıstica se pueden seguir los siguientes
pasos:
1. Establesca la hip´otesis nula y alternativa en el contexto del problema.
2. Establesca la hip´otesis nula y alternativa estad´ısticas.
3. Seleccione un nivel de significancia.
4. Describa la distribuci´on de la poblaci´on y del estad´ıgrafo.
5. Calcule el estad´ıstico de prueba.
6. Determine el o los valores cr´ıticos.
7. Defina la regi´on de rechazo de la hip´otesis nula (regla de decisi´on).
8. Tome la decisi´on con respecto de la hip´otesis nula.
9. Interprete sus resultados en el contexto del problema.
Al momento de realizar una d´ocima de hip´otesis, tambi´en hay que con-
siderar que se pueden cometer los siguientes errores:
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 205
H
0
Decisi´on sobre H
0
Verdadera Falsa
Aceptar H
0
Decisi´on Correcta Error Tipo II
1 −α β
Rechazar H
0
Error Tipo I Decisi´on Correcta
α 1 −β
Se prefiere siempre que α > β.
5.3.3. D´ocimas Univariadas
Ejemplo 5.3.1 La contaminaci´on de los r´ıos por metales pesados, constituye
una de las mayores preocupaciones de los gobiernos. Se sabe que el nivel
de metilmercurio tiene una distribuci´on normal con varianza conocida de
9(µg/g)
2
. Queremos saber si los resultados obtenidos en el ´ ultimo estudio el
nivel medio de metilmercurio es superior a 21,0(µg/dl).
Podemos plantear las siguientes hip´otesis:
H
0
: µ ≤ 21,0(µg/g) El nivel medio de metilmercurio no es superior a
21,0(µg/g).
H
1
: µ > 21,0(µg/g) El nivel medio de metilmercurio no es superior a
21,0(µg/g).
Supongamos que tomamos una muestra de 16 observaciones de agua,
dispuestas uniformemente a lo largo de la rivera, con lo que tendremos
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 206
x
1
, . . . , x
16
.
¯ x =

16
i=1
x
i
16
.
Si ¯ x es muy grande, tenderemos a rechazar H
0
, pero ¿estaremos tomando
una buena decisi´on? o estas diferencias se deben s´olo al azar o variabilidad
natural de la poblaci´on.
Entonces, debemos determinar un valor l´ımite que nos permita estable-
cer que, si el valor muestral es superior (menor) a este valor de tolerancia,
entonces diremos que la muestra tiene un valor estad´ısticamente superior
(menor) al de la poblaci´on, con una significaci´on de α ×100 %.
Estos valores l´ımites, se pueden establecer mediante las distribuciones
asociadas a los estimadores muestrales, de la siguiente forma, sean:
Z
c
=
(
¯
X−µ
0
)

n
σ
∼ N(0, 1).
t
c
=
(
¯
X−µ
0
)

n
S
∼ t
(n−1)
.
Z
c
=
(ˆ p−p
0
)
q
p
0
(1−p
0
)
n
∼ N(0, 1).
χ
2
c
=
(n−1)S
2
σ
2
0
∼ χ
2
(n−1)
.
D´ocima de hip´otesis para la media con varianza conocida. El estad´ıstico
adecuado es:
Z
c
=
(
¯
X −µ
0
)

n
σ
∼ N(0, 1) .
Y las Hip´otesis son:
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 207
H
0
H
1
Existe evidencia en contra de H
0
si:
µ = µ
0
µ = µ
0
|Z
c
| > Z
1−
α
2
µ ≤ µ
0
µ > µ
0
Z
c
> Z
1−α
µ ≥ µ
0
µ < µ
0
Z
c
< Z
α
D´ocima de hip´otesis para la media con varianza desconocida y n ≥ 30.
El estad´ıstico adecuado es:
Z
c
=
(
¯
X −µ
0
)

n
S
∼ N(0, 1) .
Y las Hip´otesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
µ = µ
0
µ = µ
0
|Z
c
| > Z
1−
α
2
µ ≤ µ
0
µ > µ
0
Z
c
> Z
1−α
µ ≥ µ
0
µ < µ
0
Z
c
< Z
α
D´ocima de hip´otesis para la media con varianza desconocida y n < 30.
El estad´ıstico adecuado es:
t
c
=
(
¯
X −µ
0
)

n
S
∼ t
(n−1)
.
Y las Hip´otesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
µ = µ
0
µ = µ
0
|t
c
| > t
(n−1,1−
α
2
)
µ ≤ µ
0
µ > µ
0
t
c
> t
(n−1,1−α)
µ ≥ µ
0
µ < µ
0
t
c
< t
(n−1,α)
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 208
D´ocima de hip´otesis para la proporci´on. El estad´ıstico adecuado es:
Z
c
=
(ˆ p −p
0
)
_
p
0
(1−p
0
)
n
∼ N(0, 1) .
Y las Hip´otesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
π = p
0
π = p
0
|Z
c
| > Z
1−
α
2
π ≤ p
0
π > p
0
Z
c
> Z
1−α
π ≥ p
0
π < p
0
Z
c
< Z
α
D´ocima de hip´otesis para la varianza. El estad´ıstico adecuado es:
χ
2
c
=
(n −1)S
2
σ
2
0
∼ χ
2
(n−1)
.
Y las Hip´otesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
σ
2
= σ
2
0
σ
2
= σ
2
0
χ
2
c
> χ
2
(n−1,1−
α
2
)
∨ χ
2
c
< χ
2
(n−1,
α
2
)
σ
2
≤ σ
2
0
σ
2
> σ
2
0
χ
2
c
> χ
2
(n−1,1−α)
σ
2
≥ σ
2
0
σ
2
< σ
2
0
χ
2
c
< χ
2
(n−1,α)
Ejemplo 5.3.2 Retomando, del ejemplo anterior se tiene que la muestra
presenta los siguientes resultados:
16.2 23.3 35.4 15.3 25.2 16.1 27.4 12.5
34.6 45.7 24.2 10.0 9.3 14.2 35.2 12.3
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 209
Lo cual nos entrega el siguiente promedio ¯ x = 22,31. Entonces,
Z
c
=
(22,31 −21)

16
3
= 1,75 .
De esa forma, se se considera un nivel de confianza del 95 %, el estad´ıstico
con el cual debemos comparar es con Z
0,975
= 1,96.
Y como 1,75 < 1,96, entonces no existe evidencia para rechazar H
0
: µ ≤
21,0(µg/g), el nivel medio de metilmercurio no es superior a 21,0(µg/g), con
5 % de significaci´on.
5.3.4. D´ocimas Bivariadas
Supongamos ahora que, no s´olo nos interesa saber que sucede con una
poblaci´on, si no que estamos interesados en comparar dos conjuntos de datos,
para determinar si corresponden a poblaciones diferentes.
D´ocima de hip´otesis para la comparaci´on de medias con varianzas cono-
cidas. El estad´ıstico adecuado es:
Z
c
=
(
¯
X
1

¯
X
2
) −δ
0
_
σ
2
1
n
1
+
σ
2
2
n
2
∼ N(0, 1) .
Y las Hip´otesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
µ
1
−µ
2
= δ
0
µ
1
−µ
2
= δ
0
|Z
c
| > Z
1−
α
2
µ
1
−µ
2
≤ δ
0
µ
1
−µ
2
> δ
0
Z
c
> Z
1−α
µ
1
−µ
2
≥ δ
0
µ
1
−µ
2
< δ
0
Z
c
< Z
α
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 210
D´ocima de hip´otesis para la comparaci´on de medias con varianzas des-
conocidas y n
1
≥ 30 y n
2
≥ 30. El estad´ıstico adecuado es:
Z
c
=
(
¯
X
1

¯
X
2
) −δ
0
_
S
2
1
n
1
+
S
2
2
n
2
∼ N(0, 1) .
Y las Hip´otesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
µ
1
−µ
2
= δ
0
µ
1
−µ
2
= δ
0
|Z
c
| > Z
1−
α
2
µ
1
−µ
2
≤ δ
0
µ
1
−µ
2
> δ
0
Z
c
> Z
1−α
µ
1
−µ
2
≥ δ
0
µ
1
−µ
2
< δ
0
Z
c
< Z
α
D´ocima de hip´otesis para la comparaci´on de medias con varianzas des-
conocidas y n
1
< 30 y n
2
< 30, pero σ
2
1
y σ
2
2
son estad´ısticamente
iguales.
El estad´ıstico adecuado es:
t
c
=
(
¯
X
1

¯
X
2
) −δ
0
S
p
_
1
n
1
+
1
n
2
∼ t
(n
1
+n
2
−2)
,
donde
S
2
p
=
(n
1
−1)S
2
1
+ (n
2
−1)S
2
2
n
1
+ n
2
−2
.
Y las Hip´otesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
µ
1
−µ
2
= δ
0
µ
1
−µ
2
= δ
0
|t
c
| > t
(n
1
+n
2
−2,1−
α
2
)
µ
1
−µ
2
≤ δ
0
µ
1
−µ
2
> δ
0
t
c
> t
(n
1
+n
2
−2,1−α)
µ
1
−µ
2
≥ δ
0
µ
1
−µ
2
< δ
0
t
c
< t
(n
1
+n
2
−2,α)
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 211
D´ocima de hip´otesis para la comparaci´on de medias con varianzas des-
conocidas y n
1
< 30 y n
2
< 30 pero σ
2
1
y σ
2
2
son estad´ısticamente
distintas.
El estad´ıstico adecuado es:
t
c
=
(
¯
X
1

¯
X
2
) −δ
0
_
S
2
1
n
1
+
S
2
2
n
2
∼ t
(ν)
,
donde
ν =
_
S
2
1
n
1
+
S
2
2
n
2
_
2

S
2
1
n
1
«
2
n
1
−1
+

S
2
2
n
2
«
2
n
2
−1
.
Y las Hip´otesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
µ
1
−µ
2
= δ
0
µ
1
−µ
2
= δ
0
|t
c
| > t
(ν,1−
α
2
)
µ
1
−µ
2
≤ δ
0
µ
1
−µ
2
> δ
0
t
c
> t
(ν,1−α)
µ
1
−µ
2
≥ δ
0
µ
1
−µ
2
< δ
0
t
c
< t
(ν,α)
D´ocima de hip´otesis para muestras pareadas.
El estad´ıstico adecuado es:
t
c
=
¯
d −δ
0
S
d

n
∼ t
(n−1)
.
Y las Hip´otesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
µ
d
δ
0
µ
d
= δ
0
|t
c
| > t
(n−1,1−
α
2
)
µ
d
≤ δ
0
µ
d
> δ
0
t
c
> t
(n−1,1−α)
µ
d
≥ δ
0
µ
d
< δ
0
t
c
< t
(n−1,α)
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 212
Donde
¯
d =

n
i=1
(x
i
− y
i
)/n y S
2
d
=

n
i=1
(d
i

¯
d)/(n − 1), con n el
n´ umero de observaciones conjuntas para la variable X antes y despu´es
del tratamiento.
D´ocima de hip´otesis para la comparaci´on de proporciones. El estad´ıstico
adecuado es:
Z
c
=
( ˆ p
1
− ˆ p
2
) −δ
0
_
p
1
(1−p
1
)
n
1
+
p
2
(1−p
2
)
n
2
∼ N(0, 1) .
Y las Hip´otesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
π
1
−π
2
= δ
0
π
1
−π
2
= δ
0
|Z
c
| > Z
1−
α
2
π
1
−π
2
≤ δ
0
π
1
−π
2
> δ
0
Z
c
> Z
1−α
π
1
−π
2
≥ δ
0
π
1
−π
2
< δ
0
Z
c
< Z
α
D´ocima de hip´otesis para la comparaci´on de varianzas. El estad´ıstico
adecuado es:
F
c
=
S
2
1
S
2
2

1
λ
F
(n
1
−1,n
2
−1)
.
Y las Hip´otesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
σ
2
1
σ
2
2
= λ
σ
2
1
σ
2
2
= λ F
c
>
1
λ
F
(n
1
−1,n
2
−1,1−
α
2
)
∨ F
c
<
1
λ
F
(n
1
−1,n
2
−1,
α
2
)
σ
2
1
σ
2
2
≤ λ
σ
2
1
σ
2
2
> λ F
c
>
1
λ
F
(n
1
−1,n
2
−1,1−α)
σ
2
1
σ
2
2
≥ λ
σ
2
1
σ
2
2
< λ F
c
<
1
λ
F
(n
1
−1,n
2
−1,α)
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 213
Ejemplo 5.3.3 En un estudio sobre h´abitos de alimentaci´on en murci´elagos,
se marcan 25 hembras y 11 machos y se les rastrea por radio. Una variable
de inter´es es la distancia que recorre volando en una pasada en busca de
alimento, se cree que las hembras hacen un recorrido mayor que los machos.
El experimento proporcion´o la siguiente informaci´on:
Hembras Machos
n
1
= 25 n
2
= 11
¯ x
1
= 205 metros ¯ x
2
= 135 metros
s
1
= 100 metros s
2
= 95 metros
Como s
2
1
/s
2
2
= 100
2
/95
2
= 1,11, se puede considerar que las varianzas
son estad´ısticamente iguales.
De esa froma se tiene que al realizar la prueba con un 5 % de significaci´on:
La hip´otesis intr´ınseca es, H
0
: µ
1
= µ
2
versus H
1
: µ
1
= µ
2
, as´ı:
t
c
=
(205 −135) −0
98,56
_
1
25
+
1
11
= 1,96 ,
y al ser comparado con el valor del estad´ıstico de tabla t
(
25+11−2,1−
0,05
2
)
=
2,0322.
Se tiene que no hay evidencia para rechazar H
0
, es decir, no existen difer-
encias significativas entre las distancias recorridas por los distintos grupos.
Adem´as, el valor −p > 0,0608, que es mayor que el nivel de significaci´on.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 214
5.4. D´ocimas de Hip´otesis No Param´etricas
5.4.1. Prueba de Suma de Rangos de Wilcoxon
Es una alternativa a la prueba t para comparar medias cuando no se
cumple el supuesto de normalidad y cuando las muestras son independientes.
Definici´on 5.4.1 Sean X
1
, X
2
, . . . , X
n
1
y Y
1
, Y
2
, . . . , Y
n
2
muestras aleato-
rias de dos poblaciones que difieren s´olo en su medida de tendencia central.
Adem´as, las poblaciones tienen la misma forma y dispersi´on, pero no nece-
sariamente normales.
El procedimiento para la prueba es primero, determinar el rango o posici´on
de cada dato en la muestra combinada. Luego se calcula la suma de rangos
para la estad´ıstica T de s´olo los datos de la primera muestra. Si n
1
≥ 10 y
n
2
≥ 10, la distribuci´on de T es aproximadamente normal. Y el estad´ıstico
de prueba es:
Z
c
=
T −IE(T)
_
VVar(T)
∼ N(0,1) ,
donde IE(T) = n
1
(n
1
+n
2
+ 1)/2 y VVar(T) = n
1
n
2
(n
1
+ n
2
+ 1)/12.
Y las hip´otesis son:
H
1
Existe evidencia en contra de H
0
si:
f
1
(x) est´a desplazada de f
2
(y) |Z
c
| > Z
1−
α
2
f
1
(x) est´a desplazada hacia la derecha de f
2
(y) Z
c
> Z
1−α
f
1
(x) est´a desplazada hacia la derecha de f
2
(y) Z
c
< Z
α
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 215
Ejemplo 5.4.1 Una compa˜ n´ıa de taxis quiere probar dos programas para
mejorar el uso del combustible por partye de sus choferes. A los conductores
del programa A, se les asigna un rendimiento objetivo y se les da un bono
cuando lo superan. A los conductores del programa B se les otorga una cuota
mensual m´axima de gasolina, si esta se agota, el chofer deber´a pagar de su
bolsillo la gasolina extra. Todos los taxis son del mismo modelo y se les da
el mismo mantenimiento. Despu´es de 3 meses, se calcula el rendimiento de
cada chofer en millas recorridas por gal´on de combustible. Los datos basados
en dos muestras independientes son los siguientes:
A 22, 17 24, 25 26, 33 23, 47 25, 29 23, 99
23, 6 22, 56 23, 34 23, 73
B 22, 43 22, 04 21, 39 22, 95 20, 87 21, 65
22, 82 22, 3 23, 21
¿Se puede inferir de estos datos que los conductores de taxis del programa A
consumjen m´as combustible que los del programa B?
De esa froma se tiene que al realizar la prueba con un 5 % de significaci´on:
La hip´otesis intr´ınseca es, H
0
: f
A
(x) = f
B
(x) versus H
1
: f
1
(x) est”a
desplazada a la derecha de f
2
(x). Luego determinamos los rangos de las ob-
servaciones:
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 216
A Rango B Rango
22, 17 5 20, 87 1
22, 56 8 21, 39 2
23, 34 12 21, 65 3
23, 47 13 22, 04 4
23, 60 14 22, 3 6
23, 73 15 22, 43 7
23, 99 16 22, 82 9
24, 25 17 22, 95 10
25, 29 18 23, 21 11
26, 33 19
Ahora se determina la suma de los rangos de la primera muestra T = 137,
como as´ı tambi´en IE(T) = 10(10 + 9 + 1)/2 = 100, VVar(T) = 10 · 9(10 + 9 +
1)/12 = 150, de esa forma:
Z
c
=
137 −100

150
= 3,02 ,
y al ser comparado con el valor del estad´ıstico de tabla Z
0,975
= 1,96.
Se tiene que hay evidencia para rechazar H
0
, es decir, la distribuci´on del
grupo A est´a desplazada hacia la derecha de de la del grupo B.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 217
5.4.2. D´ocima de Bondad de Ajuste Chi-cuadrado
La idea es poder determinar si una variable con distribuci´on desconoci-
da, al formular una hip´otesis respecto a una posible distribuci´on de esta es
efectiva o no.
De las observaciones de una muestra se estiman los valores de los par´amet-
ros de la funci´on de probabdilidad, o de densidad, que se han postulado en
la hip´otesis.
Sean:
1. n
i
, es el n´ umero de observaciones en la i-´esima clase.
2. n =

k
i=1
n
i
, es el n´ umero total de observaciones en las k celdas.
3. p
i
= IP(X = x
i
) o p
i
= IP(x
i−1
≤ X ≤ x
i
), es la probabilidad que
el valor de x
i
est´e en la i-´esima celda, si la variable es discreta, o la
probabilidad que el valor de la variable est´e en el intervalo (x
i−1
, x
i
) si
la variable es continua.
4.
ˆ
IE(n
i
) = np
i
n´ umerop esperado de observaciones en la i-´esima celda.
Con estos elementos se define la estad´ıstica χ
2
c
, como:
χ
2
c
=
k

i=1
(n
i

ˆ
IE(n
i
))
2
ˆ
IE(n
i
)
,
si χ
2
c
> χ
2
(k−s−1,1−α)
se rechaza la hip´otesis que la distribuci´on de la variable
es la especificada, porque la distancia entre el valor observado y el esperado
es demaciado grande. Donde s es el n´ umero de par´ametros de la distribuci´on
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 218
que se conjetura que se estiman con las observaciones recolectadas en la
muestra.
Ejemplo 5.4.2 En un experimento sobre la duraci´on de baterias, en a˜ nos,
se desea comprobar si la distribuci´on de frecuencias de esta variable sigue
una distribuci´on normal. Para ello se toma una muestra de 40 baterias y
se registra su duraci´on hasta que estas dejan de funcionar, los resultados se
resumen en la siguiente tabla
6
:
x
i
X n
i
ˆ p
i
nˆ p
i
(n
i
−nˆ p
i
)
2
(n
i
−nˆ p
i
)
2
nˆ p
i
2, 2 1, 45 −2, 95 7 0, 2641 10, 5640 12, 7021 1, 2024
3, 2 2, 95 −3, 45 15 0, 2603 10, 4120 21, 0497 2, 0217
3, 7 3, 45 −3, 95 10 0, 2485 9, 9400 0, 0036 0, 0004
4, 45 3, 95 −4, 95 8 0, 2074 8, 2960 0, 0876 0, 0106
40 3, 2350
As´ı, χ
2
c
= 3,2350 y al ser comparado con el valor de tabla χ
(4−2−1,1−0,05)
=
3,841, se tiene que no existe evidencia en contra de suponer que la duraci´on
de las bater´ıas tengan una distribuci´on norma.
5.4.3. Tablas de Contingencia
En este caso trabajaremos con variables nominales y ordinales (en general
variables categ´oricas). Este tipo de variables aparecen en todos los campos,
en particular en ciencias biol´ogicas y ciencias sociales.
6
Note que, los valores de ˆ p
i
en la tabla, corresponden al calculo de probabilidad de una
N(3,4; 0,723
2
)
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 219
Cuando las observaciones en una muestra pueden ser clasificadas de acuer-
do a sus valores con respecto a dos variables categ´oricas, se puede formar una
tabla de contingencia como una de las formas de estudiarlas conjuntamente.
De esa forma una tabla de este estilo, tiene la siguiente forma:
Y
Y
1
Y
2
· · · Y
J
Total
X
1
n
11
n
12
· · · n
1J
n
1+
X X
2
n
21
n
22
· · · n
2J
n
2+
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
X
I
n
I1
n
I2
· · · n
IJ
n
I+
Total n
+1
n
+2
· · · n
+J
n
++
donde, n
ij
es el n´ umero de elementos observados en la celda (i, j); n
i+
es el
n´ umero de elementos totales de la i-´esima fila; n
+j
es el n´ umero de elemen-
tos totales de la j-´esima columna y n
++
es el n´ umero de elementos totales
observados, en una tabla de I ×J. Adem´as:
n
i+
=
J

j=1
n
ij
, n
+j
=
I

i=1
n
ij
, n
++
=
I

i=1
J

j=1
n
ij
.
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 220
Adem´as, podemos definir las proporciones observadas en la tabla como:
Y
Y
1
Y
2
· · · Y
J
Total
X
1
p
11
p
12
· · · p
1J
p
1+
X X
2
p
21
p
22
· · · p
2J
p
2+
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
X
I
p
I1
p
I2
· · · p
IJ
p
I+
Total p
+1
p
+2
· · · p
+J
1
donde, p
ij
= n
ij
/n
++
es la proporci´on de elementos observados en la celda
(i, j); p
i+
= n
i+
/n
++
es la proporci´on de elementos totales de la i-´esima fila;
p
+j
= n
+j
/n
++
es la proporci´on de elementos totales de la j-´esima columna.
Adem´as:
p
i+
=
J

j=1
p
ij
, p
+j
=
I

i=1
p
ij
,
I

i=1
J

j=1
p
ij
= 1 .
5.4.4. D´ocima Chi-cuadrado de Independencia
La pregunta clave ac´a es si existe alg´ un tipo de asociaci´on entre dos vari-
ables de una tabla de contingencia. el concepto contrario o complementario
de asociaci´on es el de “independencia estad´ıstica”.
Entonces, dos variables categ´oricas (nominales u ordinales) son estad´ısti-
camente independientes, si las distribuciones condicionales, en la poblaci´on,
de una de ellas son iguales para cada nivel de la otra.
Usualmente s´olo tenemos la informaci´on de la muestra y desconocemos,
en consecuencia, las distribuciones condicionales en la poblaci´on. Pero si las
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 221
variables no son independientes, sus distribuciones condicionales muestrales
discrepar´an en forma importane.
Pero ¿hay suficiente evidencia en los datos para rechazar la independencia
de las variables?
La prueba Chi-cuadrado nos permite docimar la independencia de dos
variables categ´oricas.
H
0
: Las variables son estad´ısticamente independientes.
H
1
: Las variables son estad´ısticamente dependientes.
La estad´ıstica de prueba es:
χ
2
c
=
I

i=1
J

j=1
(o
ij
−e
ij
)
2
e
ij
,
donde o
ij
es la frecuencia observada para la celda (i, j) y e
ij
= n
i+
n
+j
/n
++
es
la frecuencia esperada para la celda (i, j) bajo H
0
. Si χ
2
c
> χ
2
((I−1)(J−1),1−α)
se
rechaza la hip´otesis de que las variables son estad´ısticamente independientes.
Ejemplo 5.4.3 En un estudio sobre la posible influencia gen´etica de la mano
diestra de los padres (derecha o izquierda) sobre la mano diestra de sus hijos,
una muestra de 400 ni˜ nos fueron clasificados de acuerdo a su mano diestra
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 222
y a la de sus padres, obteni´endose:
Mano diestra Mano diestra hijo
Padre-Madre Derecha Izquierda Total
Derecha-Derecha 303 37 340
Derecha-Izquierda 29 9 38
Izquierda-Izquierda 16 6 22
Total 348 52 400
Nota:
Podemos usar el d´ocima Chi-cuadrado cuando se cumple lo siguiente:
1. Para tablas 2×2, las frecuencias observadas deben ser al menos iguales
a cinco para cada celda.
2. Para tablas m´as grandes, la frecuencia observada debe ser al menos
igual a cinco en el 75 % de las celdas y mayor a 1 en el resto.
Ejemplo 5.4.4 En una empresa se desea estudiar si existe una dependencia
entre el nivel de las remuneraciones y los a˜ nos de experiencia del person-
al de su planta de profesionales. Con este objetivo, se clasifican las remu-
neraciones, seg´ un su monto, en tres categor´ıas (I,II y III) y los a˜ nos de
experiencia, de acuerdo a su n´ umero en cuatro categor´ıas (A,B,C y D).
La informaci´on obtenida de acuerdo a una muestra aleatoria de 100 ob-
Carlos Bustos-L´opez
CAP
´
ITULO 5. INFERENCIA ESTAD
´
ISTICA 223
servaciones es la siguiente:
Experiencia
A B C D Total
I 4 11 9 14 38
Remuneraci´on II 12 9 8 4 33
III 10 6 7 6 39
Total 26 26 24 24 100
Carlos Bustos-L´opez
Cap´ıtulo 6
Muestreo
El inter´es de tomar una muestra est´a b´asicamente centrado que, en muchas
ocaciones el tama˜ no de la poblaci´on en estudio es muy grande o desconocido,
como para tomar los datos de cada elemento que la componen, adem´as los
costos involucrados son muy altos y se requiere de mucho tiempo para llevar
a cabo este proceso. De esa forma es recomendable tomar una muestra de un
tama˜ no menor a la poblaci´on, pero que es representativa de ella, desde donde
se extraeran, mediante un proceso de estimaci´on, los valores “estimados” de
los correspondientes par´ametros de inter´es.
Principalmente se distinguen dos tipos de muestreos, el probabil´ıstico y
el no probabil´ıstico, de ellos s´olo nos centraremos en el primero. Una muestra
probabil´ıstica tiene como caracter´ıstica b´asica que, cualquier elemento de la
poblaci´on tiene la misma probabilidad (= 0) conocida de ser incluido en la
muestra.
Existen varios m´etodos de muestreos probabil´ısticos, siendo los m´as famosos:
el Muestreo Aleatorio Simple (m.a.s.), el Muestreo Aleatorio Estratificado y
224
CAP
´
ITULO 6. MUESTREO 225
el Muestreo Sistem´atico.
Para este estudio las variables de inter´es son las proporciones de algunas
caracter´ısticas presentes en la poblaci´on. De esa forma podemos considerar
que el n´ umero x de elementos de la poblaci´on que presentan o no la carac-
ter´ıstica sigue una distribuci´on Binomial de par´ametros n y p
x
, es decir:
x|N = n, p
x
∼ Bin(n, p
x
) n ≥ 2 , 0 ≤ p
x
≤ 1 ,
donde N corresponde al n´ umero de elementos (tama˜ no) de la poblaci´on y p
x
la proporci´on de elementos que presentan la caracter´ıstica.
Entonces debemos determinar los valores de estos par´ametros en una
muestra de tama˜ no n para realizar la inferencia sobre la poblaci´on. Es as´ı co-
mo los estimadores muestrales para la media y la varianza son:
p
x
=

n
i=1
x
i
n
, V ar(p
x
) =
p
x
(1 −p
x
)
n
_
N −n
N −1
_
.
Pero para poblaciones grandes (N 40) los estimadores siguen asint´otica-
mente una distribuci´on Normal.
As´ı, si queremos asegurar que el valor de nuestra estimaci´on este con-
tenido en un intervalo de (1 −α)100 % de confianza, realizamos la siguiente
construcci´on:
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 226
Como se puede apreciar del gr´afico anterior, si quisieramos garantizar que en
aproximadamente 997 de 1000 muestras, el par´ametro poblacional estar´a den-
tro de 3 desviaciones est´andar del estimador.
Si p
x
es la proporci´on estimada, P
x
es el par´ametro y SE(p
x
) el error
est´andar de p
x
, podemos decir:
p
x
−3SE(p
x
) ≤ P
x
≤ p
x
+ 3SE(p
x
) .
Entonces el problema de estimaci´on involucra que debemos escoger un
tama˜ no muestral que mantenga esta condici´on.
El dise˜ no muestral considerado para este estudio contempla varias etapas.
6.1. Muestreo
¿Por qu´e una Muestra?
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 227
1. En muchas ocaciones el tama˜ no de la Poblaci´ on es muy grande o de-
sconocido como para tomar los datos de cada individuo que la compo-
nen. (A ⊆ Ω).
2. Tiene menor costo que un censo.
3. Se requiere menos tiempo.
4. Para no destruir o alterar la poblaci´on.
¿C´omo extraer una Muestra?
El procedimiento es a trav´es de las T´ecnicas de Muestreo. Las m´as
comunes son:
6.1.1. Muestreo Aleatorio Simple. (m.a.s.)
Se fundamenta en que todos los elementos de una poblaci´on tienen la
misma posibilidad de ser seleccionados para constituir la muestra para el
estudio, es decir, si se desea seleccionar una muestra de tama˜ no n desde una
poblaci´on de tama˜ no N, la probabilidad de que un elemento de la poblaci´on
sea seleccionado para la muestra (A) es:
IP(A) =
1
N
.
6.1.2. Muestreo Estratificado.
Se fundamenta en que en la poblaci´on existen elementos con diferencias
evidentes, que pueden ser agrupados en “Estratos”, que deben ser represen-
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 228
tados proporcionalmente en la muestra. As´ı, si se tiene una poblaci´on de
tama˜ no N, en la cual se pueden distinguir k estratos, de tal forma que:
k

i=1
N
i
= N ,
donde N
i
es la cantidad total de elementos del i-´esimo estrato, tambi´en se
puede determinar la proporci´on que representan cada estrato en la poblaci´on
como p
i
= N
i
/N, que cumple:
k

i=1
p
i
= 1 ,
de esa forma si se desea extraer una muestra de tama˜ no n desde la poblaci´on,
los elementos en la muestra deben ser distribuidos como:
n
i
=
N
i
N
n = p
i
n , con
k

i=1
n
i
= n ,
de esa forma la muestra debe contener n
i
elementos del i-´esimo estrato.
6.1.3. Muestreo Sistem´atico.
Se fundamenta en que, el espacio muestral es listado en forma arbitrar´ıa,
lo cual produce bloques o grupos que son artificiales, por lo cual es necesario
quitar el efecto lista. La idea es seleccionar los n elementos de la muestra,
descartando cada k de ellos. El procedimiento consiste en:
1. Seleccionar un n´ umero aleatorio m tal que 1 ≤ m ≤ N, como el punto
de partida para el muestreo, de tal forma que el elemento en la posici´on
m, constituye el primer elemento de la muestra.
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 229
2. Determinar el valor del salto sistem´atico k como el entero k = N/n.
3. Seleccionar los otros (n −1) elementos de la muestra cada k de ellos.
De esa forma, la muestra queda constituida por los siguientes elementos:
m, m +k, m + 2k, . . . , m + (n −1)k .
6.1.4. Tama˜ no Muestral
Un punto interesante en todos los estudios es, ¿cu´antas observaciones de-
bo tomar?, es decir, ¿de qu´e tama˜ no debe ser la muestra?
Consideremos lo siguiente:
IC(µ) =
_
_ ¯
X −Z
1−
α
2
σ

n
. ¸¸ .
¯
X + Z
1−
α
2
σ

n
. ¸¸ .
_
_
ε ε
Es decir, se puede considerar un error ε para la estimaci´on del verdadero
valor de la media poblacional, y de esa forma se puede despejar el valor de
n.
As´ı, una forma r´apida de determinar el tama˜ no muestral para realizar
inferencia sobre la media de una poblaci´on, con un nivel de confianza de
(1 − α) × 100 %, donde la variaci´ on poblacional es σ y se pretende cometer
un error de a lo m´as un ε, se puede emplear la siguiente f´ormula:
n =
_
Z
1−
α
2
σ
ε
_
2
.
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 230
An´alogamente, se puede obtener la siguiente f´ormula:
n =
_
Z
1−
α
2
_
p
0
(1 −p
0
)
ε
_
2
.
Que permite determinar el tama˜ no muestral para realizar inferencia sobre la
proporci´on de una poblaci´on, con un nivel de confianza de (1 −α) ×100 %,
y se pretende cometer un error de a lo m´as un ε.
Ejemplo 6.1.1 ¿Cu´antas observaciones son necesarias si la desviaci´on
est´andar de la duraci´on de los aullidos es σ = 0,25 y se quiere realizar
una estimaci´on de la duraci´on media, con un 95 % de confianza y se
desea cometer un error de a lo m´as 5 segundos?
n =
_
1,96 ×0,25
0,08
_
2
= 37,5 ≈ 38 .
Si consideramos ahora un nivel de confianza del 99 %, se tiene que:
n =
_
2,57 ×0,25
0,08
_
2
= 64,5 ≈ 65 .
6.1.5. Plan de Muestreo
1. Primera etapa: Bajo Muestreo Aleatorio Simple y normalidad asint´ otica,
se tiene que el intervalo de confianza a (1 −α)100 % para p
x
esta dado
por:
p
x
±Z
1−α/2
SE(p
x
) , (6.1)
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 231
donde Z
1−α/2
corresponde al percentil (1 − α/2)100 de la distribici´on
normal o tambi´en denominado coeficiente de confiabilidad y SE(p
x
) es
la desviaci´on est´andar del estimador (SE(p
x
) =
_
V ar(p
x
)).
As´ı el error muestral para la estimaci´on debe cumplir que:
Z
1−α/2
SE(p
x
) ≤ ε
α
, (6.2)
donde ε
α
corresponde a la significaci´on de la estimaci´on (α100 %).
Reemplazando el valor de SE(p
x
) por su valor estimado,
ˆ
SE(p
x
) =
_
p
x
(1 −p
x
)
n
_
N −n
N −1
__
1/2
,
el cual incorpora el factor de correcci´on por finitud para tama˜ nos de
poblaci´on conocidas, se tiene en (2) que:
Z
1−α/2
_
p
x
(1 −p
x
)
n
_
N −n
N −1
__
1/2
≤ ε
α
,
luego,
n ≥
Z
2
1−α/2
p
x
(1 −p
x
)N
(N −1)ε
2
α
+ Z
2
1−α/2
p
x
(1 −p
x
)
, (6.3)
de esa forma se determina el m´ınimo n (tama˜ no muestral) que garantiza
que el intervalo contenga al estimador con (1 −α)100 % de confianza.
2. Segunda etapa: En general, y este caso no es la escepci´on, los com-
ponentes de una poblaci´on tienen caracter´ısticas que as´ı como los difer-
encian entre ellos tambi´en otras los reunen en grupos homog´eneos en
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 232
si mismos, por ejemplo, si nos interesara conocer el porcentaje de per-
sonas de Europa que prefieren el color verde por sobre los otros colores,
es claro que nuestra poblaci´on corresponder´a a todos los miembros de
la comunidad europea, pero esta comunidad est´a compuesta por varios
paises, de culturas diferentes y que las opiniones y gustos de ellos ser´an
distintas de pa´ıs en pa´ıs, a´ un m´as dentro de cada pa´ıs se distinguen
dos grupos, hombres y mujeres, que aunque tengan la misma cultura y
crianza tendr´an preferencias y comportamientos distintos.
Por lo anterior, siempre es importante distinguir estas caracter´ısticas
que “estratifican” la poblaci´on en estudio, ya que nos permite tener
una mejor representatividad de estos grupos, es decir, que la presencia
de ciertos grupos de la poblaci´on en la muestra, sea proporcional a su
presencia en la poblaci´on. Este procedimiento se denomina Muestreo
Estratificado.
Las principales ventajas de la estratificaci´on por sobre el m.a.s., son:
Dadas ciertas condiciones de regularidad, la precisi´on puede ser
incrementada por sobre el m.a.s.
Es posible obtener estimaciones para cada estrato (grupo) con una
precisi´on espec´ıfica.
De la misma forma que en la primera etapa, se puede determinar el
tama˜ no de la muestra por estratos, es decir, si hemos determinado que
la muestra total debe ser de tama˜ no n, podemos ahora determinar
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 233
cuantos de estos elementos ser´an seleccionados de un estrato u otro.
Sea entonces n
h
el tama˜ no muestral del estrato h, con h = 1, . . . , L,
donde L es el total de estratos y N
h
el n´ umero de componentes total
del estrato h en la poblaci´on, entonces se tiene que n =

L
h=1
n
h
y
N =

L
h=1
N
h
, luego:
n
h
=
N
h
p
h
(1 −p
h
)n

L
h=1
N
h
p
h
(1 −p
h
)
, (6.4)
donde p
h
corresponde a la proporci´on de los elementos del estrato h en
la poblaci´on.
Adem´as (4) es una muestra autoponderada obtenida a trav´es de un
muestreo estratificado, pero con el af´an de lograr las mejores estima-
ciones posibles, se ha determinado (4) mediante una afijaci´on ´optima,
de tal forma que las varianzas de los estimadores sea la menor posi-
ble, es decir, hemos considerado el costo de tomar un elemento dentro
de un estrato, se incorpora el efecto que pueden tener las diferencias
significativas de las varianzas de los estratos.
3. Tercera etapa: Como se mencion´o anteriormente la poblaci´on puede
estar compuesta de estratos y estos a su vez por subestratos, de esa for-
ma si consideramos nuevamente un muestreo estratificado para obtener
una muestra autoponderada con afijaci´on ´optima dentro de cada estra-
to se puede proceder como:
Sean i = 1, . . . , I, con I n´ umero de subestratos dentro del estrato h =
1, . . . , L, N
hi
el n´ umero de elementos de la poblaci´on que corresponden
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 234
al subestrato i en el estrato h, p
hi
la proporci´on de elementos que
pertenecen al subestrato i del estrato h en la poblaci´on y n
hi
el n´ umero
de elementos a muestrear del subestrato i en el estrato h de la poblaci´on,
entonces podemos definir:
n
hi
=
N
hi
p
hi
(1 −p
hi
)n
h

I
i=1
N
hi
p
hi
(1 −p
hi
)
. (6.5)
4. Cuarta etapa: Luego de determinados los tama˜ nos muestrales en los
subestratos, estratos y de la poblaci´on muestral, procedemos a selec-
cionar los elementos. Existen varias t´ecnicas de selecci´on, por ejemplo
repetici´on del m.a.s., o a trav´es de un muestreo sistem´atico de “salto
sitem´atico” k = N/n.
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 235
Bibliograf´ıa
1. Agresti, Alan. Statistical methods for the social sciences. 3a ed. Upper
Saddle River, N.J. Prentice Hall, 1997.
2. Azor´ın Poch, Francisco. M´etodos y aplicaciones del muestreo. Madrid:
Alianza, 1986.
3. Azzalini, Adelchi. Statistical inference: based on the likelihood. London:
Chapman & Hall, 1996.
4. Box, George E. P. Statistics for experimenters: design, innovation, and
discovery. 2a ed. Hoboken, N.J. Wiley-Interscience, 2005.
5. Box, George E. P. Bayesian inference in statistical analysis. New York:
Wiley, 1992.
6. Camacho Rosales, Juan. Estad´ıstica con SPSS (versi´ on 9) para Win-
dows. M´exico: Alfaomega/Ra-Ma, 2001.
7. Casella, George. Statistical inference. 2a ed. Australia: Thomson Learn-
ing, 2002.
8. Cochran, William Gemmell, 1909- . Sampling techniques. 3rd ed. New
York: Wiley, 1977.
9. Cramer, Harald, 1893- . M´etodos matem´aticos de estad´ıstica. Madrid:
Aguilar, 1960.
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 236
10. David, H. A. (Herbert Aron), 1925- . Order statistics. 2nd ed. New
York: John Wiley, 1980.
11. Degroot, Morris H, 1931- . Probability and statistics. 3rd ed. Boston:
Addison-Wesley, 1988.
12. Del Pino M., Guido. Apuntes de inferencia estad´ıstica: versi´ on prelim-
inar. Santiago, Chile: Pontificia Universidad Cat´olica de Chile, 1982.
13. Del Pino M., Guido. An´alisis estad´ıstico: interpretando problemas de
la vida cotidiana. Santiago, Chile: Ministerio de Educaci´on, 2003.
14. Fisher, Ronald Aylmer, 1890-1962. Statistical methods, experimental
design, and scientific inference. Oxford: Oxford University Press, 1990.
15. Freeman, Harold Adolph. Introduction to statistical inference. Read-
ings, Mass: Addison-Wesley, 1963.
16. Freund, John E., 1921- . Mathematical statistics. 2nd ed. Englewood
Cliffs, N. J.: Prentice-Hall, 1971.
17. Gibbons, Jean Dickinson, 1938- . Nonparametric statistical inference.
New York: McGraw-Hill, 1971.
18. Henkel, Ramon E., 1931- . Tests of significance. Beverly Hills, Calif.:
Sage, 1976.
19. Kendall, Maurice G., 1907- . Kendall’s advanced theory of statistics.
London: Edward Arnold, 1994-.
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 237
20. Kendall, Maurice G., 1907- . The advanced theory of statistics. 3rd ed.
New York: Hafner Press, 1976.
21. Larson, Harold J., 1934- . Introduction to probability theory and sta-
tistical inference. 2nd ed. New York: Wiley, 1974.
22. Lehmann, Erich Leo, 1917- . Testing statistical hypotheses. 2nd ed.
New York: Wiley, 1986.
23. Lehmann, Erich Leo, 1917- . Elements of large sample theory. New
York: Springer, 1999.
24. McCollough, Celeste. An´alisis estad´ıstico en las ciencias sociales y ed-
ucaci´on. M´exico: McGraw-Hill, 1976.
25. McCulloch, Charles E. Generalized, linear, and mixed models. New
York: John Wiley & Sons, 2001.
26. Mendenhall, William. Probabilidad y estad´ıstica para ingenier´ıa y cien-
cias. 4a ed. M´exico: Pearson Educaci´on, 1997.
27. Meyer, Paul L. Introductory probability and statistical applications.
2nd ed. Reading, Mass: Addison-Wesley, 1970.
28. Montgomery, Douglas C. Probabilidad y estad´ıstica aplicadas a la in-
genier´ıa. M´exico, D. F.: McGraw-Hill, 1996.
29. Montgomery, Douglas C. Diseo y an´alisis de experimentos. 2a ed. M´exi-
co: Limusa Wiley, 2003.
Carlos Bustos-L´opez
CAP
´
ITULO 6. MUESTREO 238
30. Rao, C. Radhakrishna (Calyampudi Radhakrishna), 1920- . Linear mod-
els: least squares and alternatives. New York: Springer, 1995.
31. Ross, Sheldon M. Introduction to probability and statistics for engi-
neers and scientists. 2nd ed. Amsterdam: Harcourt Academic Press,
2000.
32. Spiegel, Murray R. Estad´ıstica. 3a ed. M´exico: McGraw-Hill, 2002.
33. Walpole, Ronald E. Probabilidad y estad´ıstica para ingenieros. 6a ed.
M´exico: Prentice Hall, 1999.
34. Walpole, Ronald E. Introduction to statistics. 2nd ed. New York: Macmil-
lan, 1974.
Carlos Bustos-L´opez

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->