You are on page 1of 240

Apuntes

de Probabilidad y Estadstica
(Versi on Preliminar)
CARLOS BUSTOS-L

OPEZ
A los caminos que aun faltan por recorrer
siendo un peque no saltamontes

Indice general
1. Estadsticas Descriptivas: Deniciones 4
1.1. Fundamentos de la Investigacion
Cientca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2. Motivaciones y Deniciones . . . . . . . . . . . . . . . . . . . 5
1.2.1. Tipos de Variables . . . . . . . . . . . . . . . . . . . . 6
1.2.2. Tabulaci on . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2.3. Representacion Graca . . . . . . . . . . . . . . . . . . 13
1.3. Medidas de Tendencia Central . . . . . . . . . . . . . . . . . . 22
1.3.1. Media Armonica (H(X)). . . . . . . . . . . . . . . . . 22
1.3.2. Media Geometrica (G(X)). . . . . . . . . . . . . . . . . 23
1.3.3. Media Aritmetica o Promedio (
X
, x o M(X)). . . . . 23
1.3.4. Media Ponderada (
P
, x
P
). . . . . . . . . . . . . . . . 26
1.3.5. Media Recortada en % . . . . . . . . . . . . . . . . . 27
1.3.6. Moda (Mo(X)). . . . . . . . . . . . . . . . . . . . . . . 28
1.3.7. Mediana (Me(X)). . . . . . . . . . . . . . . . . . . . . 29
1.3.8. Comentarios . . . . . . . . . . . . . . . . . . . . . . . . 31
1.4. Medidas de Posici on . . . . . . . . . . . . . . . . . . . . . . . 31
1.4.1. Mnimo (X
Min
). . . . . . . . . . . . . . . . . . . . . . . 32
1.4.2. Maximo (X
Max
). . . . . . . . . . . . . . . . . . . . . . 32
1.4.3. Percentiles( P

). . . . . . . . . . . . . . . . . . . . . . 32
1.4.4. Diagrama de Cajon o Box-Plot: . . . . . . . . . . . . . 34
1.5. Medidas de Variabilidad o de Dispersion . . . . . . . . . . . . 35
1.5.1. Amplitud o Rango (R). . . . . . . . . . . . . . . . . . . 35
1.5.2. Rango Intercuartil (RI). . . . . . . . . . . . . . . . . . 36
1.5.3. Desviacion Media (DM). . . . . . . . . . . . . . . . . . 36
1.5.4. Varianza y Desviacion Estandar (
2
X
, S
2
X
o VVar(X)). . 36
1.5.5. Coeciente de Variaci on (C.V.(X)). . . . . . . . . . . . 38
1

INDICE GENERAL 2
1.6. Analisis Bivariado . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.6.1. Tablas de Doble Entrada. . . . . . . . . . . . . . . . . 40
1.6.2. Analisis Condicional. . . . . . . . . . . . . . . . . . . . 41
1.6.3. Covarianza . . . . . . . . . . . . . . . . . . . . . . . . 45
1.7. Correlacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
1.7.1. Coeciente de Correlacion Lineal de Pearson (
XY
o r
XY
) 47
1.7.2. Matrix-Plot . . . . . . . . . . . . . . . . . . . . . . . . 50
1.7.3. Concepto de Rango . . . . . . . . . . . . . . . . . . . . 50
1.7.4. Correlacion de Rangos de Spearman (r
S
). . . . . . . . . 52
1.7.5. Correlacion de Punto Biserial (r
pb
). . . . . . . . . . . . 53
1.7.6. Correlacion Phi (). . . . . . . . . . . . . . . . . . . . 54
1.8. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . 56
2. Regresion Lineal 133
2.1. Modelo de Regresion Lineal . . . . . . . . . . . . . . . . . . . 133
2.2. Ejercicios Resueltos . . . . . . . . . . . . . . . . . . . . . . . . 135
3. Probabilidades 153
3.1. Probabilidades . . . . . . . . . . . . . . . . . . . . . . . . . . 153
3.1.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . 153
3.1.2. Deniciones . . . . . . . . . . . . . . . . . . . . . . . . 154
3.1.3. Probabilidad . . . . . . . . . . . . . . . . . . . . . . . 156
4. Variables Aleatorias 164
4.1. Variable Aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . 164
4.1.1. Varaibles Aleatorias Discretas . . . . . . . . . . . . . . 165
4.1.2. Varaibles Aleatorias Continuas . . . . . . . . . . . . . . 165
4.2. Valor Esperado . . . . . . . . . . . . . . . . . . . . . . . . . . 166
5. Inferencia Estadstica 170
5.1. Estimacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
5.2. Estimacion Puntual . . . . . . . . . . . . . . . . . . . . . . . . 172
5.2.1. Metodo de Maxima Verosimilitud . . . . . . . . . . . . 173
5.2.2. Metodo de los Momentos . . . . . . . . . . . . . . . . . 180
5.2.3. Propiedades de los Estimadores Puntuales . . . . . . . 182
5.2.4. Estimacion Intervalar . . . . . . . . . . . . . . . . . . . 198
5.3. Docima de Hipotesis . . . . . . . . . . . . . . . . . . . . . . . 203
5.3.1. Introduccion . . . . . . . . . . . . . . . . . . . . . . . . 203
Carlos Bustos-Lopez

INDICE GENERAL 3
5.3.2. Docimas . . . . . . . . . . . . . . . . . . . . . . . . . . 204
5.3.3. Docimas Univariadas . . . . . . . . . . . . . . . . . . . 205
5.3.4. Docimas Bivariadas . . . . . . . . . . . . . . . . . . . . 209
5.4. Docimas de Hipotesis No Parametricas . . . . . . . . . . . . . 214
5.4.1. Prueba de Suma de Rangos de Wilcoxon . . . . . . . . 214
5.4.2. Docima de Bondad de Ajuste Chi-cuadrado . . . . . . 217
5.4.3. Tablas de Contingencia . . . . . . . . . . . . . . . . . . 218
5.4.4. Docima Chi-cuadrado de Independencia . . . . . . . . 220
6. Muestreo 224
6.1. Muestreo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226
6.1.1. Muestreo Aleatorio Simple. (m.a.s.) . . . . . . . . . . . 227
6.1.2. Muestreo Estraticado. . . . . . . . . . . . . . . . . . . 227
6.1.3. Muestreo Sistematico. . . . . . . . . . . . . . . . . . . 228
6.1.4. Tama no Muestral . . . . . . . . . . . . . . . . . . . . . 229
6.1.5. Plan de Muestreo . . . . . . . . . . . . . . . . . . . . . 230
Carlos Bustos-Lopez
Captulo 1
Estadsticas Descriptivas:
Deniciones
1.1. Fundamentos de la Investigacion
Cientca
La Ciencia se puede entender como un conjunto sistematizado de conocimien-
tos, sobre la realidad observada, que se obtienen aplicando el metodo cient-
co.
El n esencial de la ciencia es la teora, la que levanta como un conjunto de
leyes y reglas que son la base del conocimiento; la teora sirve para relacionar,
explicar, predecir y controlar fenomenos.
Denicion 1.1.1 El metodo, (meta=hacia; hodos=camino), es un conjun-
to de acciones desarrolladas seg un un plan preestablecido con el n de lograr
un objetivo.
El metodo cientco diferencia la investigaci on de la especulacion, y
el conocimiento cientco (universal, necesario, sistematico y metodico), del
vulgar (particular, contingente, asistematico y ametodico).
4
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 5


1.2. Motivaciones y Deniciones
Que es la Estadstica?
Originalmente la palabra estadstica ha estado asociada al procesamiento
de datos, censos y demografas en la Roma Imperial, entendiendose por esto
la representacion graca, la tabulacion y el calculo de medidas resumen, que
permiten analizar e interpretar un conjunto de datos.
La estadstica es una Ciencia (disciplina) que se preocupa de desarrollar
tecnicas y modelos que permitan estudiar la forma como la incertidumbre
sobre un fenomeno es alterada por la informacion disponible.
La Estadstica no es una ciencia vulgar que busca la manera de tratar
los datos numericos, sino la base del conocimiento cuantitativo, el principal
instrumento hasta ahora descubierto por el hombre para poder dominar la
terrible complejidad de las cosas y de las relaciones entre ellas. (Kendall,
19..).
Que es la Poblacion?
Denicion 1.2.1 Conjunto formado por TODAS las unidades (personas,
animales o cosas) que tienen algo en com un. La poblacion puede ser listada
en lo que llamaremos Marco Muestral ().
Que es una Muestra?
Denicion 1.2.2 Una muestra es un subconjunto de la poblacion. General-
mente de denotan con letras may usculas. (p.e. A, B, C, etc.).
Que es una Variable?
Denicion 1.2.3 Caracterstica que cambia (vara) de sujeto a sujeto. (p.e.
color de ojos). Las denotaremos por letras may usculas. (p.e. X, Y, Z, etc.).
Que es un Dato?
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 6


Denicion 1.2.4 Es un registro alfanumerico. Ycorresponde a una real-
izacion de una caracterstica o variable, al ser evaluada en un conjunto. (p.e.
Color de ojos = azul). Los denotaremos con la misma letra de la variable,
pero con letras min usculas. (p.e. x
1
, x
2
, . . . , x
n
).
Que es Informacion?
Denicion 1.2.5 Llamaremos informacion al conjunto de datos.
x
1
, x
2
, . . . , x
n
.
Basicamente, al conjunto de observaciones (datos) que permiten disminuir
la incertidumbre que se tiene de un fenomeno.
1.2.1. Tipos de Variables
V ariable
_

_
Cualitativa
_
Nominal
Ordinal
Cuantitativa
_
Discreta
Continua
Cualitativas: Son todas aquellas variables cuyo conjunto de posibles
respuestas corresponden a cualidades del objeto en estudio.
Nominales: El conjunto de posibles respuestas de las variables
corresponden a nombres de las cualidades del objeto en estudio.
(p.e. 1: representa sexo masculino y 2: sexo femenino).
Ordinales: El conjunto de posibles respuestas de las variables
tienen un orden jerarquico natural. (p.e. En un partido de f utbol:
-1 es perder, 0 es empatar y 1 es ganar).
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 7


Cuantitativas: Son todas aquellas variables cuyo conjunto de posibles
resultados corresponden a mediciones de la caracterstica del objeto en
estudio.
Discretas: El conjunto de posibles respuestas, es un conjunto
nito o innito numerable. (p.e. N umero de hijos, etc.).
Continuas: El conjunto de posibles respuestas, es un conjunto
innito no numerable. (p.e. Altura, Peso, etc.).
Ejemplos de datos estadsticos.
1. Variable Discreta Nominal: Las preferencias de colores para un
determinado envase en una encuesta a 32 personas se representan en la
siguiente tabla de codigos:
Color Rojo Verde Azul Amarillo
Codigo 1 2 3 4
y el conjunto de datos es el siguiente:
1 1 1 2 3 3 4 1
1 1 2 3 3 4 1 1
2 2 3 3 1 1 2 2
3 4 1 1 2 2 3 4
esta variable es nominal porque los valores posibles solo representan un
nombre de acuerdo a la tabla de codigos.
2. Variable Discreta Ordinal: Las 25 personas que trabajan en un
departamento de una tienda se clasican seg un la edad x en la forma
siguiente:
Edad x < 18 18 x < 25 25 x < 40 40 x < 60 60 x
Codigo 1 2 3 4 5
las observaciones son las siguientes:
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 8


1 2 2 4 3
2 2 2 5 2
2 2 3 2 3
4 3 3 3 3
4 3 2 2 3
esta variable es ordinal, ya que los valores de las respuestas, tienen un
orden jerarquico natural.
3. Variable Cuantitativa Discreta: Las ventas de un modelo de au-
tomovil durante una semana entre 15 distribuidores:
Distrib. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Venta 2 1 0 0 3 2 0 0 2 1 1 1 0 1 2
esta variable es cuantitativa porque representa una cantidad y es discre-
ta debido a que, aunque el n umero de valores posibles es innitamente
grande, estos se pueden enumerar, 0-1-2-3-4-etc.
4. Variable Cuantitativa Continua: Las duraciones de 10 ampolletas,
son los siguientes:
Ampolleta 1 2 3 4 5 6 7 8 9 10
Duracion 18.0 18.4 19.0 20.2 19.6 18.6 19.4 19.2 17.0 18.5
esta variable es continua, ya que el conjunto de valores posibles es no
numerable.
1.2.2. Tabulaci on
[Tabla de Frecuencias]
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 9


Denicion 1.2.6 Una tabla de frecuencias es un arreglo en la que se
anotan las frecuencias de los distintos valores posibles, denotados por X.
Toda tabla consta de las y columnas, utilizandose la primera columna para
la identicacion de la variable y de sus respectivos atributos o intervalos,
como veremos en lo que sigue:
Variable n
i
f
i
f
i
% N
i
F
i
F
i
%
categora 1 n
1
f
1
f
1
% N
1
F
1
F
1
%
categora 2 n
2
f
2
f
2
% N
2
F
2
F
2
%
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
categora k n
k
f
k
f
k
% N
k
F
k
F
k
%
Total N 1 100 %
Variables Cuantitativas
1. Variables Discretas
Para un conjunto de N observaciones de una variable discreta X, se
dene:
a) La frecuencia absoluta u observada de la variable X, como el
n umero de observaciones iguales a x
i
, y se simboliza por n
i
.
b) La frecuencia relativa de la variable X, como:
f
i
=
n
i
N
.
c) La frecuencia absoluta acumulada de la variable X, como el n umero
de observaciones menores o iguales a x
i
. Se denota por:
N
i
=
i

j=1
n
j
.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 10


d) La frecuencia relativa acumulada de la variable X, como:
F
i
=
i

j=1
f
j
.
Note que:
a)

k
i=1
n
i
= N .
b)

k
i=1
f
i
= 1 .
c) N
k
=

k
i=1
n
i
= N .
d) F
k
=

k
i=1
f
i
= 1 .
e) F
i
=

i
j=1
f
j
=

i
j=1
n
j
N
=
1
N

i
j=1
n
j
=
N
i
N
.
Ejemplo 1.2.1 La siguiente informacion representa el nivel de in-
struccion de 20 personas:
B, M, S, S, B, B, M, M, M, S, S, M, B, B, M, M, B, M, S, B .
Nivel de Instruccion n
i
f
i
N
i
F
i
F
i
%
Basico 7
7
20
= 0,35 7 0,35 35 %
Medio 8
8
20
= 0,40 15 0,75 75 %
Superior 5
5
20
= 0,25 20 1,00 100 %
Total 20 1,00
Ejemplo 1.2.2 Para las ventas de un modelo de automovil en una
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 11


semana en 15 distribuidores:
X n
i
f
i
N
i
F
i
F
i
%
0 5 0,333 5 0,333 33,3 %
1 5 0,333 10 0,667 66,7 %
2 4 0,268 14 0,933 93,3 %
3 1 0,067 15 1,000 100 %
Total 15 1,000
2. Variables Continuas
Si la variable que se estudia es continua o bien el n umero de resultados
posibles de una variable discreta es muy grande, es conveniente agrupar
las observaciones en intervalos de clase.
Ejemplo 1.2.3 Se tienen las edades de 50 pacientes que han sido aten-
didos en la consulta medica, referentes a problemas de stress, los datos
se presentan en la tabla siguiente:
20 22 23 23 24 24 25 25 25 26
26 27 27 28 30 30 30 30 30 31
32 34 34 34 36 36 36 36 37 37
37 37 37 37 38 38 38 38 38 40
40 41 42 42 42 43 44 45 45 48
En este caso como la variable es cuantitativa continua la cantidad de
categoras posibles son innitas, por lo cual no se pueden representar
facilmente en la tabla. Por lo cual se procede de la siguiente forma:
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 12


Ejemplo 1.2.4 Para el ejemplo de tiempo de duracion de ampolletas,
se tiene la tabla de frecuencias:
Intervalos de Clase Marca de Clase n
i
f
i
N
i
F
i
F
i
%
17 18 17,5 2 0,20 2 0,20 20 %
18 19 18,5 4 0,40 6 0,60 60 %
19 20 19,5 3 0,30 9 0,90 90 %
20 21 20,5 1 0,10 10 1,00 100 %
Total 10 1,00
3. Notas:
a) Es usual que los intervalos de clase sean de igual longitud.
b) El criterio utilizado para denir el n umero de intervalos (k) cuando
la cantidad de observaciones es un n umero peque no es:
k =

N .
c) Cuando el n umero de observaciones es muy grande se preere:
k = 1,6 ln N .
d) Otra posibilidad para el n umero de intervalos es la formula de
Sturges:
NI = 1 + 3,3 ln N .
e) Ademas la amplitud del intervalo esta dado por:
a =
X
Max
X
Min
k
.
f ) En una tabla de frecuencias con intervalos de clase se pierde in-
formacion, porque solo se conoce el intervalo al que pertenecen los
resultados. Lo usual es considerar a la marca de clase como un
valor representativo de todos los datos del correspondiente inter-
valo.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 13


g) En variables nominales no tiene sentido calcular frecuencias acu-
muladas porque no existe relacion de orden entre los valores posi-
bles de la variable.
Ejemplo 1.2.5 Considere las notas de 20 alumnos:
6,2 4,8 3,8 4,6 4,4
5,7 6,4 5,4 6,3 4,8
4,9 3,1 3,8 5,5 5,1
6,8 4,7 5,5 7,0 4,2
De donde, k =

20 4,47 4,5 5 , R = 7,0 3,1 = 3,9 , y


A =
3,9
5
0,78 .
Notas Marca de Clase n
i
f
i
N
i
F
i
F
i
%
3,10 3,88 3,49 3 0,15 3 0,15 15 %
3,88 4,66 4,27 3 0,15 6 0,30 30 %
4,66 5,44 5,05 6 0,30 12 0,60 60 %
5,44 6,22 5,83 4 0,20 16 0,80 80 %
6,22 7,00 6,61 4 0,20 20 1,00 100 %
Total 20 1,00
1.2.3. Representacion Graca
1. Diagrama de Tallo y Hojas:
Otra alternativa para estudiar la variabilidad consiste en estudiar los
datos usando un diagrama de Tallo y Hojas. Tiene la ventaja de
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 14


retener todo el detalle de los datos originales y al mismo tiempo permite
ordenarlos rapidamente.
Cada dato numerico se divide en dos partes: el (los) dgito(s) princi-
pal(es) se convierte(n) en el tallo, y el (los) dgito(s) secundario(s) en
hojas.
Ejemplo 1.2.6 Consideremos los siguientes datos de la tabla:
13 18 15 12 14 13
13 18 10 14 13 13
13 18 15 14 17 13
17 12 17 18 14 15
17 13 10 18 17 15
Entonces el diagrama de tallo y hojas es el siguiente:
2 1 00
2 1
4 1 22
12 1 33333333
16 1 4444
14 1 5555
10 1
10 1 77777
5 1 88888
Ejemplo 1.2.7 Consideremos los siguientes datos de la tabla:
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 15


-5.5 -3.4 -1.3 1.7 1.4 3.6
-1.9 -7.6 -1.2 1.7 -1.0 5.8
-5.2 -4.2 5.8 4.5 6.6 6.9
-4.2 2.5 4.0 2.4 -3.6 4.7
0.8 -0.9 -1.6 -4.3 1.7 -1.3
Entonces el diagrama de tallo y hojas es el siguiente:
1 -7 6
1 -6
3 -5 52
6 -4 322
8 -3 64
8 -2
14 -1 963320
15 -0 9
15 0 8
14 1 4777
10 2 45
8 3 6
7 4 057
4 5 88
2 6 69
2. Diagrama Circular o Torta:
El diagrama Circular permite representar las frecuencias porcentuales
de las categoras de una variable cualitativa nominal.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 16


Ejemplo 1.2.8 Consideremos los datos del ejemplo de preferencias de
color para un envase, el graco asociado es el siguiente:
Fracuencias
=
n
i
N
360 .
3. Diagrama de Puntos o Dot-plot:
Este tipo de graco permite exhibir rapidamente los datos sobre la
recta real. Consiste basicamente en una recta horizontal, bajo la cual
se marcan los valores mnimo y maximo, y se completa con los demas
valores en incrementos espaciados.
Se marca el valor observado con una o una sobre el valor correspon-
diente en la recta. Si hay dos o mas unidades con el mismo valor de la
variable ubicarlos verticalmente.
Ejemplo 1.2.9 Consideremos los datos obtenidos al calibrar un ins-
trumento de medicion:
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 17


4. Graco de Barras:
En variables discretas la mejor forma de representar las frecuencias es
mediante un graco de barras en el que se colocan los valores posibles
de la variable en el eje horizontal y las frecuencias relativas en el eje
vertical.
Ejemplo 1.2.10 Consideremos los datos de las ventas de automovil
en las 15 distribuidoras. Su graco de barras asociado es:
5. Histograma:
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 18


Un histograma es una representaci on graca de las frecuencias rela-
tivas.
En variables continuas el histograma se construye a partir de rectangu-
los para cada uno de los intervalos de clase; en estos rectangulos, la base
corresponde al intervalo de clase y la altura es la frecuencia relativa del
intervalo, es claro que el area no corresponde a la frecuencia relativa,
salvo en el caso que la longitud del intervalo sea la unidad.
Ejemplo 1.2.11 Considere los siguientes datos:
271 301 301 312
312 314 317 319
324 325 329 334
335 337 342 349
351
El histograma asociado es el siguiente:
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 19


6. Poligono de Frecuencias:
Los poligonos de frecuencias permiten representar las distribuciones de
uno mas grupos de datos, y ademas como se representan las frecuen-
cias relativas o porcentuales es facil comparar el comportamiento de la
variable en los grupos.
Ejemplo 1.2.12 Consideremos los datos del ejemplo anterior:
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 20


7. Ojiva:
Es un poligoo de frecuencias, pero permite representar las frecuencias
acumuladas, de tal forma que pueda establecer para los distintos inter-
valos cual grupo presenta mayor frecuencia relativa o porcentaje para
un determinado punto de la variable.
Ejemplo 1.2.13 Consideremos los datos del ejemplo anterior:
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 21


Nota historica:
La primera aplicacion de metodologa estadstica, corresponde a nes del
siglo XIX y retrata a una gran mujer, Florence Nightingale, quien realizo im-
portantes aportes a la medicina y a la estadstica.
En la Guerra de Crimea (1854-1856), ella graco la incidencia de las
muertes previsibles en el hospital del frente de batalla por las malas condi-
ciones sanitarias.
Desarrollo un diagrama de area polar, a n de ilustrar la necesidad de la
reforma en las condiciones de atencion.
Nightingale, revolucion o el sistema y mostro que un fenomeno social poda
ser medido objetivamente, y estudiado mediante un analisis matematico.
Luego de este estudio, la tasa de mortalidad bajo de un 42.7 % a un 2.2 %.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 22


El diagrama, muestra la evoluci on de las causas de mortalidad en el Ejerci-
to en el Oriente a nes de 1858.
Se observa que la mayora de los soldados britanicos que murieron durante
la guerra de Crimea, fue producto de una enfermedad (azul) en lugar de
heridas u otras causas (rojo o negro).
Tambien, se puede apreciar que la tasa de mortalidad fue mayor en el
primer a no de la guerra (mitad derecha del diagrama), antes de que la
Comision Sanitaria llegara en marzo de 1855 para mejorar la higiene en los
campamentos y hospitales.
1.3. Medidas de Tendencia Central
Las medidas de Tendencia Central, son valores alrededor de los cuales las
observaciones tienden a concentrarse
1
.
1.3.1. Media Armonica (H(X)).
Denicion 1.3.1 Sean x
1
, x
2
, . . . , x
n
los valores observados de una variable
X, entonces denominamos como media armonica a:
H(X) =
n
n

i=1
1
x
i
=
n
1
x
1
+
1
x
2
+ +
1
x
n
.
Ejemplo 1.3.1 Consideremos el conjunto de datos que consta de 5 valores:
3, 4, 6, 6 y 8, entonces:
H(X) =
5
1
3
+
1
4
+
1
6
+
1
6
+
1
8
=
5
25
24
= 4,8 .
1
A estos indicadores llamaremos Estadgrafos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 23


1.3.2. Media Geometrica (G(X)).
Denicion 1.3.2 Sean x
1
, x
2
, . . . , x
n
los valores observados de una variable
X, entonces denominamos como media geometrica a:
G(X) =
n

_
n

i=1
x
i
=
n

x
1
x
2
x
n
.
Ejemplo 1.3.2 Consideremos el conjunto de datos que consta de 5 valores:
3, 4, 6, 6 y 8, entonces:
G(X) =
5

3 4 6 6 8 = 5,1 .
1.3.3. Media Aritmetica o Promedio (
X
, x o M(X)).
Denicion 1.3.3 Sean x
1
, x
2
, . . . , x
n
los valores observados de una variable
X, entonces denominamos como media o promedio a
2
:

X
=
x
1
+ x
2
+ + x
n
n
=
n

i=1
x
i
n
.
Ejemplo 1.3.3 Consideremos el conjunto de datos que consta de 5 valores:
3, 4, 6, 6 y 8, entonces:

X
=
3 + 4 + 6 + 6 + 8
5
=
27
5
= 5,4 .
2
Se denota con
X
a la media aritmeticapoblacional y con x a la media aritmetica
muestral.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 24


Nota: La media es un punto de equilibrio en el siguiente sentido:
Si d
i
= x
i
x representa el desvo de la i-esima observacion con respecto
a la media, entonces d
1
+d
2
+ + d
n
= 0.
Es decir, los desvos por bajo la media son compensados por los desvos
por sobre la media.
En el ejemplo anterior los desvos correspondientes son d
1
= 3 5,4,
d
2
= 4 5,4, d
3
= d
4
= 6 5,4, d
5
= 8 5,4, cuya suma es cero.
Ejemplo 1.3.4 Consideremos la siguiente tabla con datos:
Muestra x
1
x
2
x
3
x
4
x
5
x
A 2 3 4 5 6 4
B 2 4 4 4 6 4
C 1 5 4 5 5 4
D 4 4 4 4 4 4
La lista anterior se puede extender con todas las colecciones de cinco n umeros
cuya suma sea 20.
Nota: La media es una caracterstica del comportamiento de los datos
que puede ser utilizada como un indicador (p.e. de rendimiento), pero no
se puede pretender que un solo n umero nos de una idea de la forma del
comportamiento de los datos.
Propiedades de la Media:
Sean X e Y variables aleatorias, y a, b y c constantes.
(c) = c.
(X b) = (X) b.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 25


(aX b) = a(X) b.
(aX bY ) = a(X) b(Y ).
Ejemplo 1.3.5 Considere la siguiente tabla con edades de varones, que tra-
bajan en una empresa manufacturera.
56 41 49 56 48 47 46 53 51 52 47 42
56 49 48 52 50 43 58 38 54 46 47 58
47 48 52 57 51 47 55 46 41 48 47 56
54 48 51 52 50 44 47 43 49 53 51 52
49 46 62 51 51 47 51 50 49 53 52 33
Para este caso el valor de x = 49,50 a nos.
Cuando los datos estan agrupados en una tabla de frecuencias, con k
intervalos de clase, el procedimiento para calcular x es el siguiente:
x =
x
1
n
1
+ x
2
n
2
+ + x
k
n
k
n
=
k

i=1
x
i
n
i
n
,
note que en este caso x
i
no es la observaci on i, sino corresponde a la i-esima
marca de clase.
Ejemplo 1.3.6 Ahora construyamos la tabla de frecuencias: k =

60
7,75 8, R = 62 33 = 29, entonces LI =
29
8
3,63.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 26


Int. de Clase M. de C. x
i
n
i
f
i
f
i
% N
i
F
i
F
i
% x
i
n
i
33,00 36,63 34,82 1 0,017 1,7 % 1 0,017 1,7 % 34,8
36,63 40,26 38,45 1 0,017 1,7 % 2 0,033 3,3 % 38,4
40,26 43,89 42,08 5 0,083 8,3 % 7 0,117 11,7 % 210,4
43,89 47,52 45,71 13 0,217 21,7 % 20 0,333 33,3 % 594,2
47,52 51,15 49,34 20 0,333 33,3 % 40 0,667 66,7 % 986,7
51,15 54,78 52,97 11 0,183 18,3 % 51 0,850 85,0 % 582,6
54,78 58,41 56,60 8 0,133 13,3 % 59 0,983 98,3 % 452,8
58,41 62,04 60,23 1 0,017 1,7 % 60 1,000 100,0 % 60,2
Total 60 1 100 % 2960,1
Ahora, al calcular el valor de x se obtiene: x =
2960,1
60
49,33 a nos.
1.3.4. Media Ponderada (
P
, x
P
).
Denicion 1.3.4 Sean x
1
, x
2
, . . . , x
n
los valores observados en una variable
X y w
1
, w
2
, . . . , w
n
n umeros no negativos cuya suma es 1, entonces denomi-
namos media ponderada de n observaciones a:
x
P
=
n

i=1
w
i
x
i
= w
1
x
1
+ w
2
x
2
+ + w
n
x
n
, con
n

i=1
w
i
= 1 .
Si la variable en la muestra tiene k valores distintos (k n) que aparecen
con frecuencias n
1
, n
2
, . . . , n
k
, entonces la media puede ser obtenida como:
x =
n
1
x
1
+ n
2
x
2
+ + n
k
x
k
n
=
k

i=1
n
i
x
i
n
,
= f
1
x
1
+ f
2
x
2
+ . . . + f
k
x
k
=
k

i=1
f
i
x
i
,
donde f
i
es la frecuencia relativa de la observacion x
i
, con i = 1, 2, . . . , k.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 27


Note que en este caso w
i
= f
i
. Ademas, si la poblacion fue dividida
en p grupos, cada uno con tama no n
i
, con i = 1, 2, . . . , p, con x
i
la media
correspondiente al grupo i, entonces el valor de la media poblacional es:
x =
p

i=1
x
i
n
i
p

i=1
n
i
.
Ejemplo 1.3.7 En un estudio de 92 personas de tres grupos sobre la altura
media en cierta compa na, se obtuvieron los siguientes resultados, separados
seg un tramo de edad:
x
1
= 158,5mt. , n
1
= 34
x
2
= 172,3mt. , n
2
= 30
x
3
= 163,1mt. , n
3
= 28
Ejemplo 1.3.8 Y el valor de la media poblacional es:
x =
x
1
n
1
+ x
2
n
2
+ x
3
n
3
n
1
+ n
2
+ n
3
,
=
158,5 34 + 172,3 30 + 163,1 28
34 + 30 + 28
,
=
5389 + 5169 + 4566,8
92
=
15124,8
92
= 164,4mt.
Ademas, si w
i
= 1/n, para todo i, entonces x
P
= x.
1.3.5. Media Recortada en % .
Denicion 1.3.5 Se llama media recortada en a un promedio o media que
no considera una proporcion de las observaciones en cada extremos de las
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 28


observaciones ordenadas de menor a mayor (Corte simetrico)
3
.
El objetivo es eliminar la inuencia de las observaciones mas extremas,
asignandoles peso cero.
Ejemplo 1.3.9 Calculemos la media de los siguientes datos que correspon-
den al n umero de bibliotecas por region.
68 (I) 78 (II) 52 (III) 74 (IV) 214 (V) 84 (VI)
75 (VII) 186 (VIII) 125 (IX) 105 (X) 33 (XI) 47 (XII)
855 (XIII)
x =
68 + 78 + 52 + 74 + 214 + 84 + 75 + 186 + 125 + 105 + 33 + 47 + 855
13
=
1996
13
= 153,5bibliotecas.
y la media recortada a un 10 % es
x
,1
=
68 + 78 + 52 + 74 + 214 + 84 + 75 + 186 + 125 + 105 + 47
11
= 100,7bibliotecas.
1.3.6. Moda (Mo(X)).
Denicion 1.3.6 La moda, como su nombre lo indica, corresponde a la ob-
servacion mas frecuente o que se repite mas veces.
Ejemplo 1.3.10 Considere los siguientes conjuntos de datos:
1, 2, 3, 4, 5, 6, 7, 8, 9, y la moda para este grupo no existe.
1, 1, 2, 2, 3, 3, 3, 3, 4, y la moda para este grupo es Mo(X) = 3.
1, 1, 2, 2, 3, 4, 4, 5, 6, y la moda para este grupo es Mo(X)
1
= 1,
Mo(X)
2
= 2 y Mo(X)
3
= 4.
3
Es tpico tomar = 5 % o bien = 10 %.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 29


Seg un lo anterior, el valor modal puede existir o no, si existe este valor
puede ser no unico, en ese caso se habla de bimodal, trimodal, multimodal.
En el caso de tener solo un valor modal, se habla de unimodal.
En el caso que los datos se encuentren tabulados, la forma de calcular la
moda es la siguiente:
1. Primero, identicar el o los intervalos que contienen el valor modal, es
decir, el intervalo con mayor frecuencia absoluta o relativa.
2. Determinar el valor de
Mo(X) = LI
i
+
_
n
i
n
i1
(n
i
n
i1
) + (n
i
n
i+1
)
_
a
i
,
donde a
i
es la amplitud del i-esimo intervalo.
3. Si existe mas de un intervalo repetir el calculo anterior.
Ejemplo 1.3.11 Retomemos el ejemplo anterior de las edades, en este caso
i = 5, LI
5
= 47,52, n
5
= 20, n
4
= 13, n
6
= 11 y a
5
= 3,63, entonces:
Mo(X) = 47,52 +
_
20 13
(20 13) + (20 11)
_
3,63 ,
= 47,52 +
_
7
16
_
3,63 = 47,52 + 1,588 ,
= 49,108 49,11a nos.
Pero si nos referimos a los datos sueltos, el valor que mas se repite es 47
a nos.
1.3.7. Mediana (Me(X)).
Denicion 1.3.7 Es la realizacion u observacion que ocupa la posicion que
divide en dos partes iguales al conjunto de datos previamente ordenados de
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 30


menor a mayor, es decir, el 50 % de las observaciones son menores a este
valor y el 50 % restante son valores mayores a esta observacion.
Si el n umero de observaciones es impar, entonces, el valor de la mediana
coincide con la observaci on central, en cambio si el n umero de observaciones
es par, el valor de la mediana sera la media de los dos valores centrales.
Ejemplo 1.3.12 Considere los siguientes conjuntos de datos:
1, 2, 3, 4, 5, 6, 7, 8, 9, y la mediana para este grupo Me(X) = 5.
1, 2, 3, 4, 5, 6, 7, 8, y la mediana para este grupo es Me(X) =
4+5
2
=
4,5.
En el caso de que los datos ya se encuentren tabulados, el procedimiento
es el siguiente:
Me(X) = LI
i
+
_
N
2
N
i1
_
a
i
n
i
.
En el caso del ejemplo anterior se tiene que i = 5, LI
5
= 47,52, N = 60,
N
4
= 20, a
5
= 3,63 y n
5
= 20, entonces:
Me(X) = 47,52 +
_
60
2
20
_
3,63
20
,
= 47,52 + 10 0,1815 = 49,335 49,34a nos.
Si se calcula directamente con los datos sueltos, la Me(X) =
49+50
2
=
49,5a nos, donde las observaciones 49 a nos y 50 a nos corresponden a las
posicines 30 y 31, respectivamente.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 31


1.3.8. Comentarios
:
1. La Media Armonica, se utiliza principalmente para obtener un valor
representativo de un conjunto de datos expresados en forma de tasas,
esto es, tantas unidades de un tipo por cada unidad de otras especies.
2. La Media Geometrica, se utiliza principalmente para: 1) promediar
porcentajes, ndices y cifras relativas; y 2) determinar el incremento
porcentual promedio en ventas, produccion u otras actividades o series
economicas de un periodo a otro.
3. Las Medias Geometrica y armonica tienden a reducir la inuencia de
valores grandes y a destacar la de los valores peque nos. El calculo de
estas dos estadsticas exige que los valores de la variable sean positivos.
4. La Media Aritmetica, se utiliza principalmente cuando la distribucion
de los datos es aceptablemente simetrica.
5. La Media Ponderada, se utiliza principalmente cuando se sabe que al-
gunos datos tienen mayor importancia dentro de la muestra.
6. La Media Recortada, se utiliza principalmente cuando los datos ex-
tremos son muy anomalos y se alejan mucho del centro de los datos.
7. La Moda, se utiliza principalmente cuando la variable que se esta es-
tudiando es cualitativa nominal.
8. La Mediana, se utiliza cuando la variable en estudio es al menos ordinal.
1.4. Medidas de Posicion
Las medidas de posicion, nos permiten cuanticar en que posicion se
encuentra una observacion dentro de un conjunto de datos previamente or-
denado de menor a mayor.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 32


1.4.1. Mnimo (X
Min
).
Corresponde a la observaci on mas peque na, y se encuentra en la primera
posicion.
1.4.2. Maximo (X
Max
).
Corresponde a la observaci on mas grande, y se encuentra en la ultima
posicion.
1.4.3. Percentiles( P

).
Los percentiles corresponden a ciertos valores de las observaciones que
dejan un determinado porcentaje de observaciones por bajo este valor. En
general se designa como P

, que representa la valor del percentil que deja


% de las observaciones por bajo de este valor.
Denicion 1.4.1 Para un n umero [0, 100] se denomina percentil a
un n umero x

tal que la frecuencia relativa acumulada en x

es % de las
observaciones, es decir:
F
x

= % .
Los percentiles se calculan de manera diferente seg un sea la variable disc-
reta o continua.
1. Variable Discreta.
En este caso el percentil se dene como x

: el menor n umero x tal


que F
x

.
Recordemos el ejemplo de venta de automoviles, el percentil 50 es P
50
=
1, esto quiere decir que el 50 % de los distribuidores vende un auto o
menos, el percentil 93 corresponde a P
93
= 2 y esto signica que el 93 %
de los distribuidores vende dos o menos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 33


2. Variable Continua.
En esta situacion, se puede encontrar el intervalo de clase en el cual
esta el percentil mediante la frecuencia relativa acumulada en la tabla
de frecuencias. El procedimiento es similar al calculo de la mediana,
utilizandose para esto la siguiente formula:
P

= LI
i
+
_
n
100
N
i1
_
a
i
n
i
.
Ejemplo 1.4.1 Retomemos el ejemplo anterior, y calculemos el P
75
,
en este caso i = 6, LI
6
= 51,15, n = 60, = 75, N
5
= 40, a
6
= 3,63 y
n
6
= 11, entonces:
P
75
= 51,15 + (60 0,75 40)
3,63
11
,
= 51,15 + 5 0,33 = 52,8a nos .
Notas:
Los percentiles no tienen sentido en variables nominales en las que no
se puede ordenar las observaciones de menor a mayor.
Los percentiles dependen de la forma seg un la que se ha construido la
tabla de frecuencias; esto signica que no existe una forma unica para
obtener los percentiles. (a menos que conozcamos la distribucion de los
datos.).
Para datos no agrupados es usual calcular los percentiles del siguiente
modo: se supone que la observaci on ordenada que ocupa el lugar i
corresponde al percentil:
k =
i 1
n 1
100 .
Otra forma es denir a la observaci on ya ordenada, n umero i como
correspondiente al percentil:
k =
i
n + 1
100 .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 34


Para calcular percentiles correspondientes a otros valores de k se ocupan
interpolaciones.
Se denominan Cuartiles a:
C
1
= P
25
, C
2
= P
50
= Me(X), C
3
= P
75
.
De la misma forma se denominan Quintiles a:
Q
1
= P
20
, Q
2
= P
40
, Q
3
= P
60
, Q
4
= P
80
.
Deciles a:
D
1
= P
10
, D
2
= P
20
, . . . , D
9
= P
90
.
1.4.4. Diagrama de Cajon o Box-Plot:
El diagrama de cajon (Box-Plot) denominado tambien cajon con bigotes,
es una representaci on graca de los datos basado en 5 n umeros: mnimo,
primer cuartil, mediana, tercer cuartil y maximo.
La lnea vertical que se dibuja desde el tercer cuartil hacia arriba, ge-
neralmente se extiende hasta el mayor valor que esta a una distancia de
1.5(C
3
C
1
) del tercer cuartil. Analogamente, la lnea que sale del primer
cuartil, hacia abajo, se extiende hasta el menor valor que esta a una distancia
de 1.5(C
3
C
1
) del primer cuartil.
Los datos que esten fuera de estos rangos se denominan outliers u
observaciones anomalas.
Ejemplo 1.4.2 El Box-plot para los datos de edades es:
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 35


1.5. Medidas de Variabilidad o de Dispersion
Estas medidas son estadgrafos que permiten medir la dispersion de un
conjunto de datos. Los mas importantes son aquellos que representan las
desviaciones de las observaciones respecto a alguna medida de tendencia cen-
tral.
1.5.1. Amplitud o Rango (R).
Denicion 1.5.1 Corresponde a la mayor diferencia que existe entre dos
observaciones de un conjunto de datos.
Rango = X
Max
X
Min
.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 36


1.5.2. Rango Intercuartil (RI).
Denicion 1.5.2 Corresponde a la mayor diferencia que existe entre dos
observaciones del 50 % de los datos centrales.
RI = C
3
C
1
= P
75
P
25
.
1.5.3. Desviacion Media (DM).
Denicion 1.5.3 En este caso nos interesa la magnitud de los desvos, es
decir su valor absoluto. La desviacion media se dene como:
DM =
|x
1
x| + +|x
n
x|
n
=
n

i=1
|x
i
x|
2
n
.
1.5.4. Varianza y Desviacion Estandar (
2
X
, S
2
X
o VVar(X)).
Denicion 1.5.4 Corresponde a la media de las desviaciones o diferencias
al cuadrado de las observaciones, con respecto a su media
4
.
1. Datos desagrupados (no tabulados): En este caso se tienen para X
(variable de interes) las n observaciones x
1
, x
2
, . . . , x
n
.

2
X
=
1
n
n

i=1
(x
i
)
2
=
1
n
_
n

i=1
x
2
i
n
2
_
,

X
=

_
1
n
_
n

i=1
x
2
i
n
2
_
.
4
Se denomina Desviacion Estandar a =

2
.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 37


S
2
X
=
1
n 1
n

i=1
_
x
i


X
_
2
=
1
n 1
_
n

i=1
x
2
i
n

X
2
_
,
S
X
=

_
1
n 1
_
n

i=1
x
2
i
n

X
2
_
.
2. Datos agrupados (tabulados): En este caso se tiene una tabla de fre-
cuencias con k intervalos, donde n
i
es la frecuencia absoluta del in-
tervalo i, x
i
la marca de clase del i-esimo intervalo y n el total de
observaciones.

2
X
=
1
n
_
k

i=1
n
i
x
2
i
n
2
_

X
=

_
1
n
_
k

i=1
n
i
x
2
i
n
2
_
.
S
2
X
=
1
n 1
_
k

i=1
n
i
x
2
i
n

X
2
_
S
X
=

_
1
n 1
_
k

i=1
n
i
x
2
i
n

X
2
_
.
Propiedades de la Varianza (VVar(X)).
Sean X e Y variables aleatorias independientes, y a, b y c constantes.
VVar(X) 0.
VVar(c) = 0.
VVar(X b) = VVar(X).
VVar(aX b) = a
2
VVar(X).
VVar(aX bY ) = a
2
VVar(X) + b
2
VVar(Y ).
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 38


1.5.5. Coeciente de Variaci on (C.V.(X)).
Denicion 1.5.5 El coeciente de variacion o de variabilidad relativa, es
una medida que entrega la dispersion relativa de los datos. Y permite com-
parar la homogeneidad de dos o mas conjuntos de datos.
C.V.(X) =

X

X
100 % .
El coeceinte de variacion (CV ), nos entrega una forma de medir la ho-
mogeneidad de los datos, ademas es un indicador sin unidad de medida, lo
que permite comparar distintos conjuntos de datos. Si el valor del coeciente
de variacion es cercano a 0, diremos que los datos son muy homogeneos, es
decir, son muy parecidos entre ellos, al contrario si el valor del coeciente
de variaci on es muy alto, diremos que los datos son heterogeneos, es decir,
muy diferentes entre ellos. De esa forma podemos comparar conjuntos de
datos distintos, ya sean de poblaciones o muestras distintas o de variables
con unidades de medida distintas. La interpretaci on sera:
Si 0 C.V.(X) < 25 %, los datos se diran Muy Homogeneos.
Si 25 % C.V.(X) < 50 %, los datos se diran Homogeneos.
Si 50 % C.V.(X) < 75 %, los datos se diran Heterogeneos.
Si C.V.(X) 75 %, los datos se diran Muy Heterogeneos.
Ejemplo 1.5.1 Modiquemos la tabla del ejemplo.
Int. de Clase M. de C.x
i
n
i
x
i
n
i
x
2
i
x
2
i
n
i
[33,00, 36,63] 34,82 1 34,8 1212,08 1212,08
(36,63, 40,26] 38,45 1 38,4 1478,02 1478,02
(40,26, 43,89] 42,08 5 210,4 1770,31 8851,53
(43,89, 47,52] 45,71 13 594,2 2088,95 27156,31
(47,52, 51,15] 49,34 20 986,7 2433,94 48678,84
(51,15, 54,78] 52,97 11 582,6 2805,29 30858,20
(54,78, 58,41] 56,60 8 452,8 3202,99 25623,95
(58,41, 62,04] 60,23 1 60,2 3627,05 3627,05
Total 60 2960,1 147485,99
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 39


La
X
=
2960,1
60
= 49,34 a nos, y el valor de la varianza es
2
X
=
147485,99
60

49,34
2
= 23,66 (a nos)
2
, ademas la desviacion estandar es
X
=

23,66 =
4,87 a nos, y el coeciente de variacion C.V.(X) =
4,87
49,34
100 % = 9,87 %.
Ejemplo 1.5.2 Determine el coeciente de variacion de Y = 3,2X + 4,
donde
X
= 12,1 y
X
= 4,3.
Como C.V.(Y ) =

Y

Y
100 %, necesitamos determinar la media de Y y
su desviacion estandar.
Pero M(Y ) = M(3,2X + 4) = 3,2M(X) + 4 = 3,2 12,1 + 4 = 42,72.
Ademas,
VVar(Y ) = VVar(3,2X + 4) = 3,2
2
VVar(X) = 10,24 4,3
2
,
= 10,24 18,49 = 189,3376 .
Entonces, el
C.V.(Y ) =

189,3376
42,72
100 % =
13,76
42,72
100 % 32,2 %.
1.6. Analisis Bivariado
En todas las discusiones anteriores, hemos tratado las variables y su res-
pectiva informacion como variables aisladas, pero en general, no solo nos
interesa una variable especca, sino varias de ellas, y poder descubrir las
posibles asociaciones entre dos o mas variables.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 40


1.6.1. Tablas de Doble Entrada.
Denicion 1.6.1 Estas tablas son un arreglo que consta de las y columnas,
que corresponden a distintas categas, y en las celdas se anota la frecuencia
absoluta de la realizacion de dos variables aleatorias simultaneamente.
Sean X e Y variables aleatorias, con I y J categoras, respectivamente. Y
sea n
ij
la frecuencia absoluta de las caractersticas (X
i
, Y
j
). La informacion
se puede resumir de la siguiente forma:
Y Total
n
11
n
12
n
1J
n
1+
X n
21
n
22
n
2J
n
2+
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
n
I1
n
I2
n
IJ
n
1+
Total n
+1
n
+2
n
+J
n
++
Note que n
i+
corresponde a la i-esima frecuencia absoluta de la variable X
5
, y
n
+j
corresponde a la j-esima frecuencia absoluta de la variable Y
6
. Ademas,
n
i+
=
J

j=1
n
ij
, n
+j
=
I

i=1
n
ij
, n
++
=
I

i=1
J

j=1
n
ij
.
Ejemplo 1.6.1 Considere la siguiente tabla con la informacion de puntajes
obtenidos en un test, seg un tramo de edad.
5
Este total corresponde a la frecuencia marginal de X
6
Este total corresponde a la frecuencia marginal de Y .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 41


Y : Edades de postulantes
25 27 27 29 Frec. Marg.
X : Puntajes x
i
y
j
26 28 de X
30 40 35 5 10 15
40 50 45 6 10 16
50 60 55 10 8 18
Frec. Marg. de Y 21 28 49
1.6.2. Analisis Condicional.
En muchas ocasiones no interesa por completo la tabla de doble entrada
sino alg un aspecto especco de ella, es decir, ya poseemos cierta informacion
que nos permite acotar el estudio.
Ejemplo 1.6.2 De la tabla anterior nos interesa saber la media de puntajes,
dado que las personas son menores de 27 a nos.
En este caso debemos determinar la tabla de distribucion de frecuencias
condicional dado que Y 27.
Y 27
Puntajes x
i
25 27 x
i
n
i
30 40 35 5 175
40 50 45 6 270
50 60 55 10 550
Total 21 995
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 42


Entonces,

X|Y 27
=
995
21
43,38puntos.
Ejemplo 1.6.3 De la tabla anterior, nos interesa saber la media de edad,
dado que las personas lograron menos de 45 puntos.
En este caso, debemos determinar la tabla de distribucion de frecuencias
condicional dado que X < 45.
X < 45
Edad y
j
30 40 40 50 y
j
n
j
25 27 26 5 + 6 = 11 286
27 29 28 10 + 10 = 20 560
Total 31 846
Luego,

Y |X<45
=
846
31
27,29a nos.
Ejemplo 1.6.4 La siguiente tabla corresponde a las alturas de 151 personas
de una empresa, separadas por sexo. Donde X es la altura en centmetros,
Y = 0 (Mujer) e Y = 1 (Hombre). Determine la media, moda y mediana de
X.
Y : Sexo
Muj. Hom. Frec. Marg.
X : Altura x
i
y
j
0 1 de X x
i
n
i
h
i
H
i
155 160 157,5 30 15 45 7087,5 0,298 0,298
160 165 162,5 25 32 57 9262,5 0,378 0,676
165 170 167,5 17 20 37 6197,5 0,245 0,921
170 175 172,5 3 9 12 2070 0,079 1,000
Frec. Marg. de Y 75 76 151 24617,5

X
=
24617,5
151
163,03cm.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 43


Mo(X) = 160 +

57 45
(57 45) + (57 37)

5 ,
= 160 +

12
12 + 20

5 ,
= 160 +

12
32

5 ,
160 + 1,875 161,875cm.
Me(X) = 160 +

151
2
45

5
57
,
= 160 + (75,5 45)
5
57
,
160 + 30,5 0,088 ,
160 + 2,684 162,684cm.
Ejemplo 1.6.5 Determine la distribucion condicional de X dado Y = 0 y
su respectiva media, moda y mediana.
Y = 0
Altura x
i
(Mujeres) x
i
n
i
h
i
H
i
155 160 157,5 30 4725 0,400 0,400
160 165 162,5 25 4062,5 0,333 0,733
165 170 167,5 17 2847,5 0,227 0,960
170 175 172,5 3 517,5 0,040 1,000
Total 75 12152,5

X|Y =0
=
12152,5
75
162,03cm.
Mo(X|Y = 0) = 155 +

30 0
(30 0) + (30 25)

5 ,
= 155 +

30
30 + 5

5 ,
= 155 +

30
35

5 ,
155 + 0,857 159,286cm.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 44


Me(X|Y = 0) = 160 +

75
2
30

5
25
,
= 160 + (37,5 30)
5
25
,
160 + 7,50 0,20 ,
160 + 1,50 161,50cm.
Ejemplo 1.6.6 Determine la distribucion condicional de X dado Y = 1 y
su respectiva media, moda y mediana.
Y = 1
Altura x
i
(Hombres) x
i
n
i
h
i
H
i
155 160 157,5 15 2362,5 0,197 0,197
160 165 162,5 32 5200 0,421 0,618
165 170 167,5 20 3350 0,263 0,881
170 175 172,5 9 51552,5 0,118 1,000
Total 76 12465

X|Y =1
=
12465
76
164,01cm.

X|Y =1
=
12465
76
164,01cm.
Mo(X|Y = 1) = 160 +

32 15
(32 15) + (32 20)

5 ,
= 160 +

17
17 + 12

5 ,
= 160 +

17
29

5 ,
160 + 2,93 162,93cm.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 45


Me(X|Y = 1) = 160 +

76
2
15

5
32
,
= 160 + (38 15)
5
32
,
160 + 23 0,156 ,
160 + 3,588 163,588cm.
1.6.3. Covarianza
En los analisis bivariados obtenemos la informacion de las frecuencias
absolutas de un suceso bajo dos variables aleatorias, pero ademas nos interesa
saber la relacion que existe entre estas dos variables.
As como la varianza es una forma de medir la variabilidad de una variable
de interes, la covarianza nos permite medir la variabilidad conjunta de dos
variables X e Y
7
.
1. Datos no agrupados: Sean x
1
, . . . , x
n
e y
1
, . . . , y
n
las respectivas obser-
vaciones para las variables X e Y , ademas sean
X
y
Y
, las respectivas
medias de las variables. La covarianza se denota por
XY
8
.

XY
=
1
n
_
n

i=1
x
i
y
i
n
X

Y
_
=

n
i=1
x
i
y
i
n

X

Y
.
2. Datos agrupados: En este caso se tiene una tabla con frecuencias con-
juntas para las variables X e Y , es decir, se tiene una tabla con I las
7
El lector debe poner atencion en que, la covarianza de una variable X con sigo misma,
es decir,
XX
=
2
X
corresponde a la varianza de la variable X.
8
Tambien se suele utilizar Cov(X, Y ).
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 46


para X y J columnas para Y , donde n
ij
corresponde a la frecuencia
absoluta observada en la celda que se genera al intersectarse la la i
con la columna j, con i = 1, . . . , I y j = 1, . . . , J.

XY
=
1
n
_
I

i=1
J

j=1
n
ij
x
i
y
j
n
X

Y
_
=

I
i=1

J
j=1
n
ij
x
i
y
j
n

X

Y
.
Ejemplo 1.6.7 Considere el siguiente ejemplo:
Edades de postulantes
25 27 27 29 Frec. Marg. x
i
n
i
Puntajes x
i
y
j
26 28 de X
30 40 35 5 10 15 525
40 50 45 6 10 16 720
50 60 55 10 8 18 990
Frec. Marg. de Y 21 28 49 2235
y
j
n
j
546 784 1330
Luego,
X
=
2235
49
= 45,61a nos y
Y
=
1330
49
= 27,14a nos.
Entonces,
Cov(X, Y ) =
35 26 5 + 35 28 10 + 45 26 6 + 45 28 10 + 55 26 10 + 55 28 8
49
45,61 27,14
=
60590
49
45,61 27,14
= 1236,53 45,61 27,14
= 1236,53 1237,86
= 1,33a nos puntos .
1.7. Correlacion
En la seccion anterior hemos visto como las tablas bivariadas nos permiten
tener una idea del comportamiento de las observaciones cuando estas son
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 47


medidas de forma conjunta, y como determinar las respectivas distribuciones
condicionales de las variables.
Pero muchas veces nos interesa, ademas, saber cual es la relacion que
existe entre estas dos variables, es decir, cuanto se afectan la una a la otra.
Un indicador que nos permite responder a las necesidades anteriores, es
el coeciente de correlacion.
1.7.1. Coeciente de Correlacion Lineal de Pearson (
XY
o r
XY
)
El coeciente de correlacion lineal de Pearson, permite cuanticar el grado
de asociacion o relacion lineal entre las variables. Y se dene como:

XY
=

XY
_

2
X

2
Y
,
r
XY
=
n

i=1
x
i
y
i
n x y

_
_
n

i=1
x
2
i
n x
2
__
n

i=1
y
2
i
n y
2
_
.
El coeciente de correlacion, cumple que: 1 r
XY
1.
Interpretacion:
Cuando los valores de r
XY
son cercanos a -1, se dice que las variables
X e Y tienen alta asociacion lineal inversa.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 48


Cuando los valores de r
XY
son cercanos a 1, se dice que las variables X
e Y tienen alta asociacion lineal directa
Cuando el valor de r
XY
es cero, se tienen dos situaciones, la primera si
estamos bajo normalidad en las variables, entonces se dira que X e Y
son independientes; en otro caso, simplemente no se sabe que tipo de
asociacion existe entre las variables, al menos no es lineal (p.e. puede
ser: cuadratica, c ubica, etc.).
Ejemplo 1.7.1 Consideremos los siguientes datos de un experimento sobre
mediciones espirometricas.
Individuo Edad (Z) Altura (X) FV C (Y ) XY X
2
Y
2
XZ Z
2
1 25 160 5.08 812.80 25600 25.8064 4000 625
2 25 159 4.89 777.51 25281 23.9121 3975 625
3 26 174 5.44 946.56 30276 29.5936 4524 676
4 26 171 4.12 704.52 29241 16.9744 4446 676
5 26 164 6.36 1043.04 26896 40.4496 4264 676
6 27 168 5.17 868.56 28224 26.7289 4536 729
7 27 170 5.52 938.40 28900 30.4704 4590 729
8 28 174 5.24 911.76 30276 27.4576 4872 784
Total 210 1340 41.82 7003.15 224694 221.3930 35207 5520
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 49


x =
1340
8
167,5, y =
41,82
8
5,23
r
XY
=
7003,15 8 167,5 5,23
_
(224694 8 167,5
2
)(221,3930 8 5,23
2
)
,
=
7003,15 7008,2
_
(224694 224450)(221,3930 218,82)
,
=
5,05

244 2,573
,
=
5,05

627,812
,
=
5,05
25,01
,
0,202 .
Ejemplo 1.7.2 Consideremos la tabla anterior y calculemos la correlacion
entre Edad y Altura.
x =
1340
8
167,5, z =
210
8
26,25
r
XZ
=
35207 8 167,5 26,25
_
(224694 8 167,5
2
)(5520 8 26,25
2
)
,
=
35207 35175
_
(224694 224450)(5520 5512,5)
,
=
32

244 7,5
,
=
32

1830
,
=
32
42,78
,
0,75 .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 50


1.7.2. Matrix-Plot
La matriz dfe gracos permite, determinar rapidamente si dos variables
tienen alg un grado de asociacion lineal, pero mas a un, permite visualizar
todas las combinaciones posibles de las variables.
1.7.3. Concepto de Rango
La idea es ordenar las observaciones de menor a mayor y asignarles un
n umero correlativo a la posicion que ocupan, el cual se denomina rango.
Ejemplo 1.7.3 Consideremos las siguientes observaciones:
9, 2, 4, 6, 3, 12 .
Ordenemos los datos de menor a mayor y asignemos un n umero a la posicion
que ocupan:
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 51


Observacion 2 3 4 6 9 12
Posicion o Rango 1 2 3 4 5 6
Cuando existen observaciones repetidas, el procedimiento para asignar los
rangos es el siguiente:
Ejemplo 1.7.4 Consideremos las siguientes observaciones:
9, 2, 2, 2, 4, 6, 6, 3, 12 .
Ordenemos los datos de menor a mayor y asignemos un n umero a la posicion
que ocupan.
Observacion 2 2 2 3 4 6 6 9 12
Posicion o Rango 1 2 3 4 5 6 7 8 9
Ejemplo 1.7.5 Ahora, calculamos la media de las posiciones para las obser-
vaciones que estan repetidas.
Rango de empatados (2) =
1 + 2 + 3
3
=
6
3
= 2 ,
y para
Rango de empatados (6) =
6 + 7
2
=
13
2
= 6,5 ,
entonces la tabla con los rangos es:
Observacion 2 2 2 3 4 6 6 9 12
Posicion o Rango 2 2 2 4 5 6.5 6.5 8 9
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 52


1.7.4. Correlacion de Rangos de Spearman (r
S
).
Corresponde a un estadgrafo no parametrico, y se basa en la utilizacion
de los rangos asignados a los respectivos valores de las variables.
Su forma es la siguiente:
r
S
= 1
6
n

i=1
d
2
i
n(n
2
1)
,
donde d
i
= Rango de x
i
Rango de y
i
, y n es el n umero total de obser-
vaciones.
Ejemplo 1.7.6 Retomemos los datos de Espirometra, y determinemos sus
respectivos rangos:
Edad (Z) Altura (X) Z X d
i
d
2
i
25 160 1.5 2 0.5 0.25
25 159 1.5 1 -0.5 0.25
26 174 4 7.5 3.5 12.25
26 171 4 6 2.0 4.00
26 164 4 3 -1.0 1.00
27 168 6.5 4 -2.5 6.25
27 170 6.5 5 -1.5 2.25
28 174 7 7.5 0.5 0.25
Total 26.50
r
S
= 1
6 26,50
8(8
2
1)
,
= 1
159
504
,
1 0,316 ,
0,684 .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 53


De la misma forma que el coeciente de correlacion de Pearson (r
XZ
= 0,75),
este nos indica que existe asociacion positiva entre las variables.
1.7.5. Correlacion de Punto Biserial (r
pb
).
Permite establecer la relacion entre una variable dicotomica (Nominal) y
una variable cuantitativa.
Su forma es la siguiente:
r
pb
=
( x
A
x
B
)

t
_
n
A
n
B
n(n 1)
,
donde x
A
y x
B
corresponden a las medias de cada grupo,
t
es la desviacion
estandar de todos los datos, n
A
y n
B
son los respectivos tama nos de los
grupos, y n es el total de observaciones.
Se utiliza para saber si las personas adecuada son las que obtienen las
respuestas correctas.
Ejemplo 1.7.7 Consideremos los datos de disminucion de grasa, en por-
centaje, seg un si realizaron dieta o no.
Respuesta
SI 17 18 23 16 21 14 22 15
NO 11 10 17 23 13 20 18
En este caso debemos determinar las respectivas medias de cada grupo y
la desviacion estandar total.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 54


Los valores son: x
S
= 18,3, x
N
= 16,0 y
t
= 4,13.
r
pb
=
(18,3 16,0)
4,13

8 7
15(15 1)
,
=
2,3
4,13
_
56
210
,
0,557
_
0,2667 ,
0,287 .
En este caso, aunque el valor de r
pb
es mayor que cero, no es muy claro que
exista una relacion lineal entre la dieta y la disminucion de grasa.
1.7.6. Correlacion Phi ().
Permite relacionar dos variables dicotomicas del tipo nominal.
Sea la tabla bidimensional:
Variable 2
Atributo 1 Atributo 2 Total
Variable 1 Atributo 1 a b a +b
Atributo 2 c d c +d
Total a +c b +d
Entonces la forma del coeciente esta dado por:
=
a d b c

w x y z
,
donde w = a + c, x = b + d, y = a +b y z = c + d.
Ejemplo 1.7.8 Consideremos los datos de participacion en la empresa y
nivel de reconocimiento.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 55


Reconocimiento
Alto Bajo Total
Participacion Alta 16 12 28
Baja 34 88 122
Total 50 100
En este caso debemos determinar: w = 50, x = 100, y = 28, z = 122.
=
16 88 12 34

50 100 28 122
,
=
1408 408

17080000
,

1000
4132,796
,
0,2420 .
Interpretacion:
Si el coeciente resulta ser positivo, entonces los valores iguales estan
asociados entre s, reejando una relacion directa entre ambos atributos
de ambas variables.
Si el coeciente resulta ser negativo, entonces existen relaciones opues-
tas entre los atributos de las variables.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 56


1.8. Ejercicios Resueltos
1. La siguiente tabla muestra las frecuencias de un grupo de trabajadores
seg un su nivel educacional en una industria agricola.
Nivel educacional N umero de trabajadores
Educacion Basica 33
Educacion Media 45
Educacion Tecnico-Profesional 24
Educacion Universitaria 11
a) Determine el porcentaje de trabajadores que tienen solo educacion
media.
b) Determine el porcentaje de trabajadores que a lo mas tienen edu-
cacion media.
c) Determine el porcentaje de trabajadores que a lo menos tienen
educacion media.
d) Determine la mejor medida de tendencia central.
Des.
Primero completemos la tabla con las frecuencias relativas y acumu-
ladas.
Niveleducacional n
i
f
i
N
i
F
i
f
i
100 % F
i
100 %
Educacion Basica 33 0,292 33 0,292 29,2 % 29,2 %
Educacion Media 45 0,398 78 0,690 39,8 % 69,0 %
Educacion Tecnico-Profesional 24 0,212 102 0,903 21,2 % 90,3 %
Educacion Universitaria 11 0,097 113 1,000 9,7 % 100,0 %
Total 113 1,000 100,0 %
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 57


Directamente desde la tabla se obtinen los resultados pedidos.
a) El 39,8 % de los trabajadores tiene solo educacion Basica.
b) En este caso necesitamos el porcentaje de trabajadores que a
lo mas tienen educacion media, es decir, son todos aquellos que
tienen solo educacion Basica (29,2 %) mas los que solo tienen ed-
ucacion media (39,8 %) que es igual a 69,0 % es el porcentaje de
trabajadores que tiene a lo mas educacion Media.
c) En este caso necesitamos los porcentajes de aquellos trabajadores
que tienen educacion Media (39,8 %) mas los que tienen educacion
Tecnico-Profesional (21,2 %) mas los con educacion Universitaria
(9,7 %), lo que es igual a 70,7 %.
d) La tabla resume los resultados para la variable X:Nivel educa-
cional de los trabajadores, que es una variable cualitativa ordi-
nal, ya que los resultados de la variable tienen un orden natu-
ral, por lo cual podemos determinar la mediana, en este caso es
Med(X) = Educacion Media.
2. Al entrevistar a 30 personas se obtuvo las siguientes preferencias de
colores para un determinado envase de desodorante, seg un la tabla de
codigos.
Color Azul Verde Rojo Morado
Codigo 1 2 3 4
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 58


1 1 1 2 3 3 1 1 2 3
2 2 3 3 1 1 3 4 3 4
2 3 1 4 2 3 1 1 2 2
a) Construya una tabla de frecuencias.
b) Determine el porcentaje de preferencias por el color Verde.
c) Determine el porcentaje de personas que preeren el color Azul o
Verde.
d) Determine el color mas frecuente.
Des.
a) Sea X:Color preferido, de esta forma la variable es cualitativa
nominal.
Color n
i
f
i
1 (Azul) 10 0,333
2 (Verde) 8 0,267
3 (Rojo) 9 0,300
4 (Morado) 3 0,100
Total 30 1,000
b) El 26,7 % de los entrevistados preere el color Verde.
c) Sumando los porcentajes de preferencias por Azul (33,3 %) y Verde
(26,7 %), el resultado es 60,0 %.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 59


d) En este caso la Moda corresponde al valor mas frecuente, en este
caso Mod(X) = Azul.
3. En una encuesta realizada a 25 Ingenieros en USA respecto a la op-
timizacion en el uso del cobre, se consulto Cual cree usted que es la
mejor forma de utilizar el cobre?
Forma Combinado con oro Combinado con plata Puro lquido Puro solido
Codigo 1 2 3 4
y los resultados son los siguientes:
2 4 2 1 2 1 1 1 2 2
3 2 1 2 4 4 4 1 3 2
4 1 2 2 2
a) Identique y clasique la variable en estudio.
b) Construya una tabla de frecuencias.
c) Que proporcion de Ingenieros considera que debe ser utilizado
combinado con plata?
d) Que porcentaje de Ingenieros cree que se puede utilizar mejor el
cobre en forma combinada?
e) Que porcentaje de Ingenieros estima que se optimiza su uso en
cualquiera de sus estados puros?
Des.
a) Sea X:forma de uso del cobre. Cualitativa nominal.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 60


b) .
Codigo n
i
f
i
1 7 0,280
2 11 0,440
3 2 0,080
4 5 0,200
Total 25 1,000
c) La proporcion de Ingenieros que considera que debe ser utilizado
combinado con plata es 11 de 25 o 11/25 = 0,44.
d) El porcentaje de Ingenieros que considera que se debe utilizar
combinado es la suma de los que consideran que debe ser utilizado
combinado con oro (28,0 %) con los que consideran que debe ser
utilizado combinado con plata (44,0 %) que es igual a un 72,0 %.
e) Al igual que en el caso anterior debemos sumar los porcentajes de
los que consideran que se optimiza su uso puro lquido (8,0 %) con
el porcentaje de puro solido (20,0 %) que es igual a un 28,0 %.
4. La siguiente informacion corresponde a las notas obtenidas por un
grupo de alumnos de cierto curso.
Nota N umero de alumnos
1-3 15
3-5 38
5-7 12
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 61


a) Determine y clasique la variable de interes.
b) Cual es la nota mas frecuente obtenida por los alumnos?
c) Cual es la nota media obtenida por estos alumnos?
d) Cuantos alumnos tienen una nota inferior a la nota mediana?
Determine el valor del valor mediano para la nota.
Des.
a) Sea X:Nota obtenida por un alumno. Cuantitativa Continua
9
. Con-
struimos la tabla de frecuencias:
marca de clase X n
i
f
i
N
i
x
i
2 1 3 15 0,230 15
4 3 5 38 0,585 53
6 3 7 12 0,185 65
Total 65 1,000
9
Una variable continua siempre es cuantitativa, por lo cual es equivalente decir que una
variable es cuantitativa continua con solo decir que es una variable continua
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 62


b) Necesitamos determinar la moda de la nota.
Mo(X) = LI
i
+
_
n
i
n
i1
(n
i
n
i1
) + (n
i
n
i+1
)
_
a
i
,
= 3 +
_
38 15
(38 15) + (38 12)
_
2 ,
= 3 +
_
23
(23) + (28)
_
2 ,
= 3 +
_
23
51
_
2 ,
= 3 +
46
51
,
= 3 + 0,90 ,
= 3,90 .
c) Como los datos estan tabulados necesitamos utilizar la marca de
clase (x
i
) para este calculo.

X
=
1
65
(2 15 + 4 38 + 6 12) ,
=
254
65
,
= 3,91 .
d) Directamente de la denicion de mediana se puede concluir que
bajo este valor esta el 50 % de las observaciones, es decir, 65
(50 %/100 %) = 32,5 33 alumnos. Para determinar el valor de
la mediana, realizamos el calculo previo de 65/2 = 32,5, que esta
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 63


contenido en el segundo intervalo.
Me(X) = 3 +
_
65 50
100
15
_
2
38
,
= 3 + (32,5 15)
2
38
,
= 3 + 17,5
2
38
,
= 3 +
35
38
,
= 3 + 0,921 ,
= 3,921 .
5. La siguiente tabla muestra la oferta de precios para departamentos en
el centro de la ciudad.
UF Cantidad de departamentos
920-990 140
990-1050 350
1050-1200 300
1200-1400 160
a) Cual es el precio medio de los departamentos?
b) Cuantos departamentos tienen un precio inferior a 1150 UF?
c) Determine el valor modal de los departamentos.
d) Cual es la variacion de los precios de los departamentos?
Des.
Sea X: precio de los departamentos en $UF.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 64


x
i
X n
i
f
i
N
i
955 920 990 140 0,147 140
1050 990 1050 350 0,368 490
1125 1050 1200 300 0,316 790
1300 1200 1400 160 0,168 950
Total 950 1,000
a)

X
=
1
950
(955 140 + 1020 350 + 1125 300 + 1300 160) ,
=
1036200
950
,
= 1090,74 UF .
b)
1150 = 1050 +
_
950
100
490
_
150
300
,
(1150 1050) =
_
950
100
490
_
150
300
,
100
300
150
=
alpha 950
100
490 ,
200 + 490 =
950
100
,
690
100
950
= ,
= 72,63 % .
Luego el 72,63 % de los departamentos tiene un precio inferior a
1150, entonces 950 (72,63 %/100 %) = 690 departamentos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 65


c)
Mo(X) = 990 +
_
350 140
(350 140) + (350 300)
_
60 ,
= 990 +
_
210
210 + 50
_
60 ,
= 990 +
210
260
60 ,
= 990 +
12600
260
,
= 990 + 48,46 ,
= 1038,46 UF .
d)

2
X
=
1
950
_
(140 955
2
+ 350 1020
2
+ 300 1125
2
+ 160 1300
2
) 950 1090,74
2
_
,
=
1
950
(1141911000 1130228060) ,
=
11682940
950
,
= 12297,83 (UF)
2
,

X
= 110,90 UF .
6. La siguiente tabla muestra el gasto anual en electricidad (en millones
de pesos) de 200 personas.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 66


Gasto anual N umero de personas
0.8-1.0 20
1.0-1.6 70
1.6-2.0
2.0-2.6 65
Total
a) Determine el gasto medio y su variacion.
b) Cuantas personas gastan mas de $1800000, en electricidad al a no?
c) Determine el valor modal de gasto.
Des.
Sea X:gasto anual en electricidad, en millones de pesos. Primero com-
pletamos la tabla. Por enunciado el total de personas es 200, luego
sabemos que la suma de la columna de frecuencias observadas debe ser
200, por lo cual restamos al total las frecuencias que aparecen en la
tabla y obtenemos el valor faltante.
x
i
X n
i
f
i
N
i
n
i
x
i
0,9 0,8 1,0 20 0,100 20 18
1,3 1,0 1,6 70 0,350 90 91
1,8 1,6 2,0 45 0,225 135 81
2,3 2,0 2,6 65 0,325 200 149,5
Total 200 1,000 339,5
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 67


a)

X
=
339,5
200
= 1,70 millones de pesos.
b)
1,8 = 1,6 +
_
200
100
90
_
0,4
45
,
1,8 1,6 =
_
200
100
90
_
0,4
45
,
0,2
45
0,4
=
200
100
90 ,
22,5 + 90 =
200
100
,
= 112,5
100
200
,
= 56,25 % .
Luego el 56,25 % de las personas tiene un gasto inferior a 1.8 mil-
lones, entonces 100 %56,25 % = 43,75 % tiene un gasto superior
a 1.8 millones, as 200 (43,75 %/100 %) = 87,5 88 personas.
c)
Mo(X) = 1,0 +
_
70 20
(70 20) + (70 45)
_
0,6 ,
= 1,0 +
50
50 + 25
0,6 ,
= 1,0 +
50
75
0,6 ,
= 1,0 + 0,4 ,
= 1,4 millones de pesos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 68


7. En un estudio a 250 personas sobre su sueldo anual, se recopilo la
siguiente informacion, en millones de pesos:
Sueldo anual N umero de personas
1.5-2.5 27
2.5-3.5 19
3.5-4.5 15
4.5-5.5
Total
a) Determine el ingreso medio para estas personas.
b) Determine su variaci on.
c) Cuantas personas ganan menos de $3200000 anualmente?
d) Determine si el valor modal es superior al valor mediano.
Des.
Sea X: sueldo anual, en millones de pesos. Completamos la tabla de
frecuencias.
x
i
X n
i
f
i
N
i
n
i
x
i
n
i
x
2
i
2,0 1,5 2,5 27 0,108 27 54 108
3,0 2,5 3,5 19 0,076 46 57 171
4,0 3,5 4,5 25 0,100 71 100 400
5,0 4,5 5,5 179 0,716 250 895 4475
Total 250 1,000 1106 5154
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 69


a)

X
=
1106
250
= 4,42 millones de pesos.
b)

2
X
=
1
250
_
5154 250 4,42
2
_
,
=
269,9
250
,
= 1,08 (millones de pesos)
2
,

X
= 1,34 millones de pesos.
c)
3,2 = 2,5 +
_
250
100
27
_
1,0
19
,
=
_
(3,2 2,5)
19
1,0
+ 27
_
100
250
,
= (13,3 + 27)
100
250
,
= 16,12 % .
d) Para el valor modal, primero identicamos el intervalo con la may-
or frecuencia observada.
Mo(X) = 4,5 +
_
179 25
(179 25) + (179 0)
_
1,0 ,
= 4,5 +
154
154 + 179
1,0 ,
= 4,5 +
154
333
,
= 4,5 + 0,46 ,
= 4,96 millones de pesos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 70


Para el valor mediano, primero determinamos el valor 250/2 =
125, para encontrar el intervalo de la mediana.
Me(X) = 4,5 +
_
250 50
100
71
_
1,0
179
,
= 4,5 + (125 71)
1,0
179
,
= 4,5 + 0,30 ,
= 4,80 millones de pesos.
Efectivamente el valor modal es superior al valor mediano.
8. La siguiente tabla muestra el gasto mensual en locomocion de un grupo
de 30 familias expresado en miles de pesos.
Gasto mensual N umero de
(miles de pesos) familias
5-12 7
12-18 9
18-25
25-33 7
a) Cual es el gasto mensual medio en locomocion de estas familias?
b) Cuantas familias gastan mensualmente mas de $19000 en loco-
mocion?
c) Cual es el gasto mas frecuente en locomocion?
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 71


d) Cual es la variabilidad respecto a la media del gasto en locomo-
cion?
e) Cual es el monto de gasto mensual que deja por bajo este valor
al 75 % de los montos?
Des.
Sea X: gasto mensual en locomocion.
x
i
X n
i
f
i
N
i
n
i
x
i
n
i
x
2
i
8,5 5 12 7 0,233 7 59,5 505,75
15 12 18 9 0,300 16 135 2025
21,5 18 25 7 0,233 23 150,5 3235,75
29 25 33 7 0,233 30 203 5887
Total 30 1,000 548 11653,5
a)

X
=
548
30
= 18,27 millones de pesos.
b)
19 = 18 +
_
30
100
16
_
7
7
,
= ((19 18)1 + 16)
100
30
,
= 56,67 % .
Entonces el 56,67 % de las familias tienen un gasto inferior a
$19000 mensuales en locomocion, as el (100 %56,67 %) = 43,33 %
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 72


tienen un gasto superior, es decir, 30 (43,33 %/100 %) = 13 fa-
milias.
c)
Mo(X) = 12 +
_
9 7
(9 7) + (9 7)
_
6 ,
= 12 +
2
2 + 2
6 ,
= 12 + 3 ,
= 15 miles de pesos.
d)

2
X
=
1
30
(11653,5 30 18,27
2
) =
1639,71
30
= 54,66 (miles de pesos)
2
e)
P
75
= 18 +
_
30 75
100
16
_
7
7
,
= 18 + (22,5 16) ,
= 24,5 miles de pesos.
9. En una encuesta realizada a 200 personas sobre su edad se registraron
los siguientes resultados.
Edad N umero de personas
18-21 16
21-27 42
27-30
30-35 25
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 73


a) Determine la edad media de los entrevistados.
b) Determine si la edad mediana es superior a la edad mas frecuentes.
c) Determine la variabilidad respecto a la media de las edades para
estos entrevistados.
d) Cuantas personas de las entrevistadas tienen entre 25 y 31 a nos?
Des.
Sea X: edad, en a nos.
x
i
X n
i
f
i
N
i
n
i
x
i
n
i
x
2
i
19,5 18 21 16 0,080 16 312 6084
24 21 27 42 0,210 58 1008 24192
28,5 27 30 117 0,585 175 3334,5 95033,25
32,5 30 35 25 0,125 200 812,5 26406,25
Total 200 1,000 5467 151715,5
a)

X
=
5467
200
= 27,34 a nos.
b)
Me(X) = 27 +
_
200 50
100
58
_
3
117
,
= 27 + (100 58)
3
117
,
= 27 + 1,08 ,
= 28,08 a nos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 74


Mo(X) = 27 +
_
117 42
(117 42) + (117 25)
_
3 ,
= 27 +
75
75 + 92
3 ,
= 27 + 1,35 ,
= 28,35 a nos.
Entonces, se puede observar que la edad mediana no es mayor a
la edad mas frecuente.
c)

2
X
=
1
200
(151715,5 200 27,34
2
) =
2220,38
200
= 11,10 (a nos)
2
,

X
= 3,33 a nos.
d) Primero determinaremos el porcentaje de personas que se encuen-
tra en el intervalo, para ello determinaremos el porcentaje de per-
sonas que estan por bajo los 31 a nos y luego lo restaremos con
el porcentaje que deja por bajo los 25 a nos, para posteriormente
determinar la cantidad de personas.
31 = 30 +
_
200
100
175
_
5
25
,
=
_
(31 30)
25
5
+ 175
_
100
200
,
= 180
100
200
,
= 90 % .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 75


25 = 21 +
_
200
100
16
_
6
42
,
=
_
(25 21)
42
6
+ 16
_
100
200
,
= (28 + 18)
100
200
,
= 22 % .
Entonces, el porcentaje de personas que tiene entre 25 y 31 a nos
es 90 % 22 % = 68 %, as la cantidad de personas es 200
(68 %/100 %) = 136 personas.
10. La siguiente tabla resume a un grupo de profesionales jovenes respecto
a la cantidad de dinero que gastan en diversi on mensualmente, en miles
de pesos.
Gasto mensual n umero de jovenes
5-15 91
15-28 105
28-32 70
32-50 56
a) Cuale es el gasto promedio de dinero en diversi on?
b) Cuantos jovenes gastas mas de $30000 mensuales en diversi on?
c) Cual es el maximo que gasta el 75 % de los entrevistados que
menos gasta?
d) Determine el coeciente de variacion para estos jovenes?
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 76


Des.
Sea X: cantidad de dinero que gastan en diversion, en miles de pesos.
x
i
X n
i
f
i
N
i
n
i
x
i
n
i
x
2
i
10 5 15 91 0,283 91 910 9100
21,5 15 28 105 0,326 196 2257,5 48536,25
30 28 32 70 0,217 266 2100 63000
41 32 50 56 0,174 322 2296 94136
Total 322 1,000 7563,5 214772,25
a)

X
=
7563,5
322
= 23,49 miles de pesos.
b)
30 = 28 +
_
322
100
196
_
4
70
,
=
_
(30 28)
70
4
+ 196
_
100
322
,
= (35 + 196)
100
322
,
= 71,74 % .
Entonces, el 71,74 % de los entrevistados gasta menos de $30000 al
mes en diversion, as el 28,26 % gasta mas de $30000 en diversi on,
y estos son 322 (28,26 %/100 %) = 91 jovenes.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 77


c)
P
75
= 28 +
_
75 322
100
196
_
4
70
,
= 28 + (241,5 196)
4
70
,
= 28 + 2,6 ,
= 30,6 miles de pesos.
d)

2
X
=
1
322
(214772,25 322 23,49
2
) ,
=
37099,06
322
,
= 115,21 (miles de pesos)
2
,

X
= 10,73 miles de pesos.
C.V.(X) =
10,73
23,49
100 % = 45,7 % .
11. Las utilidades en millones de pesos que tienen dos empresas, estan
relacionadas con el n umero de proyectos que realizan anualmente, la
siguiente tabla muestra las utilidades de los ultimos a nos de ambas
empresas.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 78


Utlidades N umero de Proyectos
millones de $ Empresa 1 Empresa 2
4.5-6.0 40 35
6.0-7.8 81 16
7.8-9.0 82 20
9.0-10.2 38 45
a) En que empresa la utilidad presenta una mayor variabilidad re-
specto a la media?
b) Cual es la cantidad de proyectos que presentan una utlidad menor
a $8000000 anual?
c) Cual es el monto maximo de utilidad que presentan la mayoria
de los proyectos de la empresa 2?
d) Si la empresa 1 aumentara en un 7 % sus utilidades, y la empresa
2 disminuye en un 6 %, pero lo intenta compensar aumentando en
3 proyectos adicionales, Cuales seran los nuevos coecientes de
variaci on para las empresas?
Des.
Sea E
i
: utilidades de la empresa i = 1, 2.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 79


e
1i
E
1
n
1i
f
1i
N
1i
n
1i
e
1i
n
1i
e
2
1i
n
2i
f
2i
N
2i
n
2i
e
2i
n
2i
e
2
2i
5,25 4,5 6,0 40 0,166 40 210 1102,5 35 0,302 35 183,75 964,69
6,90 6,0 7,8 81 0,336 121 558,9 3856,41 16 0,138 51 110,4 761,76
8,40 7,8 9,0 82 0,340 203 688,8 5785,92 20 0,172 71 168 1411,2
9,60 9,0 10,2 38 0,158 241 364,8 3502,08 45 0,388 116 432 4147,2
Total 241 1,000 1822,5 14246,91 116 1,000 794,15 7284,85
a)

E
1
=
1822,5
241
,
= 7,56 millones de pesos.

E
2
=
794,15
116
,
= 6,85 millones de pesos.

2
E
1
=
1
241
_
14246,91 241 7,56
2
_
,
=
472,89
241
,
= 1,96 (millones de pesos)
2
: .

2
E
2
=
1
116
_
7284,85 116 6,85
2
_
,
=
1841,84
116
,
= 15,88 (millones de pesos)
2
.
La empresa 2 presenta una mayor variabilidad en sus utilidades.
b) Sea E: utilidad de las empresas, en millones de pesos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 80


e
i
E n
i
f
i
N
i
5,25 4,5 6,0 75 0,210 75
6,90 6,0 7,8 97 0,272 172
8,40 7,8 9,0 102 0,286 274
9,60 9,0 10,2 83 0,232 357
Total 357 1,000
8,0 = 7,8 +
_
357
100
172
_
1,2
102
,
=
_
(8,0 7,8)
102
1,2
+ 172
_
100
357
,
= (17 + 172)
100
357
,
= 52,94 % .
Entonces el 52,94 % de los proyectos tienen una utilidad menor
a 8.0 millones de pesos, es decir, 357 (52,94 %/100 %) = 189
proyectos.
c)
Me(E
2
) = 7,8 +
_
116 50
100
51
_
1,2
20
,
= 7,8 + (58 51)
1,2
20
,
= 7,8 + 0,42 ,
= 8,22 millones de pesos.
d) Determinemos los respectivos coecientes de variaci on (CV )para
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 81


cada empresa.
C.V.(E
1
) =

1,96
7,56
100 % = 18,5 %, C.V.(E
2
) =

15,88
6,82
100 % = 58,2 %.
Por propiedades de la varianza y la media se tiene que luego de
los ajustes los nuevos coecientes de variaci on para las empresas
son:
C.V.(E
1
) =
(1 + 0,07)

1,96
(1 + 0,07) 7,56
100 % =
1,07

1,96
1,07 7,56
100 % =

1,96
7,56
100 % = 18,5 %,
C.V.(E
2
) =
(1 0,06)

15,88
(1 0,06) 6,82 + 3
100 % =
0,94

15,88
0,94 6,82 + 3
100 % =
3,74
9,41
100 % = 39,7 %.
12. La siguiente tabla muestra la distribucion del nivel de ingresos, en mil-
lones de pesos, de un grupo de Profesionales seg un su sexo.
Sueldo mensual Sexo
(millones de pesos) Hombres Mujeres
0.4-0.6 2 3
0.6-0.8 8 2
0.8-1.2 9 4
1.2-1.5 10 6
1.5-1.8 5 3
1.8-2.0 2 1
a) Cuales son los ingresos medios de hombres y mujeres?
b) Que cantidad de mujeres tiene un ingreso entre $650000 y $1250000?
c) Comparativamente, Quienes tiene sueldos mas homogeneos?
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 82


d) El sueldo mas frecuente de los hombres es mayor al mas frecuente
de las mujeres?
e) Si el sueldo de los hombres aumentara en un 3 %, y el de las mu-
jeres fuera reajustado en un 5 % mas un bono mensual de $10000.
Quienes tendran un sueldo medio superior?
Des.
Sean X: sueldo mensual, en miles de pesos, H: Hombres y M: Mujeres.
Hombres
x
i
X n
i
f
i
N
i
n
i
x
i
n
i
x
2
i
0,5 0,4 0,6 2 0,056 2 1,0 0,5
0,7 0,6 0,8 8 0,222 10 5,6 3,92
1,0 0,8 1,2 9 0,250 19 9 9
1,35 1,2 1,5 10 0,278 29 13,5 18,23
1,65 1,5 1,8 5 0,139 34 8,25 13,61
1,9 1,8 2,0 2 0,056 36 3,8 7,22
Total 36 1,000 41,15 52,48
Mujeres
x
i
X n
i
f
i
N
i
n
i
x
i
n
i
x
2
i
0,5 0,4 0,6 3 0,158 3 1,5 0,75
0,7 0,6 0,8 2 0,105 5 1,4 0,98
1,0 0,8 1,2 4 0,211 9 4 4
1,35 1,2 1,5 6 0,316 15 8,1 10,94
1,65 1,5 1,8 3 0,158 18 4,95 8,17
1,9 1,8 2,0 1 0,053 19 1,9 3,61
Total 19 1,000 21,75 28,45
a)

H
=
41,15
36
= 1,143 millones de pesos.

M
=
21,75
19
= 1,145 millones de pesos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 83


b)
1,25 = 1,2 +
_
19
100
9
_
0,3
6
,
=
_
(1,25 1,2)
6
0,3
+ 9
_
100
19
,
= (1 + 9)
100
19
,
= 52,63 % .
0,65 = 0,6 +
_
19
100
3
_
0,2
2
,
=
_
(0,65 0,6)
2
0,2
+ 3
_
100
19
,
= (0,5 + 3)
100
19
,
= 18,42 % .
Entonces, El porcentaje de mujeres que esta en el intervalo es
52,63 %18,42 % = 34,21 %, es decir, hay 19(34,21 %/100 %) =
6,5 7 mujeres.
c)

2
H
=
1
36
(52,48 36 1,143
2
) =
5,448
36
= 0,151 (millones de pesos)
2
,

H
= 0,389 millones de pesos.

2
M
=
1
19
(28,45 19 1,145
2
) =
3,541
19
= 0,186 (millones de pesos)
2
,

H
= 0,431 millones de pesos.
C.V.(H) =
0,389
1,143
100 % = 34,0 % , C.V.(M) =
0,431
1,145
100 % = 37,6 .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 84


d)
Mo(X)
H
= 1,2 +
_
10 9
(10 9) + (10 5)
_
0,3 ,
= 1,2 +
1
1 + 5
0,3 ,
= 1,2 + 0,05 ,
= 1,25 millones de pesos.
Mo(X)
M
= 1,2 +
_
6 4
(6 4) + (6 3)
_
0,3 ,
= 1,2 +
2
2 + 3
0,3 ,
= 1,2 + 0,2 ,
= 1,4 millones de pesos.
Entonces, como se puede observar el sueldo mas frecuente de los
varones no es superior al sueldo mas frecuente de las damas.
e)

H
= (1 + 0,03)1,143 = 1,03 1,143 = 1,177 millones de pesos. ,

M
= (1 + 0,05)1,145 + 0,01 = 1,05 1,145 + 0,01 = 1,212 millones de pesos.
13. Las demanda mensual de cajas (X) de cierto producto en los superme-
rcados de dos comunas se resume en la siguiente tabla.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 85


Cantidad (X) Comuna A Comuna B
30-70 12 5
70-100 21 8
100-130 36 19
130-150 29 10
a) Determine las demandas mas frecuentes para ambas comunas.
b) Es mayor la demanda promedio de la Comuna A comparado con
la Comuna B de este producto?
c) Determine la cantidad de demanda mnima de 25 % de las mayores
demandas.
d) Que comuna tiene una demanda mas homogenea?
e) Si para el proximo mes se determina que la comuna B tendra un
crecimiento en su poblacion, que involucrar a un aumento en la
demanda de este producto en un 15 %, en cambio la comuna A
disminuir a su consumo en un 5 % menos 7 cajas. Cuales seran
las nuevas demandas medias?
Des.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 86


x
i
X A B Total N
i
50 30 70 12 5 17 17
85 70 100 21 8 29 46
115 100 130 36 19 55 101
140 130 150 29 10 39 140
Total 98 42 140
a)
Mo(X|A) = 100 +
_
36 21
(36 21) + (36 29)
_
30 ,
= 100 +
15
15 + 7
30 ,
= 100 + 20,45 ,
= 120,45 cajas mensuales.
Mo(X|B) = 100 +
_
19 8
(19 8) + (19 10)
_
30 ,
= 100 +
11
11 + 9
30 ,
= 100 + 16,50 ,
= 116,50 cajas mensuales.
b)

X|A
=
50 12 + 85 21 + 115 36 + 140 29
98
=
10585
98
= 108,01 cajas mensuales.

X|B
=
50 5 + 85 8 + 115 19 + 140 10
42
=
4515
42
= 107,50 cajas mensuales.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 87


Efectivamente, la Comuna A tiene una mayor demanda media de
cajas mensuales de este producto en comparacion a la Comuna B.
c)
P
75
= 130 +
_
140 75
100
101
_
20
39
,
= 130 + (105 101)
20
39
,
= 130 + 2,05 ,
= 132,05 cajas mensuales.
La maxima demanda de cajas del 75 % de las demandas inferiores
es 132,05 132, entonces este valor tambien corresponde a la
demanda mnima del 25 % de las mayores demandas.
d)

2
X|A
=
1
98
_
(50
2
12 + 85
2
21 + 115
2
36 + 140
2
29) 98 108,01
2
_
,
=
1
98
(1226225 1143283,69) ,
=
82941,31
98
,
= 846,34 (cajas mensuales)
2
,

X|A
= 29,09 cajas mensuales.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 88

2
X|B
=
1
42
_
(50
2
5 + 85
2
8 + 115
2
19 + 140
2
10) 42 107,50
2
_
,
=
1
42
(517575 485362,50) ,
=
32212,50
42
,
= 766,96 (cajas mensuales)
2
,

X|B
= 27,69 cajas mensuales.
C.V.(X|A) =
29,09
108,01
100 % = 26,9 % C.V.(X|B) =
27,69
107,50
100 % = 25,8 % .
La Comuna B tiene una demanda mas homogenea en comparacion
a la Comuna A.
e)

X|A
= (1 0,05) 108,01 7 = 95,61 cajas mensuales.

X|B
= (1 + 0,15) 107,50 = 123,63 cajas mensuales.
14. En una encuesta realizada a 800 familias, se les consulta sobre dos
puntos: si estan inscritos en los registros electorales y sobre el nivel de
ingresos, de donde se obtiene la siguiente tabla.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 89


Nivel de Inscripcion
Ingresos en registros Total
(miles de pesos) SI NO
100-400 120 320
400-700 150 240
700-1000 210
Total
a) Es superior el ingreso medio de las familias inscritas en los reg-
istros electorales que las no inscritas?
b) Cuantas familias no inscritas en los registros electorales tienen
un ingreso superior a 500 mil?
c) Son mas homogeneas los ingresos de las familias inscritas en los
registros electores que las no inscritas?
Des.
Y
x
i
X SI NO Total
250 100 400 120 200 320
550 400 700 90 150 240
850 700 1000 210 30 240
Total 420 380 800
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 90


a)

X|Y =SI
=
250 120 + 550 90 + 850 210
420
=
258000
420
= 614,29 miles de pesos.

X|Y =NO
=
250 200 + 550 150 + 850 30
380
=
158000
380
= 415,79 miles de pesos.
El ingreso medio de las familias que estan inscritas en los registros
electorales es mayor que las familas no inscritas.
b)
500 = 400 +
_
380
100
200
_
300
150
=
_
(500 400)
150
300
+ 200
_
100
380
= 250
100
380
= 65,79
El 65,79 % de las familias no inscritas en los registros electorales
tiene un ingreso menor a $500000, entonces, el 34,21 % tiene un
ingreso superior, es decir, 380 (34,21 %/100 %) = 130 familias.
c)

2
X|Y =SI
=
1
420
_
(250
2
120 + 550
2
90 + 850
2
210) 420 614,29
2
_
,
=
1
420
(186450000 158487925,7) ,
=
27962074,28
420
,
= 66576,37 (miles de pesos)
2
,

X|Y =SI
= 258,02 miles de pesos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 91

2
X|Y =NO
=
1
380
_
(250
2
200 + 550
2
150 + 850
2
30) 380 415,79
2
_
,
=
1
380
(79550000 65694903,16) ,
=
13855096,84
380
,
= 36460,78 (miles de pesos)
2
,

X|Y =NO
= 190,95 miles de pesos.
C.V.(X|Y = SI) =
258,02
614,29
100 % = 42,0 % C.V.(X|Y = NO) =
190,95
415,79
100 % = 45,9 % .
Las familias inscritas en los registros electorales tienen sueldos
mas homogeneos que las familias no inscritas en los registros elec-
torales.
15. El siguiente cuadro muestra el n umero de horas semanales dedicadas
al estudio de un grupo de alumnos y la nota nal que obtuvieron al
termino del curso.
Horas de estudio Nota nal
1-3 3-5 5-7
0-2 3 1 4
2-4 5 5 6
4-6 6 4 9
6-8 1 4 7
a) Determine el numero medio de horas de estudio y de nota nal.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 92


b) Cual es la cantidad de horas de estudios mas frecuente de este
grupo de estudiantes?
c) Cuantos de estos estudiantes aprobaron el curso?
d) Determine la nota mnima que obtuvo el 50 % de los mejores alum-
nos.
e) Cuantas horas en promedio estudiaron aquellos alumnos que ob-
tuvieron una nota superior a 5.0?
f ) Que nota obtuvieron los alumnos que estudiaron menos de 4
horas?
g) Determine si los alumnos son mas parecidos respecto a las horas
que estudian en comparacion a la nota nal que obtuvieron.
h) Determine el tipo y fuerza de asociacion entre las variables.
Des.
Y
y
i
2 4 6
x
i
X 1 3 3 5 5 7 Total
1 0 2 3 1 4 8
3 2 4 5 5 6 16
5 4 6 6 4 9 19
7 6 8 1 4 7 12
Total 15 14 26 55
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 93


a)

X
=
1 8 + 3 16 + 5 19 + 4 12
55
,
=
235
55
,
= 4,27 horas.

Y
=
2 15 + 4 14 + 6 26
55
,
=
242
55
,
= 4,40 .
b)
Mo(X) = 4 +
_
19 16
(19 16) + (19 12)
_
2 ,
= 4 +
3
3 + 7
2 ,
= 4 + 0,6 ,
= 4,6 horas.
c)
4 = 3 +
_
55
100
15
_
2
14
,
=
_
(4 3)
14
2
+ 15
_
100
55
,
= 22
100
55
,
= 40 % .
Como el 40 % de las observaciones tiene una nota nal inferior
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 94


a 4.0, entonces el 60 % tiene una nota superior a 4.0, es decir,
55 (60 %/100 %) = 33 alumnos aprobaron el curso.
d)
P
50
= 3 +
_
50 55
100
15
_
2
14
,
= 3 + (27,5 15)
2
14
,
= 3 + 1,79 ,
= 4,79 .
e) .
x
i
X|Y > 5
1 0 2 4
3 2 4 6
5 4 6 9
7 6 8 7
Total 26

X|Y >5
=
14+36+59+77
26
=
116
26
= 4,46 horas.
f ) .
x
i
Y |X < 4
2 1 3 3 + 5 = 8
4 3 5 1 + 5 = 6
6 5 7 4 + 6 = 10
Total 24

Y |X<4
=
28+46+610
24
=
100
24
= 4,17
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 95


g)

2
X
=
1
55
_
(1
2
8 + 3
2
16 + 5
2
19 + 7
2
12) 55 4,27
2
_
,
=
1
55
(1215 1002,81) ,
= 3,86 (horas)
2
,

X
= 1,96 horas.

2
Y
=
1
55
_
(2
2
15 + 4
2
14 + 6
2
26) 55 4,40
2
_
,
=
1
55
(1220 1064,80) ,
= 2,82 ,

Y
= 1,68 .
C.V.(X) =
1,96 horas
4,27 horas
100 % = 45,9 % C.V.(Y ) =
1,68
4,40
100 % = 38,2 % .
Como el C.V.(X) > C.V.(Y ) los alumnos son mas homogeneos en
la nota que obtuvieron que en las horas de estudio.
h)

XY
=
1
55
((1 3 2 + 1 1 4 + 1 4 6 + 3 5 2 + 3 5 4 + 3 6 6 ,
+5 6 2 + 5 4 4 + 5 9 6 + 7 1 2 + 7 4 4 + 7 7 6) ,
55 4,27 4,40) ,
=
1
55
(1062 55 4,27 4,40) ,
=
28,66
55
,
= 0,52 ,
r
XY
=
0,52
1,96 1,68
= 0,158 .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 96


Las variables tienen una baja asociacion lineal directa.
16. El Subgerente de refrigeracion y aire acondicionado de una empresa,
debe decidir entre instalar calefactores a parana o a gas, en las nuevas
dependencias de bodega. Con el proposito de tomar una decision in-
teligente, solicito la siguiente informacion.
Antecedentes Parana (P) Gas (G)
N umero de calefactores 4 2 5 6 3 3 2 3 4 1
Precio de calefactores (US$) 90 85 91 100 95 93 112 86 95 98
Importados (I) 3 1 3 4 2 3 1 1 2 0
Nacionales (N) 1 1 2 2 1 0 1 2 2 1
a) Es el precio medio de los calefactores a Parana superior al de
los a Gas?
b) Determine de los calefactores nacionales, si el precio mediano de
los a Parana es superior a los de Gas.
c) Es el precio medio de los calefactores a Parana nacioanales
menor al de los importados?
d) Cuales calefactores tienen precios mas homogeneos, los nacionales
a Gas o los nacionales a Parana?
e) Cual es precio mas com un de los calefactores nacionales a Gas?
Des.
a)

P
=
4 90 + 2 85 + 5 91 + 6 100 + 3 95
20
=
1870
20
= 93,5 US$ ,

G
=
3 93 + 2 112 + 3 86 + 4 95 + 1 98
13
=
1239
13
= 95,31 US$ .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 97


En este caso el precio medio de los calefactores a Gas es superior
al precio medio de los calefactores a Parana.
b) .
P|N
85 1 1
90 1 2
91 2 4
95 1 5
100 2 7
G|N
86 2 2
93 0 2
95 2 4
98 1 5
112 1 6
Me(P|N) = 91 US$ Med(G|N) = 95 US$ .
En este caso el pecio mediano de los calefactores nacionales a
Gas es superior al precio mediano de los calefactores nacionales a
Parana.
c) .
N|P I|P
85 1 1
90 1 3
91 2 3
95 1 2
100 2 4
Total 7 13

N|P
=
851+901+912+951+1002
7
,
=
652
7
,
= 93,14 US$ ,

I|P
=
851+903+913+952+1004
13
,
=
1218
13
,
= 93,69 US$ .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 98


Efectivamente el precio medio de los calefactores a Parana Na-
cionales es menor al precio medio de los calefactores a Parana
Importados.
d) Utilizando las resultados de b) y c), se tienen:

P|N
= 93,14 US$ ,

G|N
=
86 2 + 93 0 + 95 2 + 98 1 + 112 1
6
=
572
6
= 95,33 US$ .

2
P|N
=
1
7
_
(85
2
1 + 90
2
1 + 91
2
2 + 95
2
1 + 100
2
2) 7 93,14
2
_
,
=
1
7
(60912 60725,42) ,
= 26,65 (US$)
2
,

P|N
= 5,76 US$ .

2
G|N
=
1
6
_
(86
2
2 + 93
2
0 + 95
2
2 + 98
2
1 + 112
2
1) 6 95,33
2
_
,
=
1
6
(54990 54526,85) ,
= 77,19 (US$)
2
,

G|N
= 8,79 US$ .
C.V.(P|N) =
5,76 US$
93,14 US$
100 % = 5,5 % , C.V.(G|N) =
8,79 US$
95,33 US$
100 % = 9,2 % .
Los calefactores Nacionales a Parana tienen precios mas homogeneos
que los calefactores Nacionales a Gas.
e)
Mo
1
(G|N) = 86 US$ , Mo
2
(G|N) = 95 US$ .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 99


17. La siguiente tabla muestra los ingresos mensuales (X), en miles de
pesos, y el nivel educacional (Y) de un grupo de empleados de una
empresa de asesoria computacional.
X Y
Media (M) Tecnico-Profesional (TP) Universitaria(U)
150-350 9 12 3
350-600 8 15 5
600-1100 2 7 5
a) Cual es el sueldo mas frecuente de estos empleados?
b) Cual es el sueldo promedio de estos empleados?
c) Cual es el sueldo medio de los empleados con eduacion Universi-
taria?
d) Cual sueldo es mas homogeneo respecto al nivel educacional?
Des.
Y
x
i
X M TP U Total
250 150 350 9 12 3 24
475 350 600 8 15 5 28
850 600 1100 2 7 5 14
Total 19 34 13 66
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 100


a)
Mo(X) = 350 +
_
28 24
(28 24) + (28 14)
_
250 ,
= 350 +
4
4 + 14
250 ,
= 350 + 55,56 ,
= 405,56 miles de pesos.
b)

X
=
250 24 + 475 28 + 850 14
66
,
=
31200
66
,
= 472,73 miles de pesos.
c)

X|Y =U
=
250 3 + 475 5 + 850 5
13
=
7375
13
= 567,31 miles de pesos.
d)

X|Y =M
=
250 9 + 475 8 + 850 2
19
=
7750
19
= 407,89 miles de pesos.

X|Y =TP
=
250 12 + 475 15 + 850 7
34
=
16075
34
= 472,79 miles de pesos.

2
X|Y =M
=
1
19
_
(250
2
9 + 475
2
8 + 850
2
2) 19 407,89
2
_
,
=
1
19
(3812500 3161110,79) ,
= 34283,64 (miles de pesos)
2
,

X|Y =M
= 185,16 miles de pesos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 101

2
X|Y =TP
=
1
34
_
(250
2
12 + 475
2
15 + 850
2
7) 34 472,79
2
_
,
=
1
34
(9191875 7600033,06) ,
= 46818,89 (miles de pesos)
2
,

X|Y =TP
= 216,38 miles de pesos.

2
X|Y =U
=
1
13
_
(250
2
3 + 475
2
5 + 850
2
5) 13 567,31
2
_
,
=
1
13
(4928125 4183928,27) ,
= 57245,90 (miles de pesos)
2
,

X|Y =M
= 239,26 miles de pesos.
C.V.(M) =
185,16
407,89
100 % = 45,4 % , C.V.(TP) =
216,38
472,79
100 % = 45,8 % , C.V.(U) =
239,26
567,31
100 % = 42,2 % .
Los empleados con educacion Universitaria tienen sueldos mas ho-
mogeneos, en comparacion a los otros trabajadores.
18. Una empresa dedicada a la venta de departamentos en la Quinta region,
resume en la siguiente tabla los valores de departamentos seg un sus
contribuciones.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 102


Precio de venta (X) Contribuciones en miles de pesos (Y)
(millones de pesos) 50-100 100-200 200-300 300-400
10-15 10 4 3 1
15-20 3 6 1 3
20-30 4 3 5 7
30-40 0 2 5 2
40-50 0 1 6 9
a) Cual es el precio y monto de contribuciones promedio de estos
departamentos?
b) Que porcentaje de departamentos tiene un precio de venta a lo
menos de 30 millones y sus contribuciones son superiores a los 200
mil?
c) Cual es el valor mas frecuente de los departamentos que pagan
contribuciones entre los 100 y 300 mil?
d) Calcule el coeciente de asociacion lineal para las variables en
estudio e interprete.
Des.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 103


Y
y
i
75 150 250 350
x
i
X 50 100 100 200 200 300 300 400 Total
12,5 10 15 10 4 3 1 18
17,5 15 20 3 6 1 3 13
25 20 30 4 3 5 7 19
35 30 40 0 2 5 2 9
45 40 50 0 1 6 9 16
Total 17 16 20 22 75
a)

X
=
12,5 18 + 17,5 13 + 25 19 + 35 9 + 45 16
75
,
=
1764,5
75
= 23,53 millones de pesos.

Y
=
75 17 + 150 16 + 250 20 + 350 22
75
,
=
16375
75
= 218,33 miles de pesos.
b)
5 + 2 + 6 + 9
75
100 % =
22
75
100 % = 29,3 % .
c) .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 104


x
i
X|100 < Y < 300
12,5 10 15 4 + 3 = 7
17,5 15 20 6 + 1 = 7
25 20 30 3 + 5 = 8
35 30 40 2 + 5 = 7
45 40 50 1 + 6 = 7
Total 26
Mo(X|100 < Y < 300) = 20 +
_
8 7
(8 7) + (8 7)
_
10 ,
= 20 +
1
1 + 1
10 ,
= 25 millones de pesos.
d)

XY
=
1
75
((12,5 10 75 + 12,5 4 150 + 12,5 3 250 + 12,5 1 350
+17,5 3 75 + 17,5 6 150 + 17,5 1 250 + 17,5 3 350
+25 4 75 + 25 3 150 + 25 5 250 + 25 7 350
+35 0 75 + 35 2 150 + 35 5 250 + 35 2 350
+45 0 75 + 45 1 150 + 45 6 250 + 45 9 350)
75 23,53 218,33) ,
=
1
75
(479062,5 75 23,53 218,33) ,
=
93764,63
75
,
= 1250,20 .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 105

2
X
=
1
75
`
(12,5
2
18 + 17,5
2
13 + 25
2
19 + 35
2
9 + 45
2
16) 17 23,53
2

,
=
1
75
(62093,75 41524,57) ,
=
20569,18
75
,
= 274,26 (millones de pesos)
2
,

X
= 16,56 millones de pesos.

2
Y
=
1
75
`
(75
2
17 + 150
2
16 + 250
2
20 + 350
2
22) 75 218,33
2

,
=
1
75
(4400625 3575099,17) ,
=
825525,83
75
,
= 11007,01 (miles de pesos)
2
,

Y
= 104,91 miles de pesos.
r
XY
=
1250,20
16,56 104,91
= 0,720 .
En este caso existe una mediana asociacin lineal directa entre las variables.
19. En un curso de 50 alumnos, 15 de ellos obtuvieron una nota nal menor
a 3.5 y solo 4 de ellos una nota superior a 6.2.
a) Determine la nota media y su variabilidad.
b) Supera la nota mediana a la mas frecuente?
c) Cuantos alumnos aprobaron el curso?
Des.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 106


x
i
X n
i
N
i
2,25 1,0 3,5 15 15
4,85 3,5 6,2 31 46
6,6 6,2 7,0 4 50
Total 50
a)

X
=
2,25 15 + 4,85 31 + 6,6 4
50
=
210,5
50
= 4,21 ,

2
X
=
1
50
_
(2,25
2
15 + 4,85
2
31 + 6,6
2
4) 50 4,21
2
_
,
=
1
50
(979,38 886,21) ,
=
93,17
50
,
= 1,86 .
b)
Me(X) = 3,5 +
_
50 50
100
15
_
2,7
31
,
= 3,5 + (25 15)
2,7
31
,
= 3,5 + 0,87 ,
= 4,37 ,
Mo(X) = 3,5 +
_
31 15
(31 15) + (31 4)
_
2,7 ,
= 3,5 +
16
16 + 27
2,7 ,
= 3,5 + 1,0 ,
= 4,5 .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 107


Como se puede observar la nota mediana es menor a la nota mas
frecuente.
c)
4,0 = 3,5 +
_
50
100
15
_
2,7
31
,
=
_
(4,0 3,5)
31
2,7
+ 15
_
100
50
,
= (5,74 + 15)
100
50
,
= 41,48 % .
El 41,48 % de los alumnos obtuvo una nota inferior a 4,0, entonces,
el 58,52 % tiene aprobaron el curso, es decir, 50(58,52 %/100 %) =
29,26 29 alumnos.
20. Los siguientes datos corresponden al sueldo mensual(X) en miles de
pesos de un grupo de trabajadores de una empresa metal urgica respecto
a las horas de trabajo semanal (Y).
X Y
30-35 35-40 40-46
250-450 6 4 5
450-650 3 2 6
650-850 1 8 9
a) Determine el sueldo y horas de trabajo promedio para este grupo
de trabajadores.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 108


b) Cual es el sueldo medio de aquellos que trabajan mas de 40 horas?
c) Cuantas horas en promedio trabajan aquellos que tienen un suel-
do entre 450 y 650 mil?
d) Determine el coeciente de correlacion lineal para las variables.
Des.
Y
y
i
32,5 37,5 43
x
i
X 30 35 35 40 40 46 Total
350 250 450 6 4 5 15
550 450 650 3 2 6 11
750 650 850 1 8 9 18
Total 10 14 20 44
a)

X
=
350 15 + 550 11 + 750 18
44
=
24800
44
,
= 563,64 miles de pesos.

Y
=
32,5 10 + 37,5 14 + 43 20
44
=
1710
44
,
= 38,86 horas.
b)

X|Y >40
=
350 5 + 550 6 + 750 9
20
,
=
11800
20
= 590 miles de pesos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 109


c)

Y |450<X<650
=
32,5 3 + 37,5 2 + 43 6
11
,
=
430,5
11
= 39,14 horas.
d)

XY
=
1
44
((350 10 32,5 + 350 4 37,5 + 350 5 43
+550 3 32,5 + 550 2 37,5 + 550 6 43
+750 1 32,5 + 750 8 37,5 + 750 9 43) ,
44 563,64 38,86) ,
=
1
44
(972400 44 563,64 38,86) ,
=
8665,78
44
,
= 196,95 .

2
X
=
1
44
_
(350
2
15 + 550
2
11 + 750
2
18) 44 563,64
2
_
,
=
1
44
(15290000 13978362,18) ,
=
1311637,82
44
,
= 29809,95 (miles de pesos)
2
,

X
= 172,66 miles de pesos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 110

2
Y
=
1
44
_
(32,5
2
10 + 37,5
2
14 + 43
2
20) 44 38,86
2
_
,
=
1
44
(67230 66444,38) ,
=
785,62
44
,
= 17,85 (horas)
2
,

Y
= 4,23 horas.
r
XY
=
196,95
172,66 4,23
= 0,270 .
21. La siguiente tabla resume el resultados de 54 postulantes a un cargo
ejecutivo de una gran empresa, seg un sus edades.
Puntajes Edad (Y)
(X) 25-28 28-32
30-45 5 12
45-50 7 10
50-65 11 9
a) Calcule el valor medio de los puntajes y de las edades.
b) Determine el valor mas frecuente de la edad dado que los postu-
lantes obtuvieron menos de 50 puntos.
c) Determine el puntaje que obtuvieron como maximo el 25 % de los
mas bajos, dado que tienen menos de 28 a nos.
d) Determine el coeciente de correlacion lineal entre las variables.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 111


Des.
Y
y
i
26,5 30
x
i
X 25 28 28 32 Total
37,5 30 45 5 12 17
47,5 45 50 7 10 17
57,5 50 65 11 9 20
Total 23 31 54
a)

X
=
37,5 17 + 47,5 17 + 57,5 20
54
=
2595
54
= 48,06 puntos.

Y
=
26,5 23 + 30 31
54
=
1539,5
54
= 28,51 a nos.
b) .
Y |X < 50
25 28 5 + 7 = 12
28 32 12 + 10 = 22
Total 34
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 112


Mo(Y |X < 50) = 28 +
_
22 12
(22 12) + (22 0)
_
4 ,
= 28 +
10
10 + 22
4 ,
= 28 + 1,25 ,
= 29,25 a nos.
c) .
X|Y < 28 N
i
30 45 5 5
45 50 7 12
50 65 11 23
Total 23
P
25
= 45 +
_
25 23
100
5
_
5
7
,
= 45 + (5,75 5)
5
7
,
= 45 + 0,54 ,
= 45,54 puntos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 113


d)

XY
=
1
54
((37,5 5 26,5 + 37,5 12 30
+47,5 7 26,5 + 47,5 10 30
+57,5 11 26,5 + 57,5 9 30)
54 48,06 28,51) ,
=
1
54
(73816,25 54 48,06 28,51) ,
=
174,04
54
,
= 3,22 .

2
X
=
1
54
_
(37,5
2
17 + 47,5
2
17 + 57,5
2
20) 54 48,06
2
_
,
=
1
54
(128387,50 124727,23) ,
=
3660,27
54
,
= 67,78 (puntos)
2
,

X
= 8,23 puntos.

2
Y
=
1
54
_
(26,5
2
23 + 30
2
31) 54 28,51
2
_
,
=
1
54
(44051,75 43892,29) ,
=
159,46
54
,
= 2,95 (a nos)
2
,

Y
= 1,72 a nos.
r
XY
=
3,22
8,23 1,72
= 0,227 .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 114


Existe una baja asociacion lineal inversa entre las variables.
22. La siguiente tabla resume la informacion de un grupo de estudiantes
universitarios seg un su edad y peso.
Edad Peso (Y)
(X) 65-75 75-85
18-22 6 11
22-25 7 14
25-28 10 16
a) Determine la edad mas frecuente de los que pesan menos de 75
kilos.
b) Determine el peso medio, de los alumnos que tienen mas de 22
a nos.
c) Determine si el peso medio de todos los alumnos, supera al peso
medio de los alumnos con edades inferiores a los 25 a nos.
d) Determine el coeciente de correlacion lineal para las variables.
Des.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 115


Y
y
i
70 80
x
i
X 65 75 75 85 Total
20 18 22 6 11 17
23,5 22 25 7 14 21
26,5 25 28 10 16 26
Total 23 41 64
a)
Mo(X|Y < 75) = 25 +
_
10 7
(10 7) + (10 0)
_
3 ,
= 25 +
3
3 + 10
3 ,
= 25 + 0,69 ,
= 25,69 a nos.
b) .
y
i
Y |X > 22
70 65 75 7 + 10 = 17
80 75 85 14 + 16 = 30
Total 47

Y |X>22
=
70 17 + 80 30
47
=
3590
47
= 76,41 Kgrs.
c)

Y
=
70 23 + 80 41
64
=
4890
64
= 76,41 Kgrs.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 116


y
i
Y |X < 25
70 65 75 6 + 7 = 13
80 75 85 11 + 14 = 25
Total 38

Y |X<25
=
70 13 + 80 25
38
=
2910
38
= 76,58 Kgrs.
El peso medio de todos los alumnos es menor que el peso de los
alumnos menores de 25 a nos.
d)

X
=
20 17 + 23,5 21 + 26,5 26
64
=
1522,5
64
= 23,79 a nos.

XY
=
1
64
((20 6 70 + 20 11 80
+23,5 7 70 + 23,5 14 80
+26,5 10 70 + 26,5 16 80)
64 23,79 76,41)
=
1
64
(116305 64 23,79 76,41)
=
33,81
64
= 0,528
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 117

2
X
=
1
64
_
(20
2
17 + 23,5
2
21 + 26,5
2
26) 64 23,79
2
_
=
1
64
(36655,75 36221,70)
=
434,05
64
= 6,78 (a nos)
2

X
= 2,60 a nos.

2
Y
=
1
64
_
(70
2
23 + 80
2
41) 64 76,41
2
_
=
1
64
(375100 373663,24)
=
1436,76
64
= 22,45 (Kgrs.)
2

Y
= 4,74 kgrs.
r
XY
=
0,528
2,60 4,74
= 0,056
Existe una baja asociacion lineal inversa entre las variables.
23. La siguiente tabla muestra los puntajes (X) obtenidos por un grupo de
alumnos de un colegio seg un el tramo de edad (Y ).
Puntajes Edad (Y)
(X) 9-11 11-14 14-16
0-30 3 6 10
30-50 8 4 11
50-70 9 7 5
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 118


a) Obtenga la edad media y puntaje medio de estos alumnos.
b) Obtenga las varianzas de la edad y del puntaje.
c) Determine el coeciente de correlacion lineal.
d) Cual es la edad media de los alumnos que obtuvieron puntajes
mayores a 30 puntos?
e) Cual es el puntaje medio de aquellos alumnos que tienen mas de
11 a nos?
Des.
Y
y
i
10 12,5 15
x
i
X 9 11 11 14 14 16 Total
15 0 30 3 6 10 19
40 30 50 8 4 11 23
60 50 70 9 7 5 21
Total 20 17 26 63
a)

X
=
15 19 + 40 23 + 60 21
63
=
2465
63
= 39,13 puntos.

Y
=
10 20 + 12,5 17 + 15 26
63
=
802,5
63
= 12,74 a nos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 119


b)

2
X
=
1
63
_
(15
2
19 + 40
2
23 + 60
2
21) 63 39,13
2
_
,
=
1
63
(116675 96462,88) ,
=
20212,12
63
= 320,83 (puntos)
2
,

X
= 17,91 puntos.

2
Y
=
1
63
_
(10
2
20 + 12,5
2
17 + 15
2
26) 63 12,74
2
_
,
=
1
63
(10506,25 10225,38) ,
=
280,87
63
,
= 4,46 (a nos)
2
,

Y
= 2,11 a nos.
c)

XY
=
1
63
((15 3 10 + 15 6 12,5 + 15 10 15
+40 8 10 + 40 4 12,5 + 40 11 15
+60 9 10 + 60 7 12,5 + 60 5 12,5)
63 39,13 12,74) ,
=
1
63
(30775 63 39,13 12,74) ,
=
631,52
63
,
= 10,02 .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 120


r
XY
=
10,02
17,91 2,11
= 0,265 .
d) .
y
i
Y |X > 30
10 9 11 8 + 7 = 17
12,5 11 14 4 + 7 = 11
15 14 16 11 + 5 = 16
Total 44

Y |X>30
=
10 17 + 12,5 11 + 15 16
44
=
547,5
44
= 12,44 a nos.
e) .
x
i
X|Y > 11
15 0 30 6 + 10 = 16
40 30 50 4 + 11 = 15
60 50 70 7 + 5 = 12
Total 43

X|Y >11
=
15 16 + 40 15 + 60 12
43
=
1560
43
= 36,28 puntos.
24. La siguiente tabla resume las horas semanales que un grupo de ni nos
pasa frente al computador (Y ) respecto a su edad (X).
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 121


X Y
2-4 4-6 6-8
12-14 13 14 15
14-16 12 15 16
a) Determine el promedio de horas a la semana y de edad de este
grupo de ni nos.
b) Determine la cantidad de horas mas frecuentes que pasan frente
al computador los ni nos mayores de 14 a nos?
c) Cual es la edad media de los ni nos que pasan menos de 6 horas
frente al computador?
d) Determine el coeciente de correlacion lineal.
Des.
Y
y
i
3 5 7
x
i
X 2 4 4 6 6 8 Total
13 12 14 13 14 15 42
15 14 16 12 15 16 43
Total 25 29 31 85
a)

X
=
13 42 + 15 43
85
=
1191
85
= 14,01 a nos.

Y
=
3 25 + 5 29 + 7 31
85
=
437
85
= 5,14 horas.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 122


b) .
y
i
Y |X > 14
3 2 4 12
5 4 6 15
7 6 8 16
Total 43
Mo(Y |X > 14) = 6 +
_
16 15
(16 15) + (16 0)
_
2 ,
= 6 +
1
1 + 16
2 ,
= 6 + 0,12 ,
= 6,12 horas.
c) .
x
i
X|Y < 6
13 12 14 13 + 14 = 27
15 14 16 12 + 15 = 27
Total 54

X|Y <6
=
13 27 + 15 27
54
=
756
54
= 14 a nos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 123


d)

XY
=
1
85
((13 13 3 + 13 14 5 + 13 15 7
+15 12 3 + 15 15 5 + 15 16 7)
85 14,01 5,14)
=
1
85
(6127 85 14,01 5,14) ,
=
6,03
85
,
= 0,071 (a nos) (horas).

2
X
=
1
85
_
(13
2
42 + 15
2
43) 85 14,01
2
_
,
=
1
85
(16773 16683,81) ,
=
89,19
85
,
= 1,05 (a nos)
2
,

X
= 1,02 a nos.

2
Y
=
1
85
_
(3
2
25 + 5
2
29 + 7
2
31) 85 5,14
2
_
,
=
1
85
(2469 2245,67) ,
=
223,33
85
,
= 2,63 (horas)
2
,

Y
= 1,62 horas.
r
XY
=
0,071
1,02 1,62
= 0,043 .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 124


25. La tabla muestra el gasto mensual en diarios y revistas de 45 familias
en miles de pesos, diferenciadas seg un si tienen automovil o no.
Gasto mensual Con automovil Sin automovil
1-5 7 3
5-10 5 4
10-15 10 6
15-25 6 4
a) Cual es el gasto mensual medio en diarios y revistas de estas
familias?
b) Que porcentaje de familias gastan mensualmente mas de $12000
en diarios y revistas?
c) Cual es el gasto medio de las familias que no tienen automovil?
d) Son los gastos en diarios y revistas de las familias con automovil
mas homogeneos que las sin automovil?
Des.
Y
x
i
X CA SA Total
3 1 5 7 3 10
7,5 5 10 5 4 9
12,5 10 15 10 6 16
20 15 25 6 5 10
Total 18 17 45
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 125


a)

X
=
3 10 + 7,5 9 + 12,5 16 + 20 10
45
,
=
497,5
45
= 11,06 miles de pesos.
b)
12 = 10 +
_
45
100
9
_
5
16
,
=
_
(12 10)
16
5
+ 9
_
100
45
,
= (6,4 + 9)
100
45
,
= 15,4
100
45
,
= 34,22 % .
El 34,22 % de las familias gasta mensualmente menos de $12000,
luego el 65,78 % de las familas gasta mas de $12000 mensualmente.
c)

X|Y =SA
=
3 3 + 7,5 4 + 12,5 6 + 20 4
17
,
=
194
17
= 11,41 miles de pesos.
d)

X|Y =CA
=
3 7 + 7,5 5 + 12,5 10 + 20 6
28
,
=
303,5
28
= 10,84 miles de pesos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 126

2
X|Y =CA
=
1
28
_
(3
2
7 + 7,5
2
5 + 12,5
2
10 + 20
2
6) 28 10,84
2
_
,
=
1
28
(4306,75 3290,16) ,
=
1016,59
28
,
= 36,31 (miles de pesos)
2
,

X|Y =CA
= 6,03 miles de pesos.

2
X|Y =SA
=
1
17
_
(3
2
3 + 7,5
2
4 + 12,5
2
6 + 20
2
4) 17 11,41
2
_
,
=
1
17
(2789,50 2213,20) ,
=
576,30
17
,
= 33,90 (miles de pesos)
2
,

X|Y =SA
= 5,82 miles de pesos.
CV
X|Y =CA
=
6,03
10,84
100 % = 55,6 % .
CV
X|Y =SA
=
5,82
11,41
100 % = 51,0 % .
Los gastos en diarios y revistas de las familias sin automovil son
mas homogeneos que las familias con automovil.
26. La siguiente tabla muestra las alturas y pesos de un grupo de jovenes
deportistas.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 127


Altura (X) Edades (Y)
(en mt.) 13-17 17-20
1.4-1.5 14 10
1.5-1.7 20 15
1.7-1.8 12 17
a) Cual es la edad mas com un de aquellos que miden como mnimo
1.5 mt.?
b) Cual es la altura media de los que tienen a lo mas 17 a nos?
c) Que porcentaje de estos jovenes tienen entre 17 y 20 a nos y miden
entre 1.5 y 1.8 mt.?
d) Determine la variabilidad de las edades y las alturas.
Des.
Y
y
i
15 18,5
x
i
X 13 17 17 20 Total
1,45 1,4 1,5 14 10 24
1,60 1,5 1,7 20 15 35
1,75 1,7 1,8 12 17 29
Total 46 42 88
a) .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 128


y
i
Y |X > 15
15 13 17 20 + 12 = 32
18,5 17 20 15 + 17 = 32
Total 64
Mo(Y |X > 15)
1
= 13 +
_
32 0
(32 0) + (32 32)
_
4100 %
= 17 a nos.
Mo(Y |X > 15)
2
= 17 +
_
32 32
(32 32) + (32 0)
_
3100 %
= 17 a nos.
En este caso si tienen dos modas y ambas iguales.
b) .
x
i
X|Y < 17
1,45 1,4 1,5 14
1,60 1,5 1,7 20
1,75 1,7 1,8 12
Total 46

X|Y <17
=
1,45 14 + 1,60 20 + 1,75 12
46
=
73,3
46
= 1,59 mt.
c)
15 + 17
88
=
32
88
= 0,3636100 .
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 129


Equivalentemente, el 36,36 % de estos jovenes tiene entre 17 y 20
a nos y miden entre 1.5 y 1.8 mt.
d)

X
=
1,45 24 + 1,60 35 + 1,75 29
88
=
141,55
88
= 1,61 mt.

Y
=
15 46 + 18,5 42
88
=
1467
88
= 16,67 a nos.

2
X
=
1
88
_
(1,45
2
24 + 1,60
2
35 + 1,75
2
29) 88 1,61
2
_
,
=
1
88
(228,87 228,10) ,
=
0,77
88
,
= 0,0087 (mt)
2
,

X
= 0,093 mt.

2
Y
=
1
88
_
(15
2
46 + 18,5
2
42) 88 16,67
2
_
,
=
1
88
(24724,50 24454,22) ,
=
270,28
88
,
= 3,07 (a nos)
2
,

X
= 1,75 a nos.
27. La tabla siguiente muestra los litros de alcohol (X) utilizados en un pro-
ceso de limpieza de ciertos ltos, por algunas farmacias y el presupuesto
disponible de ellas (Y), en miles de pesos.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 130


X Y
35-60 60-110 110-180
1-6 18 7 8
6-12 4 1 6
12-15 7 8 4
a) Cual es el presupuesto medio de estas farmacias? Cual es la
cantidad promedio de litros de alcohol utilizados?
b) Cuantos litros utilizan en promedio las farmacias con unpre-
supuesto inferior a los 110 mil?
c) De las farmacias que utilizan mas de 6 litros de alcohol, que por-
centaje de ellas tienen un presupuesto inferior a los 60 mil?
d) Determine el coeciente de correlacion lineal.
Des.
Y
y
i
47,5 85 145
x
i
X 35 60 60 110 110 180 Total
3,5 1 6 18 7 8 33
9,0 6 12 4 1 6 11
13,5 12 15 7 8 4 19
Total 29 16 18 63
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 131


a)

X
=
3,5 33 + 9,0 11 + 13,5 19
63
=
471
63
= 7,48 litros.

Y
=
47,5 29 + 85 16 + 145 18
63
=
5347,5
63
= 84,88 miles de pesos.
b) .
x
i
X|Y < 110
3,5 1 6 18 + 7 = 25
9,0 6 12 4 + 1 = 5
13,5 12 15 7 + 8 = 15
Total 45

X|Y <110
=
3,5 25 + 9,0 5 + 13,5 15
45
=
335
45
= 7,44 litros.
c) .
y
i
Y |X > 6
47,5 35 60 4 + 7 = 11
85 60 110 1 + 8 = 9
145 110 180 6 + 4 = 10
Total 30
11
30
= 0,367
El 36,7 % de las farmacias que utilizan mas de 6 litros de alcohol
en la limpieza de sus ltros, tiene un presupuesto inferior a $60000.
Carlos Bustos-Lopez
CAP

ITULO 1. ESTAD

ISTICAS DESCRIPTIVAS: DEFINICIONES 132


d)

XY
=
1
63
((3,5 18 47,5 + 3,5 7 85 + 3,5 8 145
+9,0 4 47,5 + 9 1 85 + 9 6 145
+13,5 7 47,5 + 13,5 8 85 + 13,5 4 145)
63 7,48 84,88) ,
=
1
63
(40938,75 63 7,48 84,88) ,
=
939,90
63
,
= 14,92 .

2
X
=
1
63
_
(3,5
2
33 + 9
2
11 + 13,5
2
19) 63 7,48
2
_
,
=
1
63
(4758 3524,88) ,
=
1233,12
63
,
= 19,57 (litros)
2
,

X
= 4,42 litros.

2
Y
=
1
63
_
(47,5
2
29 + 85
2
16 + 145
2
18) 63 84,88
2
_
,
=
1
63
(559481,25 453890,71) ,
=
105590,54
63
,
= 1676,04 (miles de pesos)
2
,

Y
= 40,94 miles de pesos.
r
XY
=
14,92
4,42 40,94
= 0,082 .
Carlos Bustos-Lopez
Captulo 2
Regresion Lineal
2.1. Modelo de Regresion Lineal
La idea fundamental de los modelos de regresion es, poder representar
de la mejor forma posible el comportamiento de los datos. Los datos tienen
distintos comportamientos dependiendo del tipo de variable que se este in-
vestigando. Si se observan dos variables al mismo tiempo, se puede estar
interesado en el comportamiento conjunto de estas variables y a traves del
coecientes de correlacion podriamos conocer el tipo de asociacion que exis-
te entre ellas. El modelo matematico mas simple que intenta representar el
comportamiento de los datos es el modelo lineal, el cual parte de la base que
es posible ajustar una linea recta a las observaciones, siendo esta ecuacion
una forma de resumir y representar la informacion. El modelo de regresion
lineal simple en la versi on frecuentista, considera las observaciones de pares
ordenados (x
i
, y
i
), con i =, . . . , n. Para el modelo
y =
0
+
1
x + ,
133
CAP

ITULO 2. REGRESI

ON LINEAL 134
en general, el interes se concentra en la estimacion de los parametros =

(
0
,
1
),
los cuales se pueden obtener mediante los EMCO
1
al resolver la equacion:
mn

n
i=1

2
i
= mn

n
i=1
(y
i

1
x
i
)
2
,
derivando con respecto a
0
y
1
e igualando a cero se obtienen:

0
=

Y

1

X ,

1
=
S
XY
S
XX
,
donde S
XY
=

n
i=1
(x
i


X)(y
i

Y ) y S
XX
=

n
i=1
(x
i


X)
2
, siendo (

X,

Y ),
las medias muestrales respectivas. De esa forma el modelo de regresion lineal
estimado esta dado por:
y
i
=

0
+

1
x
i
,
para todo i = 1, . . . , n.
Ademas, se puede determinar el grado de asociacion representada por el
modelo de regresion lineal estimado para las observaciones, este coeciente
es denominado R
2
y corresponde exactamente al cuadrado del coeciente de
correlacion lineal de Pearson, que ademas puede ser calculado por:
R
2
= (r
XY
)
2
=
S
2
XY
S
XX
S
Y Y
,
donde S
Y Y
=

n
i=1
(y
i


Y )
2
, y su interpretaci on es que el modelo explica a
los observaciones (o representa) en un R
2
100 %. Con un poco de algebra
se puede llegar a las siguientes expresiones simplicadas de S:
S
XY
=
n

i=1
x
i
y
i
n

X

Y , S
XX
=
n

i=1
x
2
i
n

X
2
, S
Y Y
=
n

i=1
y
2
i
n

Y
2
.
1
Estimadores de mnimos cuadrados ordinarios.
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 135
2.2. Ejercicios Resueltos
1. La siguiente tabla muestra el ujo diario de automoviles (X) en miles,
y su cantidad de partculas que emiten en mg/cm
3
.
X Y
19,09 522,10
27,83 1198,30
39,10 1472,00
39,10 1239,70
39,10 1674,40
55,89 2173,50
55,89 1697,40
76,36 1745,70
a) Determine el modelo de regresion lineal simple asociado.
b) Determine el grado de explicacion del modelo.
c) Para un ujo de 20000 automoviles diarios, Cual sera la cantidad
esperada de particulas en suspencion dadas por este ujo?
d) Determine la cantidad de automoviles que generan 1000 mg/cm
3
en un da.
Des.
Completamos la tabla con las respectivas multiplicaciones y sumas para
determinar los parametros del modelo.
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 136
X Y XY X
2
Y
2
19,09 522,10 9966,89 364,43 272588,41
27,83 1198,30 33348,69 774,51 1435922,89
39,10 1472,00 57555,20 1528,81 2166784,00
39,10 1239,70 48472,27 1528,81 1536856,09
39,10 1674,40 65469,04 1528,81 2803615,36
55,89 2173,50 121476,92 3123,69 4724102,25
55,89 1697,40 94867,69 3123,69 2881166,76
76,36 1745,70 133301,65 5830,85 3047468,49
352,36 11723,10 564458,34 17803,60 18868504,25
a)

X =
352,36
8
= 44,05

Y =
11723,10
8
= 1465,39
S
XY
= 564458,34 8 44,05 1465,39 = 48054,90
S
XX
= 17803,60 8 44,05
2
= 2280,38
S
Y Y
= 18868504,25 8 1465,39
2
= 1689561,43

1
=
48054,90
2280,38
= 21,07

0
= 1465,39 21,07 44,05 = 537,26
y = 537,26 + 21,07x
b)
R
2
=
48054,90
2
2280,38 1689561,43
= 0,5994
El modelo representa a las observaciones en un 59,94 %.
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 137
c)
y = 537,26 + 21,07 20
= 958,66 mg/cm
3
.
d)
1000 = 537,26 + 21,07x
x =
1000 537,26
21,07
= 21,96 miles de automoviles.
2. Una empresa desea determinar como la inversion que ha realizado en
publicidad (X) en UF, de los ltimos meses ha afectado la demanda de
su producto (Y ) en miles de unidades. Para tal efecto ha recopilado la
siguiente informacion dque se resume en la tabla.
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 138
X Y
105,80 27,60
121,90 32,20
85,10 25,30
75,90 29,90
92,00 23,00
92,00 18,40
96,60 39,10
78,20 27,60
66,70 23,00
138,00 34,50
101,20 20,70
94,30 29,90
110,40 34,50
a) Determine un modelo de regresion lineal.
b) La empresa esta interesada en determinar cual debe ser la cantidad
que debe invertir en publicidad de tal forma que espere tener una
venta de 30000 unidades de su producto.
c) Si no quiere invertir mas de 80 UF en publicidad, Cual sera la
cantidad maxima de unidades que esperara vender?
d) Cual es el grado de ajuste del modelo?
Des.
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 139
X Y XY X
2
Y
2
105,80 27,60 2920,08 11193,64 761,76
121,90 32,20 3925,18 14859,61 1036,84
85,10 25,30 2153,03 7242,01 640,09
75,90 29,90 2269,41 5760,81 894,01
92,00 23,00 2116,00 8464,00 529,00
92,00 18,40 1692,80 8464,00 338,56
96,60 39,10 3777,06 9331,56 1528,81
78,20 27,60 2158,32 6115,24 761,76
66,70 23,00 1534,10 4448,89 529,00
138,00 34,50 4761,00 19044,00 1190,25
101,20 20,70 2094,84 10241,44 428,49
94,30 29,90 2819,57 8892,49 894,01
110,40 34,50 3808,80 12188,16 1190,25
1258,10 365,70 36030,19 126245,85 10722,83
a)

X =
1258,10
13
= 96,78

Y =
365,70
13
= 28,13
S
XY
= 36030,19 13 96,78 28,13 = 638,71
S
XX
= 126245,85 13 96,78
2
= 4483,06
S
Y Y
= 10722,83 13 28,13
2
= 435,97

1
=
638,71
4483,06
= 0,142

0
= 28,13 0,142 96,78 = 14,39
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 140
y = 14,39 + 0,142x
b)
30 = 14,39 + 0,142x
x =
30 14,39
0,142
= 109,93 UF
c)
y = 14,39 + 0,142 80
= 25,75 miles de unidades.
d)
R
2
=
638,71
2
4483,06 435,97
= 0,2087
El modelo explica a las observaciones en un 20,87 %.
3. En un estudio realizado al contenido de caloras (X) en kcal, respecto al
nivel de grasas (Y ) en g, de cierto producto, se recopilaron los siguientes
datos:
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 141
X Y
103,50 161,00
46,00 115,00
92,00 138,00
92,00 115,00
108,10 207,00
69,00 126,50
57,50 126,50
46,00 80,50
34,50 92,00
80,50 149,50
a) Determine un modelo de regresion, que permita determinar el
comportamiento de los niveles grasa por caliras.
b) Cuantas caloras contiene 110 g de grasa?
c) Cuantos gramos de grasa se necesitan para tener 100 kcal?
d) Determine el nivel de ajuste del modelo estimado.
Des.
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 142
X Y XY X
2
Y
2
103,50 161,00 16663,50 10712,25 25921,00
46,00 115,00 5290,00 2116,00 13225,00
92,00 138,00 12696,00 8464,00 19044,00
92,00 115,00 10580,00 8464,00 13225,00
108,10 207,00 22376,70 11685,61 42849,00
69,00 126,50 8728,50 4761,00 16002,25
57,50 126,50 7273,75 3306,25 16002,25
46,00 80,50 3703,00 2116,00 6480,25
34,50 92,00 3174,00 1190,25 8464,00
80,50 149,50 12034,75 6480,25 22350,25
729,10 1311,00 102520,20 59295,61 183563,00
a)

X =
729,10
10
= 72,91

Y =
1311,00
10
= 131,10
S
XY
= 102520,20 10 72,91 131,10 = 6935,19
S
XX
= 59295,61 10 72,91
2
= 6136,93
S
Y Y
= 183563,00 10 131,10
2
= 11690,9

1
=
6935,19
6136,93
= 1,13

0
= 131,10 1,13 72,91 = 48,71
y = 48,71 + 1,13x
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 143
b)
110 = 48,71 + 1,13x
x =
110 48,71
1,13
= 54,24 kcal.
c)
y = 48,71 + 1,13 100
= 161,71 g.
d)
R
2
=
6935,19
2
6136,93 11690,9
= 0,6704
El modelo tiene un ajuste del 67,04 % de los datos.
4. En un centro hospilatario se ha implementado una nueva campaa de
provencion para disminuir el porcentaje de afecciones respiratorias en
el periodo invernal, para ello han distribuido una serie de folletos ex-
plicativos donde una de las medidas mas importantes es dismincion de
niveles de toxicidad derivados del humo del cigarrillo por lo cual se les
recomienda a las personas que no fumen dentro de su hogar. A contin-
uacion se muestra una tabla con los porcentajes de personas que han
dejado de fumar al interior de sus hogares (X) y el porcentaje de per-
sonas al interior del hogar que han sufrido de afecciones respiratorias
durante el periodo (Y ).
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 144
X( %) Y ( %)
23,00 43,70
27,60 41,40
29,90 36,80
32,20 34,50
34,50 34,50
39,10 32,20
46,00 32,20
48,30 29,90
50,60 27,60
46,00 29,90
a) Determine si se puede establecer alg un modelo simple que reeje
el comportamiento de estas medidas.
b) Establezca el porcentaje esperado de personas por hogar que ten-
dran alg un problema respiratorio, si el 30 % de ellas ha dejado de
fumar al interior de sus hogares.
c) Si el porcentaje de personas afectadas por problemas respiratorios
ha sido de un 30 %, Cual ha sido el porcentaje de personas que
ha seguido las sugerencias del centro de salud?
d) Cual es el nivel de ajuste del modelo de regresion lineal estimado?
Des.
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 145
X Y XY X
2
Y
2
23,00 43,70 1005,10 529,00 1909,69
27,60 41,40 1142,64 761,76 1713,96
29,90 36,80 1100,32 894,01 1354,24
32,20 34,50 1110,90 1036,84 1190,25
34,50 34,50 1190,25 1190,25 1190,25
39,10 32,20 1259,02 1528,81 1036,84
46,00 32,20 1481,20 2116,00 1036,84
48,30 29,90 1444,17 2332,89 894,01
50,60 27,60 1396,56 2560,36 761,76
46,00 29,90 1375,40 2116,00 894,01
377,20 342,70 12505,56 15065,92 11981,85
a)

X =
377,20
10
= 37,72

Y =
342,70
10
= 34,27
S
XY
= 12505,56 10 37,72 34,27 = 421,08
S
XX
= 15065,92 10 37,72
2
= 837,94
S
Y Y
= 11981,85 10 34,27
2
= 237,52

1
=
421,08
837,94
= 0,503

0
= 34,27 (0,503) 37,72 = 53,24
y = 53,24 0,503x
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 146
b)
y = 53,24 0,503 30
= 38,15 %
c)
30 = 53,24 0,503x
x =
30 53,24
0,503
=
23,24
0,503
= 46,20 %
d)
R
2
=
(421,08)
2
837,94 237,52
= 0,8909
El modelo explica el 89,09 % del comportamiento de las observa-
ciones.
5. En un experimento con ratas de laboratorio sobre el nivel de glucosa
en la sangre (Y ), en mg/dL, bajo la administracion de cierto farmaco
(X), en g/Kgr, se recopilo la siguiente informacion
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 147
X(g/Kgr) Y (mg/dL)
8,28 55,20
7,59 48,30
6,44 50,60
5,98 50,60
6,21 41,40
5,98 52,90
6,21 43,70
6,67 29,90
4,60 20,70
5,98 13,80
8,51 57,50
7,82 48,30
a) Estime el modelo de regresion para la respuesta nivel de glicemia
en la sangre de estas ratas.
b) Determine el nivel de ajuste del modelo estimado.
c) Que dosis es necesaria ser administrada a las ratas para que su
nivel de glucosa sea de 50 mg/dL?
d) Que nivel de glicemia tendra una rata a la que se le administre
8 g/kgr?
Des.
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 148
X Y XY X
2
Y
2
8,28 55,20 457,06 68,56 3047,04
7,59 48,30 366,60 57,61 2332,89
6,44 50,60 325,86 41,47 2560,36
5,98 50,60 302,59 35,76 2560,36
6,21 41,40 257,09 38,56 1713,96
5,98 52,90 316,34 35,76 2798,41
6,21 43,70 271,38 38,56 1909,69
6,67 29,90 199,43 44,49 894,01
4,60 20,70 95,22 21,16 428,49
5,98 13,80 82,52 35,76 190,44
8,51 57,50 489,33 72,42 3306,25
7,82 48,30 377,71 61,15 2332,89
80,27 512,90 3541,13 551,27 24074,79
a)

X =
80,27
12
= 6,69

Y =
512,90
12
= 42,74
S
XY
= 3541,13 12 6,69 42,74 = 109,96
S
XX
= 551,27 12 6,69
2
= 14,20
S
Y Y
= 24074,79 12 42,74
2
= 2154,30

1
=
109,96
14,20
= 7,74

0
= 42,74 7,74 6,69 = 9,04
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 149
y = 9,04 + 7,74x
b)
R
2
=
109,96
2
14,20 2154,30
= 0,3953
El modelo explica solo el 39,53 % de las observaciones.
c)
50 = 9,04 + 7,74x
x =
50 + 9,04
7,74
= 7,63 g/Kgr.
d)
y = 9,04 + 7,74 8
= 52,88 mg/dL.
6. En un estudio realizado sobre el gasto en electricidad (Y , en miles de
pesos) derivado del uso de aire acondicionado, respecto al incremento
en grados de temperatura ambiental (X, en grados celsius), arrojo los
siguientes resultados:
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 150
X Y
2,30 7,89
2,76 8,63
3,22 10,40
3,68 11,80
4,14 13,66
4,60 14,61
5,52 18,38
5,98 18,93
6,44 21,76
6,90 23,81
8,05 26,59
8,28 28,84
8,51 29,69
a) Estime el mejor modelo de regresion lineal para estas variables.
b) Cual es el nivel de ajuste del modelo?
c) Si la temperatura ha sufrido un incremento de 6,5 grados celsius,
Cual es gasto en electricidad esperado por el concepto de aire
acondicionado?
d) Si los departamentos tuvieron un gasto en electricidad de $30000,
Cuanto fue el incremento en la temperatura?
Des.
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 151
X Y XY X
2
Y
2
2,30 7,89 18,14 5,29 62,24
2,76 8,63 23,81 7,62 74,39
3,22 10,40 33,48 10,37 108,08
3,68 11,80 43,42 13,54 139,22
4,14 13,66 56,56 17,14 186,65
4,60 14,61 67,18 21,16 213,31
5,52 18,38 101,44 30,47 337,71
5,98 18,93 113,20 35,76 358,31
6,44 21,76 140,12 41,47 473,41
6,90 23,81 164,25 47,61 566,68
8,05 26,59 214,03 64,80 706,92
8,28 28,84 238,81 68,56 831,86
8,51 29,69 252,69 72,42 881,67
70,38 234,97 1467,13 436,21 4940,44
a)

X =
70,38
13
= 5,41

Y =
234,97
13
= 18,07
S
XY
= 1467,13 13 5,41 18,07 = 196,27
S
XX
= 436,21 13 5,41
2
= 55,72
S
Y Y
= 4940,44 13 18,07
2
= 695,62

1
=
196,27
55,72
= 3,52

0
= 18,07 3,52 5,41 = 0,973
Carlos Bustos-Lopez
CAP

ITULO 2. REGRESI

ON LINEAL 152
y = 0,973 + 3,52x
b)
R
2
=
196,27
2
55,72 695,62
= 0,9939
El modelo explica el 99,39 % de los datos.
c)
y = 0,973 + 3,52 6,5
= 21,907 miles de pesos.
d)
30 = 0,973 + 3,52x
x =
30 + 0,973
3,52
= 8,80 grados celsius.
Carlos Bustos-Lopez
Captulo 3
Probabilidades
3.1. Probabilidades
3.1.1. Introduccion
El concepto de Probabilidades no es ajeno a la vida cotidiana, siempre
estamos, de una forma u otra, utilizando las probabilidades, por ejemplo,
cuando nos preguntamos en la ma nana antes de salir de casa, llovera o
no?, lo hacemos bajo un contexto determinado, es decir, si creemos que
existen posibilidades de que ese fenomeno ocurra.
Ademas de ciertas evidencias cualitativas que favorezcan el realizar la
pregunta, por ejemplo, si es invierno, si esta nublado, etc.
Bajo lo anterior, uno trata de responder la pregunta en condiciones de
incerteza, asignando un valor a aquella armacion, es decir, s , creo que
llovera, o simplemente no creo que llueva. Esta asignacion subjetiva, le
dara mayor, menor o igual peso a cada una de las posibilidades.
153
CAP

ITULO 3. PROBABILIDADES 154


La pregunta anterior y sus respectivas respuestas, nos permiten determi-
nar un conjunto de posibilidades y de respectivos valores a cada una de las
respuestas y que pueden ser distintas de sujeto a sujeto.
La forma de medir, objetivamente, la ocurrencia de un evento, dentro
de todas las posibilidades que existen para ese fenomeno, es a traves de la
medida de probabilidad.
3.1.2. Deniciones
Experimento (E)
Denicion 3.1.1 Un experimento sera aquel, que permite recopilar infor-
macion sobre alg un evento o fenomeno que tengamos incerteza sobre su com-
portamiento. Es decir, esta involucrado el azar, por eso denominamos a este
experimento como aleatorio.
La idea de realizar un experimento es: si el experimento se puede repetir
una cantidad innita de veces, este nos permitira descubrir la ley que sostiene
sus resultados.
Ejemplo 3.1.1 Experimentos aleatorios.
1. El lanzar una moneda al aire y observar su resultado.
2. El lanzamiento de un dado c ubico y observar su resultado.
3. Sacar una carta de un mazo al azar y observar su resultado.
Carlos Bustos-Lopez
CAP

ITULO 3. PROBABILIDADES 155


Espacio Muestral ()
Denicion 3.1.2 Es el conjunto de todos los posibles resultados de un ex-
perimento aleatorio. El cual denotaremos con la letra .
Ejemplo 3.1.2 Espacio Muestral de experimentos aleatorios.
1. = {cara, sello}
2. = {1, 2, 3, 4, 5, 6}
3. = {As, 2, 3, 4, 5, 6, 7, 8, 9, 10, J, Q, K} {, , , }
Suceso o Evento
Denicion 3.1.3 Es un subconjunto del espacio muestral, el cual lo deno-
taremos con letras may usculas. (p.e. A ).
Ejemplo 3.1.3 El experimento E= Lanzar un dado y observar sus resulta-
dos.
Espacio muestral = {1, 2, 3, 4, 5, 6}.
Sucesos:
A= {Sale n umero impar}.
B= {Sale n umero par}.
C= {Sale un n umero menor o igual a 3}.
D= {Sale un n umero mayor o igual a 4}.
Carlos Bustos-Lopez
CAP

ITULO 3. PROBABILIDADES 156


3.1.3. Probabilidad
La denicion clasica (equiprobable) de probabilidad considera lo siguien-
te:
Denicion 3.1.4 Si E es un experimento y su espacio muestral asociado,
siempre que este formado por un n umero contable o numerable de elemen-
tos; entonces, para un suceso A , se puede escribir la probabilidad de que
ocurra A, como:
IP(A) =
N umero de elementos de A
N umero de elementos de
,
y que corresponde a:
IP(A) =
Casos Favorables asociados a A
Casos Totales
=
CF(A)
CT()
.
Ejemplo 3.1.4 Sea el siguiente experimento E: Tirar un dado c ubico y
observar su resultado.
A: sale 2.
B: sale n umero par.
C: el n umero es menor o igual a 4.
Determinemos el espacio muestral:
= {1, 2, 3, 4, 5, 6} ,
y los casos totales son:
CT() = 6 ,
Carlos Bustos-Lopez
CAP

ITULO 3. PROBABILIDADES 157


ahora, los casos favorables para cada item:
CF(A) = 1.
CF(B) = 3.
CF(C) = 4.
y calculemos las respectivas probabilidades asociadas a estos eventos:
P(A) =
CF(A)
CT()
=
1
6
.
P(B) =
CF(B)
CT()
=
3
6
=
1
2
.
P(C) =
CF(C)
CT()
=
4
6
=
2
3
.
Axiomas
Sean, espacio muestral del experimento E, A un evento en , A
c
el
complemento de A y IP una medida de probabilidad.
1. 0 IP(A) 1.
2. IP() = 1, donde se denomina evento seguro.
3. IP(A) = 1 IP(A
c
).
4. IP(
c
) = IP() = 0, donde se denomina evento imposible.
Carlos Bustos-Lopez
CAP

ITULO 3. PROBABILIDADES 158


Teoremas y Deniciones
Denicion 3.1.5 Sean A y B dos sucesos cualquiera, entonces la probabili-
dad de que ocurra A o B, esta dada por:
IP(A B) = IP(A) + IP(B) IP(A B) .
Denicion 3.1.6 Si A y B son dos sucesos independientes (estocasti-
camente), es decir, la ocurrencia de uno no afecta la ocurrencia del otro y
vice versa, entonces, la probabilidad de que ocurra A y B esta dada por:
IP(A B) = IP(A) IP(B) .
Denicion 3.1.7 Si A y B son dos sucesos excluyentes, es decir, la ocur-
rencia de uno impide la ocurrencia del otro y vice versa, entonces, la proba-
bilidad de que ocurra A y B esta dada por:
P(A B) = 0 IP(A B) = IP(A) + IP(B) .
Ejemplo 3.1.5 Sea el siguiente experimento E: Sacar una carta de un mazo
de 52.
Ademas, sean los siguientes eventos:
A: Sale trebol.
B: Sale K.
Determinemos ahora sus respectivas probabilidades asociadas:
Carlos Bustos-Lopez
CAP

ITULO 3. PROBABILIDADES 159


CT() = 52.
CF(A) = 13 =IP(A) =
13
52
=
1
4
.
CF(B) = 4 =IP(B) =
4
52
=
1
13
.
a) Ahora, que sera el evento sale el rey de trebol?
Lo anterior corresponde al evento A B, y la probabilidad de su ocur-
rencia es:
CF(A B) = 1 =IP(A B) =
1
52
,
pero la ocurrencia del evento A no afecta la ocurrencia del evento B,
luego, se tiene que:
IP(A B) = IP(A) IP(B) =
1
4

1
13
=
1
52
.
A y B son eventos independientes.
b) El evento Sale rey o sale trebol, tiene una probabilidad asociada:
CF(A B) = 4 + 13 1 =IP(A B) =
16
52
,
pero por el teorema, se tiene:
IP(A B) = IP(A) + IP(B) IP(A B) =
13
52
+
4
52

1
52
=
16
52
.
c) Sea el evento C: Sale diamante, cual sera la probabilidad del evento
A C?
Carlos Bustos-Lopez
CAP

ITULO 3. PROBABILIDADES 160


Notemos que la ocurrencia del evento C, impide la ocurrencia del evento
A, luego:
P(A C) = 0 .
A y C son eventos excluyentes.
Denicion 3.1.8 (Probabilidad Condicional) Si se tienen dos sucesos
posibles A y B en , con IP(B) > 0, entonces la probabilidad de que ocurra
A dado que ya ocurrio B, esta dada por:
IP(A|B) =
IP(A B)
IP(B)
.
Teorema 3.1.1 (Teorema de Probabilidad Total) Sean los siguientes even-
tos B
i
en , con i = 1, 2, . . . , n, se dira que son una particion del espacio
muestral , exhaustiva y excluyente, si:
i)
n
_
i=1
B
i
= .
ii) B
i
B
j
= , i = j.
Ademas, sea A un suceso cualquiera en , de tal forma que podemos escribir
el suceso A como:
A = A ,
= A (B
1
B
2
B
n
) ,
= (A B
1
) (A B
2
) (A B
n
) =
n
_
i=1
(A B
i
) ,
Carlos Bustos-Lopez
CAP

ITULO 3. PROBABILIDADES 161


entonces, utilizando
IP(A|B
i
) =
IP(A B
i
)
IP(B
i
)
, i = 1, 2, . . . , n ,
se tiene que:
IP(A) = IP
_
n
_
i=1
(A B
i
)
_
,
= IP(A B
1
) + IP(A B
2
) + + IP(A B
n
) ,
= IP(A|B
1
)IP(B
1
) + IP(A|B
2
)P(B
2
) + + IP(A|B
n
)P(B
n
) ,
=
n

i=1
IP(A|B
i
)IP(B
i
) .
Ejemplo 3.1.6 Sea el siguiente experimento E: Se lanzan dos dados c ubicos
equilibrados y se observan sus resultados, ademas se ha observado que la
suma T es impar. Determinar la probabilidad de que la suma sea menor a 8.
Denamos los siguientes eventos:
A := T < 8, es decir, la suma es menor a 8.
B := T impar.
Entonces, el evento A B (la suma es menor que 8 y es impar) tiene
los siguientes elementos:
A B = {3, 5, 7} .
Ademas, el espacio muestral es el siguiente:
Carlos Bustos-Lopez
CAP

ITULO 3. PROBABILIDADES 162


Dado 1
+ 1 2 3 4 5 6
1 2 3 4 5 6 7
2 3 4 5 6 7 8
Dado 2 3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
Entonces las probabilidades asociadas a los eventos son:
P(B) =
18
36
=
1
2
.
P(A B) =
12
36
=
1
3
.
Reemplazando se tiene que,
IP(A|B) =
IP(A B)
IP(B)
=
1/3
1/2
=
2
3
.
Teorema 3.1.2 (Teorema de la Multiplicacion) Sean A
1
, A
2
, . . . , A
n

, eventos cualquiera, entonces:
IP

n
\
i=1
A
i
!
=
8
>
<
>
:
Q
n
i=1
IP(A
i
) , si los A
i
son independientes.
IP(A
1
)IP(A
2
|A
1
)IP(A
3
|A
1
A
2
) IP

A
n
|
T
n1
i=1
A
i

, si los A
i
no son independientes.
Teorema 3.1.3 (Teorema de Bayes) Si un espacio muestral esta for-
mado por A
1
, A
2
, . . . , A
n
particiones y conocemos la ocurrencia de un suceso
B, que esta en ; entonces para determinar la probabilidad de que un suceso
cualquiera de la particion ocurra dado que ocurrio B, esta dado por:
IP(A
i
|B) =
IP(B|A
i
)IP(A
i
)
n

j=1
IP(B|A
j
)IP(A
j
)
, i = 1, 2, . . . , n .
Carlos Bustos-Lopez
CAP

ITULO 3. PROBABILIDADES 163


Ejemplo 3.1.7 En la fabricacion de un lote de artculos, intervienen tres
maquinas: M
1
, M
2
y M
3
. Se sabe que el 20 % de los artculos del lote provienen
de M
1
, el 30 % de M
2
y el resto de M
3
. Ademas, la maquina M
1
produce un
1 % de artculos defectuosos, M
2
un 2 % y M
3
un 3 %. Se selecciona un artcu-
lo al azar del lote y se observa que es defectuoso. Determinar la probabilidad
de que el artculo haya sido fabricado por M
2
.
Denamos los siguientes eventos:
A
i
:= el artculo seleccionado proviene de la maquina M
i
, con i = 1, 2, 3.
B:= el artculo es defectuoso.
Del enunciado se tiene que:
IP(A
1
) = 0,2 , IP(A
2
) = 0,3 , IP(A
3
) = 0,5
IP(B|A
1
) = 0,01 , IP(B|A
2
) = 0,02 , IP(B|A
3
) = 0,03 .
Luego, la probabilidad pedida es:
IP(A
2
|B) =
IP(B|A
2
)IP(A
2
)
3

i=1
IP(B|A
i
)IP(A
i
)
,
=
0,02 0,3
0,01 0,2 + 0,02 0,3 + 0,03 0,5
,
=
0,006
0,023
,
0,26 .
Carlos Bustos-Lopez
Captulo 4
Variables Aleatorias
4.1. Variable Aleatoria
Sea (, A, IP) un espacio de probabilidad. Una variable aleatoria X es
una funcion medible desde (, A) hasta (IR, B(IR)). Ademas, sea A cualquier
subconjunto de la recta real y sea IP(X A la probabilidad de que el valor
de X pertenezca al subconjunto A. Entonces IP(X A) es igual a la proba-
bilidad de que el resultado s B del experimento, sea tal que X(s) A, es
decir
1
:
IP(X A) = IP({s : X(s) A}) .
Existen basicamente dos tipos de variables aleatorias (v.a.), las discretas
y las continuas, que se diferencias en el recorrido de sus posibles resultados.
1
Denicion de distribucion de una variable aleatoria, DeGroot, 1988.
164
CAP

ITULO 4. VARIABLES ALEATORIAS 165


4.1.1. Varaibles Aleatorias Discretas
La v.a. X se dice que es discreta, si su conjunto de posibles resultados
(soporte) B (subconjunto numerable de los reales) es un conjunto nito
o innito numerable.
Denicion 4.1.1 Llamaremos funcion de distribucion de probabili-
dad (f.d.p.) de la v.a. X a:
p
X
(x) = IP(X = x) , x B .
La cual cumple:
0 p
X
(x) 1 , x B .

xB
p
X
(x) =

xB
IP(X = x) = 1 .
4.1.2. Varaibles Aleatorias Continuas
La v.a. X se dice que es continua, si su conjunto de posibles resultados
(soporte) B es un conjunto innito no numerable.
Denicion 4.1.2 Llamaremos funcion de distribucion acumulada (f.d.a.)
de la v.a. X, si existe una funcion no negativa f, denida sobre la recta real,
tal que para cualquier intervalo A:
F
X
(x) = IP(X A) =
_
A
f
X
(x)dx .
lm
x
F
X
(x) = 0 .
Carlos Bustos-Lopez
CAP

ITULO 4. VARIABLES ALEATORIAS 166


lm
x+
F
X
(x) = 1 .
La funcion f se denomina funcion de distribucion de probabilidad (f.d.p.) de
X. La cual cumple:
f
X
(x) 0 , x B .
_

f
X
(x)dx = 1 .
Ademas, se dene para todo a < b IR que la probabilidad que el valor
de X se encuentre en el intervalo [a, b] esta dada por:
IP(a X b) =
_
b
a
f
X
(x)dx .
4.2. Valor Esperado
Denicion 4.2.1 Llamaremos Valor Esperado o Esperanza Matematica
de la v.a. X a:
IE(X) =

xB
xIP(X = x) .
La cual cumple, que si a, b IR, y X una v.a.,
IE(aX + b) = aIE(X) + b .
Denicion 4.2.2 Llamaremos Momento de Orden k de la v.a. X a:
IE(X
k
) =

xB
x
k
IP(X = x) .
Carlos Bustos-Lopez
CAP

ITULO 4. VARIABLES ALEATORIAS 167


Se dice que el momento de orden k existe si, y solo si, IE(|x|
k
) < . Ademas, si
la v.a. es acotada, es decir, si existen a, b IR tales que IP(a X b) = 1,
entonces deben existir todos los momentos de X. Sin embargo, es posible
que todos los momentos de orden k existan, sin necesidad que la v.a. X sea
acotada.
Teorema 4.2.1 Si IE(|X|
k
) < para un entero positivo k, entonces IE(|X|
j
) <
para cualquier entero positivo j tal que j < k.
Denicion 4.2.3 Llamaremos Varianza de la v.a. X a:
VVar(X) = IE((X IE(X))
2
) .
La cual cumple, que si a, b IR, y X una v.a.,
VVar(aX + b) = a
2
VVar(X) .
Una forma mas facil de determinar el valor de la varianza de X es consideran-
do la siguiente igualdad:
VVar(X) = IE((X IE(X))
2
) ,
= IE(X
2
2XIE(X) + IE
2
(X)) ,
= IE(X
2
) 2IE(X)IE(X) + IE(IE
2
(X)) ,
= IE(X
2
) 2IE
2
(X) + IE
2
(X) ,
= IE(X
2
) IE
2
(X) .
Carlos Bustos-Lopez
CAP

ITULO 4. VARIABLES ALEATORIAS 168


Denicion 4.2.4 Llamaremos Funcion Generadora de Momentos (f.g.m.)
de la v.a. X, para cada valor de t IR a:
(t) = IE(e
tX
) .
Ademas, se tiene que:

(0) =
_
d
dt
IE(e
tX
)
_

t=0
,
= IE
__
d
dt
e
tX
_

t=0
_
,
= IE
__
Xe
tX
_

t=0

,
= IE[X] .
De donde se tiene que la f.g.m. (t) en el punto t = 0 corresponde al primer
momento de la v.a. X. As se tiene que:

(n)
(0) =
_
d
n
dt
n
IE(e
tX
)
_

t=0
,
= IE
__
d
n
dt
n
e
tX
_

t=0
_
,
= IE
__
X
n
e
tX
_

t=0

,
= IE[X
n
] .
Entonces,

(0) = IE(X),

(0) = IE(X
2
),

(0) = IE(X
3
), y as sucesiva-
mente.
Teorema 4.2.2 Sea X una variable acleatoria cuya f.g.m., es
1
; sea Y =
aX +b, donde a y b son constantes; y sea
2
la f.g.m. de Y . Entonces, para
Carlos Bustos-Lopez
CAP

ITULO 4. VARIABLES ALEATORIAS 169


cualquier valor de t tal que existe
1
(at),

2
(t) = e
bt

1
(at) .
Dem.

2
(t) = IE(e
tY
) = IE(e
t(aX+b)
) = IE(e
taX
e
tb
) = e
tb
IE(e
taX
) = e
bt

1
(at) .
Teorema 4.2.3 Si las f.g.m., de dos variables aleatorias X
1
y X
2
son identi-
cas para todos los valores de t en un intervalo alrededor del punto t = 0,
entonces las distribuciones de probabilidad de X
1
y X
2
deben ser identicas.
Carlos Bustos-Lopez
Captulo 5
Inferencia Estadstica
5.1. Estimacion
En las secciones anteriores hemos visto distintas formas de como describir
una o dos variables poblacionales, pero en general, tabajamos con una mues-
tra que corresponde a una parte de la poblacion y nuestro interes es poder
concluir algo sobre el comportamiento de la poblacion.
Para responder a las necesidades anteriores, es necesario que utilicemos
la Estadstica Inferencial.
Denicion 5.1.1 La Estadstica Inferencial, permite concluir, inferir y
deducir aspectos importantes de una poblacion mediante el analisis de una
muestra de ella.
Denicion 5.1.2 Muestra Aleatoria (m.a.): Consiste en un conjunto
de variables aleatorias independientes X
1
, X
2
, . . . , X
n
que tienen la misma
densidad de probabilidad f
X
(x|) de la variable X asociada a la poblacion.
170
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 171
Denicion 5.1.3 Espacio de Informacion ( ): Es el conjunto de to-
das las posibles muestras aleatorias de tama no n que se pueden obtener de la
poblacion. Es decir:
= {(x
1
, x
2
, . . . , x
n
) IR
n
|(x
1
, x
2
, . . . , x
n
) es una m.a. de X}.
Denicion 5.1.4 Estadstico o estadgrafo (T(X

)): Es cualquier fun-


cion de las variables aleatorias que forman la muestra aleatoria y que no
depende de cantidades desconocidas.
p.e.
1. T
1
=
1
n
n

i=1
X
i
2. T
2
=
1
n
n

i=1
X
2
i
3. T
3
=
1
n
n

i=1
(X
i


X)
2
Denicion 5.1.5 Espacio Parametrico (): El espacio parametrico es
el conjunto de todos los valores posibles que puede asumir un parametro pobla-
cional.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 172
5.2. Estimacion Puntual
Denicion 5.2.1 Parametro: Un parametro es una caracterstica de in-
teres en la poblacion, que tiene un valor jo, pero desconocido. Generalmente,
se denota con letras griegas (p.e. , , , , , etc.).
Una de las tecnicas mas utilizadas para poder describir el comportamien-
to de la poblacion es la estimacion del verdadero valor del parametro pobla-
cional, mediante un solo valor.
Existen numerosas tecnicas de estimacion puntual de los parametros, las
mas utilizadas son:
1. Metodo de los Momentos.
2. Metodo de Maxima Verosimilitud.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 173
3. Metodo de los Mnimos Cuadrados.
4. Metodos Bayesianos.
5. Metodos Robustos.
6. Metodos Computacionales.
5.2.1. Metodo de Maxima Verosimilitud
Denicion 5.2.2 La Funcion de Verosimilitud, corresponde a la fun-
cion de probabilidad conjunta de la muestra X

= (X
1
, . . . , X
n
) y esta dada
por:
L(|x

) =
n

i=1
f
X
i
(x
i
|) .
Ejemplo 5.2.1 Suponga que x

= (x
1
, x
2
, . . . , x
n
) son los datos asociados a
una muestra aleatoria (X
1
, X
2
, . . . , X
n
) de una poblacion Poisson, con fun-
cion de probabilidad dada por:
f
X
(x|) =

x
e

x!
.
La funcion de verosimilitud es:
L(|x

) =
n

i=1
f
X
i
(x
i
|) =
n

i=1

X
i
e

X
i
!
=
P
n
i=1
X
i
e
n

n
i=1
X
i
!
.
El objetivo es determinar el valor del parametro que maximiza la funcion
de verosimilitud. Donde tambien se dene la funcion de log-verosimilitud
como:
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 174
l() = ln
_

P
n
i=1
X
i
e
n

n
i=1
X
i
!
_
,
=
n

i=1
X
i
ln() n ln
_
n

i=1
X
i
!
_
,
=
n

i=1
X
i
ln() n
n

i=1
ln X
i
! ,
l

=
1

i=1
X
i
n = 0

MV
=

n
i=1
X
i
n
.
Luego,

=

X es el estimador maximo verosimail de .
Ejemplo 5.2.2 Sea una poblacion con funcion de densidad:
f
X
(x|) =
2
1
x
31
1
, si 0 x 1 .
El estimador maximo verosimil de es:
L(|X
1
, . . . , X
n
) =
n

i=1
2
1
X
31
1
i
,
=
_
2
1
_
n
_
n

i=1
X
i
_31
1
,
l(|X
1
, . . . , X
n
) = nln 2 + nln nln(1 ) +
3 1
1
n

i=1
ln X
i
,
l

=
n

+
n
1
+
3(1 ) + (3 1)
(1 )
2
n

i=1
ln X
i
= 0 ,
0 =
n

+
n
1
+
2
(1 )
2
n

i=1
ln X
i
,
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 175
2
(1 )
2
n

i=1
ln X
i
=
n


n
1
,
2
(1 )
2
n

i=1
ln X
i
=
n(1 ) + n
(1 )
,
2
(1 )
2
n

i=1
ln X
i
=
n
(1 )
,
2
(1 )
n

i=1
ln X
i
=
n

MV
=
n
n 2

n
i=1
ln X
i
.
Ejercicos Resueltos
1. Despues de varios reclamos de diferentes consumidores formulados al
SERNAC, la empresa de productos lacteos ZOPROLIN ha sido someti-
da a varias inspecciones para vericar la calidad del estado de conser-
vacion de la leche en envases tetra pack. Para ello a tomado una caja
al azar con 10 de estos envases donde se ha observado lo siguiente:
B, B, D, B, B, B, D, B, D, B ,
donde B la leche esta en buen estado, y D la leche esta descompuesta.
Con estos resultados, Cual es la probabilidad de que al tomar cualquier
otra caja se registren 2 envases con leche descompuesta?
Des.
Claramente, el estado de la leche B o D es una variable con un com-
portamiento que puede ser representado mediante un modelo Bernoulli
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 176
(X
i
Ber(p)), entonces el problema se reduce a determinar la mejor
estrategia para estimar p. De esa forma, el estimador MV, se puede
extraer de:
L(p|X
1
, . . . , X
n
) =
n

i=1
p
X
i
(1 p)
1X
i
,
= p
P
n
i=1
X
i
(1 p)
n
P
n
i=1
X
i
,
l(p|X
1
, . . . , X
n
) =
n

i=1
X
i
ln(p) + (n
n

i=1
X
i
) ln(1 p) ,
l
p
=

n
i=1
X
i
p
+
n

n
i=1
X
i
(1 p)
(1) = 0 ,
0 = (1 p)
n

i=1
X
i
p(n
n

i=1
X
i
) ,
p =
1
n
n

i=1
X
i
.
2. Considere una m.a., proveniente de una distribucion Poisson de parametro
. Determine el EMV de . Des.
L(|X
1
, . . . , X
n
) =
n

i=1

X
i
e

X
i
!
=

P
n
i=1
X
i
e
n

n
i=1
X
i
!
,
l(|X
1
, . . . , X
n
) =
n

i=1
X
i
ln() n ln
_
n

i=1
X
i
!
_
,
l

=
1

i=1
X
i
n = 0 ,

=
1
n
n

i=1
X
i
.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 177
3. Considere una m.a., proveniente de una distribucion Rayleigh de parametro

2
. Determine el EMV de
2
. Des.
L(
2
|X
1
, . . . , X
n
) =
n

i=1
X
i

2
e

X
2
i
2
2
,
=
1

2n
n

i=1
X
i
e

1
2
2
P
n
i=1
X
2
i
,
l(
2
|X
1
, . . . , X
n
) =
n

i=1
ln X
i
nln
2

1
2
2
n

i=1
X
2
i
,
l

2
=
n

n
i=1
X
2
i
2
(1)
(
2
)
2
= 0 ,

2
=

n
i=1
X
2
i
2n
.
4. Considere una m.a., proveniente de una distribucion Exponencial de
parametro . Determine el EMV de . Des.
L(|X
1
, . . . , X
n
) =
n

i=1
e
X
i
=
n
e

P
n
i=1
X
i
,
l(|X
1
, . . . , X
n
) = nln
n

i=1
X
i
,
l

=
n

i=1
X
i
= 0 ,

=
n

n
i=1
X
i
.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 178
5. Considere una m.a., proveniente de una distribucion Gama de paramet-
ros y . Determine el EMV de . Des.
L(|, X
1
, . . . , X
n
) =
n

i=1

()
X
1
i
e
X
i
,
=

n
()
n
_
n

i=1
X
i
_
1
e

P
n
i=1
X
i
,
l(|, X
1
, . . . , X
n
) = nln nln () + ( + 1)
n

i=1
ln X
i

i=1
X
i
,
l

=
n

i=1
X
i
= 0 ,

=
n

n
i=1
X
i
.
6. Considere una m.a., proveniente de una distribucion Weibull de paramet-
ros y . Determine el EMV de . Des.
L(|, X
1
, . . . , X
n
) =
n

i=1

X
1
i
e

(
X
i

,
=

n

n
_
n

i=1
X
i
_
1
e

P
n
i=1
(
X
i

,
l(|, X
1
, . . . , X
n
) = nln nln + ( 1)
n

i=1
ln X
i

i=1
X

,
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 179
l

=
n

i=1
X

i
()

+1
= 0 ,
n

i=1
X

+1
=
n

n
i=1
X

i
n
,

=
_
n
i=1
X

i
n
_
1/
.
7. Considere una m.a., proveniente de una distribucion Normal de paramet-
ros y . Determine los EMV de y . Des.
L(,
2
|X
1
, . . . , X
n
) =
n

i=1
1

2
2
e

1
2
2
(X
i
)
2
,
=
_
1
2
_
n/2
1
(
2
)
n/2
e

1
2
2
P
n
i=1
(X
i
)
2
,
l(,
2
|X
1
, . . . , X
n
) =
n
2
ln 2
n
2
ln
2

1
2
2
n

i=1
(X
i
)
2
,
l

=
1
2
2
2
n

i=1
(X
i
)(1) = 0 ,
l

2
=
n
2
2

1
2
n

i=1
(X
i
)
2
(1)
(
2
)
2
= 0 ,

n
i=1
(X
i
)

2
= 0 =
1
n
n

i=1
X
i
,

n
i=1
(X
i
)
2
2(
2
)
2
=
n
2
2

2
=
1
n
n

i=1
(X
i
)
2
.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 180
8. Considere una m.a., proveniente de una distribucion f
X
(x|) = ( +
1)x

de parametro . Determine el EMV de . Des.


L(|X
1
, . . . , X
n
) =
n

i=1
( + 1)X

i
,
= ( + 1)
n
n

i=1
X

i
,
l(|X
1
, . . . , X
n
) = nln( + 1) +
n

i=1
ln X
i
,
l

=
n
+ 1
+
n

i=1
= ln X
i
= 0 ,

=
_
n

n
i=1
ln X
i
+ 1
_
.
5.2.2. Metodo de los Momentos
Consiste en sustituir los momentos poblacionales de la distribucion con
los respectivos momentos muestrales. Luego se construye un sistema de ecua-
ciones p-dimencional
1
.
Denicion 5.2.3 Sea x

= (x
1
, x
2
, . . . , x
n
) los datos asociados a una m.a.,
(X
1
, X
2
, . . . , X
n
), se dene el momento muestral de orden k (k IN),
como:
m
k
=
1
n
n

i=1
x
k
i
.
1
El fundamento de esta tecnica es la convergencia de los momentos muestrales a los
momentos poblacionales a medida que el tama no de la muestra n aumenta.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 181
Denicion 5.2.4 Sea X una v.a., se dene el momento poblacional de
orden k (k IN), como:

k
= IE(X
k
) =
_

xB
x
k
p
X
(x) , si X es discreta.
_

x
k
f
X
(x|) , si X es continua.
Si p es el n umero de parametros a estimar, entonces el estimador de momentos
de se obtiene al resolver el sistema
2
:

1
= m
1

2
= m
2
.
.
.

p
= m
p
Ejemplo 5.2.3 Suponga que (X
1
, X
2
, . . . , X
n
) es una m.a., de una poblacion
Poisson, con parametro . En este caso hay un solo parametro y se necesita
solo una ecuacion:

1
= m
1
= =
1
n
n

i=1
x
i
=

= x .
Ejemplo 5.2.4 Sea una poblacion con funcion de densidad:
f
X
(x|) =
2
1
x
31
1
, si 0 x 1 .
2
Este sistema podra ser no lineal.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 182
El estimador por el metodo de los momentos de es:
IE(X) =
2
1
_
1
0
x x
31
1
dx ,
=
2
1
_
1
0
x
2
1
dx ,
=
2
1
x
2
1
+1
2
1
+ 1

1
0
,
=
2
1
1
1
1
,
=
2
1 +
.
=
2
1 +
=

X ,
2 =

X( + 1) ,
2 =

X +

X ,
2

X =

X ,
(2

X) =

X ,

X
2

X
.
5.2.3. Propiedades de los Estimadores Puntuales
1. Insesgamiento
Denicion 5.2.5 Un estimador es Insesgado, si el valor medio
de todas sus estimaciones obtenidas con una muestra de tama no n, es
igual al parametro que estima. Por lo tanto, si es el parametro y

su
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 183
estimador insesgado, se debe cumplir que:
IE(

) = .
Teorema 5.2.1 Si X
1
, X
2
, . . . , X
n
es una m.a., de n variables que
tienen la misma media y la misma varianza
2
, se cumple que

X, la
media de la muestra, es un estimador insesgado de y su varianza es

2
/n.
Proof: Sea

X =
1
n

n
i=1
X
i
, entonces,
IE(

X) = IE
_
n
i=1
X
i
n
_
,
=
1
n
n

i=1
IE(X
i
) ,
=
1
n
n

i=1
,
=
n
n
,
= .
Luego,

X es un estimador insesgado del parametro .
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 184
Por otra parte:
VVar(

X) = VVar
_
n
i=1
X
i
n
_
,
=
1
n
2
n

i=1
VVar(X
i
) ,
=
1
n
2
n

i=1

2
,
=
n
n
2

2
,
=

2
n
.
Teorema 5.2.2 Si la varianza S
2
de una m.a., de tama no n, de una
poblacion con media y varianza
2
, se dene como:
S
2
=
1
n 1
n

i=1
(X
i


X)
2
,
se cumple que IE(S
2
) =
2
, es decir S
2
es un estimador insesgado de
la varianza de la poblacion.
Proof:
IE(S
2
) = IE
_
1
n 1
n

i=1
(X
i


X)
2
_
,
=
1
n 1
n

i=1
IE(X
i


X)
2
,
=
1
n 1
n

i=1
IE(X
2
i
2X
i

X +

X
2
) ,
=
1
n 1
n

i=1
_
IE(X
2
i
) 2IE(X
i

X) + IE(

X
2
)
_
,
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 185
Pero,
IE(X
2
i
) =
2
+
2
,
IE(

X
2
) =

2
n
+
2
,
IE(X
i

X) = IE
_
X
i

n
j=1
X
j
n
_
,
=
1
n
n

j=1
IE(X
i
X
j
) ,
=
1
n
_
n

j=1,i=j
IE(X
i
X
j
) + IE(X
2
i
)
_
,
=
1
n
_
(n 1)
2
+
2
+
2
_
,
=
n
n

2
+

2
n
,
=
2
+

2
n
,
IE(S
2
) =
1
n 1
n

i=1
_

2
+
2
2
_

2
+

2
n
_
+

2
n
+
2
_
,
=
2
.
Teorema 5.2.3 Si el estimador p de la proporcion p de elementos de
una poblacion que tienen cierto atributo se dene como:
p =

n
i=1
X
i
n
, X
i
=
_

_
1 elemento i-esimo posee el atributo.
0 si no.
Se cumple que p es un estimador insesgado de p, y la varianza de p es
p(1 p)/n.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 186
Proof:
IE( p) = IE
_
n
i=1
X
i
n
_
=
1
n
n

i=1
X
i
,
pero
IE(X
i
) = 1 p + 0 (1 p) = p ,
entonces,
IE( p) =
1
n
n

i=1
p =
n
n
p = p .
VVar( p) = VVar
_
1
n
n

i=1
X
i
_
=
1
n
2
n

i=1
VVar(X
i
) ,
pero
VVar(X
i
) = IE(X
2
i
) IE
2
(X
i
) = p p
2
= p(1 p) ,
entonces,
VVar( p) =
1
n
2
n

i=1
p(1 p) =
n
n
2
p(1 p) =
p(1 p)
n
.
Ejemplo 5.2.5 Consideremos la siguiente poblacion P{1, 2, 3, 4}. La
media y la varianza poblacionales son respectivamente 2.5 y 1.25. Sacare-
mos todas las muestras posibles con sustitucion de tama no 2 y evalua-
remos en cada una la media y su varianza y vericaremos que son
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 187
estimadores insesgados.
Muestra

X
i
S
2
i
Muestra

X
i
S
2
i
(1, 1) 1 0 (3, 1) 2 2
(1, 2) 1, 5 0, 5 (3, 2) 2, 5 0, 5
(1, 3) 2 2 (3, 3) 3 0
(1, 4) 2, 5 4, 5 (3, 4) 3, 5 0, 5
(2, 1) 1, 5 0, 5 (4, 1) 2, 5 4, 5
(2, 2) 2 0 (4, 2) 3 2
(2, 3) 2, 5 0, 5 (4, 3) 3, 5 0, 5
(2, 4) 3 2 (4, 4) 4 0
Note que,

X =

16
i=1

X
i
/16 = 40/16 = 2,5, que corresponde a la media
poblacional. Ademas,

16
i=1
S
2
i
/16 = 20/16 = 1,25, que es la varianza
de la poblacion.
2. Consistencia
La consistencia de un estimador esta relacionada con su proximidad al
parametro que estima cuando el tama no de la muestra que se utiliza
tiende a ser innita. Este es el concepto de convergencia en probabili-
dad.
Denicion 5.2.6 Un estimador

de un parametro es consistente
si se cumple que:
lm
n
IP(|

| ) = 1 .
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 188
Teorema 5.2.4 Si

es un estimador del parametro que cumple:
a) lm
n
IP(IE(

) ) = 0.
b) lm
n
VVar(

) = 0.
entonces,

es un estimador consistente.
Ejemplo 5.2.6 De una poblacion con media IE(X) = y varianza
VVar(X) =
2
, se extrae una m.a., (X
1
, X
2
, . . . , X
n
). Determine que

X
y S
2
son consistente.
lm
n
IP(IE(

X) ) = lm
n
IP( ) = 0 ,
lm
n
VVar(

) = lm
n

2
n
= 0 .


X es consistente.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 189
lm
n
IP(IE(S
2
)
2
) = lm
n
VVar
_
n
i=1
(X
i


X)
2
n 1
_
,
= lm
n
1
(n 1)
2
VVar
_
n

i=1
(X
i


X)
2
_
,
= lm
n
1
(n 1)
2
VVar
_
n

i=1
(X
2
i
2X
i

X +

X
2
)
_
,
= lm
n
1
(n 1)
2
VVar
_
n

i=1
X
2
i
n

X
2
_
,
= lm
n
1
(n 1)
2
VVar
_
n

i=1
X
2
i
_
,
= lm
n
1
(n 1)
2
_
n

i=1
VVar(X
2
i
) + 2

i<j
Cov(X
i
, X
j
)
_
,
= lm
n
1
(n 1)
2
_
n

i=1
(
2
+
2
)
_
,
= lm
n
n
(n 1)
2
_

2
+
2
_
= 0 .
Teorema 5.2.5 Si

1
es un estimador consistente del parametro
1
y

2
es un estimador consistente del parametro
2
se cumple que:
a)

1
+

2
es un estimador consistente de
1
+
2
.
b)

2
es un estimador consistente de
1

2
.
c)

1
/

2
es un estimador consistente de
1
/
2
.
3. Varianza Mnima
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 190
Denicion 5.2.7 Un estimador insesgado de un parametro es llamado
de varianza mnima, cuando tiene la menor varianza entre todos los
posibles estimadores insesgados del parametro
3
.
Ejemplo 5.2.7 Suponga que de una poblacion con IE(X) = y VVar(X) =

2
se saca una muestra de tama no 3. Decida cual de los siguientes es-
timadores es mejor:

1
=
1
4
X
1
+
1
2
X
2
+
1
4
X
3
.

2
=

X .
Des.
IE(

1
) = IE
_
1
4
X
1
+
1
2
X
2
+
1
4
X
3
_
,
=
1
4
IE(X
1
) +
1
2
IE(X
2
) +
1
4
IE(X
3
) ,
=
1
4
+
1
2
+
1
4
,
= .
3
El estimador que tenga la menor varianza es tambien llamado el mejor de todos los
estimadores.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 191
Luego

1
es insesgado.
IE(

2
) = IE
_

X
_
= IE
_
1
3
3

i=1
X
i
_
,
=
1
3
3

i=1
IE(X
i
) ,
=
1
3
3

i=1
,
= .
Luego

2
es insesgado.
VVar(

1
) = VVar
_
1
4
X
1
+
1
2
X
2
+
1
4
X
3
_
,
=
1
4
2
VVar(X
1
) +
1
2
2
VVar(X
2
) +
1
4
2
VVar(X
3
) ,
=
1
4
2

2
+
1
2
2

2
+
1
4
2

2
,
=
3
8

2
.
VVar(

2
) = VVar
_

X
_
= VVar
_
1
3
3

i=1
X
i
_
,
=
1
3
2
3

i=1
VVar(X
i
) ,
=
1
3
2
3

i=1

2
,
=

2
3
.
Luego

2
es mejor, puesto que tiene menor varianza.
4. Error Cuadratico Medio
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 192
Denicion 5.2.8 El error cuadratico medio es el valor esperado
de la desviacion cuadratica entre el estimador y el parametro que esti-
ma.
MSE() = IE(

)
2
,
= VVar(

) + b
2
() ,
= IE[(

IE(

))
2
] + (IE(

) )
2
.
De acuerdo a los valores que pueda tomar el parametro, es posible que
un estimador sesgado sea mejor que uno insesgado.
Ejemplo 5.2.8 Suponga que

1
y

2
son dos estimadores del parametro
. Sebemos que:
IE(

1
) = VVar(

1
) = 3 ,
IE(

2
) = 0,9 VVar(

1
) = 2 .
Des.
MSE(

1
) = 3 + ( )
2
= 3 ,
IE(

2
) = 2 + (0,9 )
2
= 2 + 0,01
2
.
Si || > 10,

1
es mejor que

2
.
Si || < 10,

2
es mejor que

1
.
5. Suciencia
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 193
Dada una poblacion distribuida f
X
(x|), que depende de un solo parametro
se saca una muestra aleatoria (X
1
, X
2
, . . . , X
n
) y una estadstica

= g(X
1
, X
2
, . . . , X
n
) es utilizada para estimar .
Dado que

es una sola variable aleatoria, y disponamos de n variables
aleatorias, cabe preguntarse si se perdio alguna informacion al usar

.
Por ejemplo, si

= X
1
, es evidente que no fue usada toda la informa-
cion.
Denicion 5.2.9 Una estadstica

que contenga toda la informa-
cion respecto al parametro que esta en la muestra, recibe el nombre
de Estadstica Suciente. Ning un otro estimador denido con la
misma muestra puede suministrar informacion adicional respecto a .
Teorema 5.2.6 Sea (X
1
, X
2
, . . . , X
n
) una m.a., sacada de la poblacion
f
X
(x|). Si:
g(X
1
, X
2
, . . . , X
n
|) =
n

i=1
f
X
(x
i
|) ,
y
n

i=1
f
X
(x
i
|) = h(

, )g(x
1
, x
2
, . . . , x
n
) ,
en donde g(x
1
, x
2
, . . . , x
n
) no depende de , entonces

es una estadsti-
ca suciente para .
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 194
Ejemplo 5.2.9 Sea (X
1
, X
2
, . . . , X
n
) de X N(, 1).
n

i=1
1

2
e

1
2
(x
i
)
2
= (2)

n
2
e

1
2
P
n
i=1
(x
i
)
2
,
= (2)

n
2
e

1
2
P
n
i=1
((x
i
x)( x))
2
,
= (2)

n
2
e

1
2
[
P
n
i=1
(x
i
x)
2
+n( x)
2
]
,
= (2)

n
2
e

1
2
P
n
i=1
(x
i
x)
2
e

1
2
n( x)
2
.
Luego x es estadstica suciente para .
6. Suciente Minimal
Una estadstica suciente que resume los datos tanto como sea posible
es llamada Estadstica Suciente Minimal.
Para encontrar estadsticas sucientes minimales uasaremos metodos
de Lehmann y Schee.
Denicion 5.2.10 Sean x
1
, x
2
, . . . , x
n
e y
1
, y
2
, . . . , y
n
dos conjuntos de
valores que toman todas las variables (X
1
, X
2
, . . . , X
n
) de la m. a. Si
se forma la razon:
f(x
1
|)f(x
2
|) f(x
n
|)
f(y
1
|)f(y
2
|) f(y
n
|)
,
esta razon no incluira al parametro si existe una funcion g tal que:
g(x
1
, x
2
, . . . , x
n
) = g(y
1
, y
2
, . . . , y
n
) ,
en tal caso g(y
1
, y
2
, . . . , y
n
) es la estadstica suciente minimal para .
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 195
Ejemplo 5.2.10 Sea X Ber(n, p), se forma la razon:
p
x
1
(1 p)
1x
1
p
x
n
(1 p)
1x
n
p
y
1
(1 p)
1y
1
p
y
n
(1 p)
1y
n
=
p
P
n
i=1
x
i
(1 p)
n
P
n
i=1
x
i
p
P
n
i=1
y
i
(1 p)
n
P
n
i=1
y
i
,
=
p
P
n
i=1
x
i

P
n
i=1
y
i
(1 p)
n
P
n
i=1
y
i

(
n
P
n
i=1
x
i)
,
=
p
P
n
i=1
x
i

P
n
i=1
y
i
(1 p)
P
n
i=1
x
i

P
n
i=1
y
i
,
=
_
p
1 p
_
P
n
i=1
x
i

P
n
i=1
y
i
,
si

n
i=1
x
i
=

n
i=1
y
i
la razon es independiente de p. Luego g =

n
i=1
y
i
es estadstica minimal suciente. Es decir, p =

n
i=1
y
i
/n es estimador
que contiene toda la informacion de la muestra con un mnimo de
datos
4
.
7. Eciencia
En el estudio de la consistencia de un estimador se percibe que mientras
menor es la varianza de un estimador incrementa la posibilidad de
obtener estimaciones mas proximas al verdadero valor del parametro
que se estima. Luego, mientras mas peque na es su varianza, mayor es
la eciencia del estimador.
Denicion 5.2.11 Un estimador insesgado

es el mas eciente de
todos los estimadores insesgados si su varianza satisface la cota inferior
4
Este es, por lo tanto, un estimador insesgado lineal de mnima varianza (MVUE).
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 196
de la desigualdad de Rao-Cramer.
VVar(

)
1
nIE
_
_
lnf
X
(x|)

_
2
_ .
Ejemplo 5.2.11 Si

X es evaluado con valores de una m. a., (X
1
, X
2
, . . . , X
n
)
sacada de una distribucion normal con varianza
2
0
conocida, demostrar
que

X es el estimador mas eciente para estimar la media .
f
X
(x|) =
1
_
2
2
0
e

1
2
2
0
(x)
2
,
lnf
X
(x|) =
1
2
ln(2
2
0
)
1
2
2
0
(x )
2
,
lnf
X
(x|)

=
2(x )
2
2
0
(1) ,
IE
_
_
lnf
X
(x|)

_
2
_
= IE
_
_
2(x )
2
2
0
_
2
_
=
1

4
0
IE[(x )
2
] ,
IE
_
_
lnf
X
(x|)

_
2
_
=

2
0

4
0
,
nIE
_
_
lnf
X
(x|)

_
2
_
=
n

2
0
,
1
nIE
_
_
lnf
X
(x|)

_
2
_ =

2
0
n
= VVar(

X) .
Luego

X es un estimador eciente de la media poblacional , puesto
que alcanza la cota de Rao-Cramer.
8. Eciencia Relativa
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 197
Denicion 5.2.12 Si hay dos estimadores

1
y

2
insesgado, para el
mismo parametro el estimador

2
es mas eciente que

1
si:
VVar(

2
) < VVar(

1
) ,

VVar(

2
)
VVar(

1
)
< 1 .
Nos enfocaremos principalmente en el metodo de Maxima Verosimili-
tud
Propiedades de los estimadores de Maxima Verosimilitud (MV).
1. Insesgamiento: Los estimadores MV pueden ser sesgados, pero al incre-
mentar el tama no de la muestra n se hacen asintoticamente insesgados.
2. Consistencia: Bajo condiciones regulares los estimadors MV son con-
sistentes.
3. Invarianza: Si existe una funcion de un parametro, se obtiene un esti-
mador de la funcion sustituyendo el parametro por su estimador MV.
p.e. g() es estimada por g() = g(

) . Distribucion Asint oticamente


Normal

N(, VVar()) .
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 198
Par ametro Estimador Puntual
Media

X =
P
n
i=1
X
i
n
Varianza
2
S
2
=
P
n
i=1
(X
i

X)
2
n1
Proporcion p =
P
n
i=1
Y
i
n
, donde Y
i
=
_

_
1 cumple condicion
0 si no
Correlacion r
XY
=
P
n
i=1
X
i
Y
i
n

X

Y
q
(
P
n
i=1
X
2
i
n

X
2
)(
P
n
i=1
Y
2
i
n

Y
2
)
5.2.4. Estimacion Intervalar
Otro procedimiento que permite tener una estimacion del verdadero va-
lor del parametro poblacional es, mediante intervalos de conanza, es decir,
construir rangos de valores posibles para el verdadero valor del parametro
mediante la distribucion asociada al estimador del parametro de interes.
Denicion 5.2.13 Un intervalo de conanza de un nivel de (1)100 %,
para el parametro , esta dado por:
P (LI

LS

) = 1 ,
donde LI

corresponde al lmite inferior de la estimacion para el parametro


y LS

corresponde al lmite superior de la estimacion para el parametro .


Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 199
De esa forma, si se desea construir un intervalo de conanza con un nivel de
(1) 100 % para , es necesario conocer la distribucion muestral de

que
es el estimador puntual de .
En general, los estimadosres de maxima verosimilitud tienen las siguientes
distribuciones:

X N
_
,

2
n
_
, si n es grande.
(

X)

n
S
t
(n1)
, si n es peque no.
p N
_
,
(1)
n
_
.
S
2


2
(n1)

2
(n1)
.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 200
Intervalo de conanza para la media con varianza conocida:
IC() =
_

X Z
1

n
;

X + Z
1

n
_
IP
_

X Z
1

n


X + Z
1

n
_
= 1
Intervalo de conanza para la media con varianza desconocida y n lo
sucientemente grande
5
(n ):
IC() =
_

X Z
1

2
S

n
;

X + Z
1

2
S

n
_
5
Tama nos muestrales de al menos 30 observaciones, han entregado buenos resultados
al ser considerados como grandes.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 201
IP
_

X Z
1

2
S

n


X + Z
1

2
S

n
_
= 1
Intervalo de conanza para la media con varianza desconocida y n
peque no:
IC() =
_

X t
(
n1 , 1

2
)
S

n
;

X + t
(
n1 , 1

2
)
S

n
_
IP
_

X t
(
n1 , 1

2
)
S

n


X + t
(
n1 , 1

2
)
S

n
_
= 1
Intervalo de conanza para la varianza:
IC(
2
) =
_
_
(n 1)S
2

2
(
n1 , 1

2
)
;
(n 1)S
2

2
(
n1 ,

2
)
_
_
IP
_
_
(n 1)S
2

2
(
n1 , 1

2
)

2

(n 1)S
2

2
(
n1 ,

2
)
_
_
= 1
Intervalo de conanza para la proporcion:
IC() =
_
p Z
1

2
_
p(1 p)
n
; p + Z
1

2
_
p(1 p)
n
_
IP
_
p Z
1

2
_
p(1 p)
n
p + Z
1

2
_
p(1 p)
n
_
= 1
Ejemplo 5.2.12 Las manadas de lobos son territoriales, con territorios de
130km
2
o mas. Se piensa que los aullidos de los lobos, que comunican tanto
de la situacion como de la composicion de la manada, estan relacionados
con la territorialidad. Se obtuvieron los siguientes valores para la duracion
en minutos de una sesion de aullidos de una determinada manada sometida
a estudio.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 202
1.0 1.8 1.6 1.5 2.0 1.8
1.2 1.9 1.7 1.6 1.6
1.7 1.5 1.4 1.4 1.4
Una estimacion puntual para la duracion media de una sesion de aullidos
en esta manada es x = 1,57 minutos.
La varianza muestral para estos datos es s
2
= 0,066(minutos)
2
.
Nos interesa determinar los rangos maximo y mnimo de la duracion
promedio de los aullidos.
Si consideramos un intervalo de conanza del 95 %, se tiene que:
IC() = 1,57 2,131
0,26

16
,
= 1,57 0,14 ,
= (1,43 minutos; 1,71 minutos) .
Si consideramos un intervalo de conanza del 99 %, se tiene que:
IC() = 1,57 2,947
0,26

16
,
= 1,57 0,19 ,
= (1,38 minutos; 1,76 minutos) .
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 203
5.3. Docima de Hipotesis
5.3.1. Introduccion
Denicion 5.3.1 Una Docima de hipotesis estadstica es, la comprobacion
de una armacion o conjetura sobre alg un parametro de la poblacion. Basica-
mente se pueden distinguir dos tipos de hipotesis:
Hipotesis Nula (H
0
): Es el verdadero estado de la naturaleza (Sin
cambio).
Hipotesis Alternativa (H
1
): Es el posible estado de la naturaleza
(Despues del cambio).
Basicamente, existen dos formas de docimas de hipotesis, las docimas
unilaterales (una cola) y las bilaterales (dos colas).
H
0
:
0
v/s H
1
: <
0
H
0
:
0
v/s H
1
: >
0
H
0
: =
0
v/s H
1
: =
0
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 204
5.3.2. Docimas
Para plantear una hipotesis estadstica se pueden seguir los siguientes
pasos:
1. Establesca la hipotesis nula y alternativa en el contexto del problema.
2. Establesca la hipotesis nula y alternativa estadsticas.
3. Seleccione un nivel de signicancia.
4. Describa la distribucion de la poblacion y del estadgrafo.
5. Calcule el estadstico de prueba.
6. Determine el o los valores crticos.
7. Dena la region de rechazo de la hipotesis nula (regla de decision).
8. Tome la decision con respecto de la hipotesis nula.
9. Interprete sus resultados en el contexto del problema.
Al momento de realizar una docima de hipotesis, tambien hay que con-
siderar que se pueden cometer los siguientes errores:
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 205
H
0
Decision sobre H
0
Verdadera Falsa
Aceptar H
0
Decision Correcta Error Tipo II
1
Rechazar H
0
Error Tipo I Decision Correcta
1
Se preere siempre que > .
5.3.3. Docimas Univariadas
Ejemplo 5.3.1 La contaminacion de los ros por metales pesados, constituye
una de las mayores preocupaciones de los gobiernos. Se sabe que el nivel
de metilmercurio tiene una distribucion normal con varianza conocida de
9(g/g)
2
. Queremos saber si los resultados obtenidos en el ultimo estudio el
nivel medio de metilmercurio es superior a 21,0(g/dl).
Podemos plantear las siguientes hipotesis:
H
0
: 21,0(g/g) El nivel medio de metilmercurio no es superior a
21,0(g/g).
H
1
: > 21,0(g/g) El nivel medio de metilmercurio no es superior a
21,0(g/g).
Supongamos que tomamos una muestra de 16 observaciones de agua,
dispuestas uniformemente a lo largo de la rivera, con lo que tendremos
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 206
x
1
, . . . , x
16
.
x =

16
i=1
x
i
16
.
Si x es muy grande, tenderemos a rechazar H
0
, pero estaremos tomando
una buena decision? o estas diferencias se deben solo al azar o variabilidad
natural de la poblacion.
Entonces, debemos determinar un valor lmite que nos permita estable-
cer que, si el valor muestral es superior (menor) a este valor de tolerancia,
entonces diremos que la muestra tiene un valor estadsticamente superior
(menor) al de la poblacion, con una signicacion de 100 %.
Estos valores lmites, se pueden establecer mediante las distribuciones
asociadas a los estimadores muestrales, de la siguiente forma, sean:
Z
c
=
(

X
0
)

N(0, 1).
t
c
=
(

X
0
)

n
S
t
(n1)
.
Z
c
=
( pp
0
)
q
p
0
(1p
0
)
n
N(0, 1).

2
c
=
(n1)S
2

2
0

2
(n1)
.
Docima de hipotesis para la media con varianza conocida. El estadstico
adecuado es:
Z
c
=
(

X
0
)

N(0, 1) .
Y las Hipotesis son:
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 207
H
0
H
1
Existe evidencia en contra de H
0
si:
=
0
=
0
|Z
c
| > Z
1

2

0
>
0
Z
c
> Z
1

0
<
0
Z
c
< Z

Docima de hipotesis para la media con varianza desconocida y n 30.


El estadstico adecuado es:
Z
c
=
(

X
0
)

n
S
N(0, 1) .
Y las Hipotesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
=
0
=
0
|Z
c
| > Z
1

2

0
>
0
Z
c
> Z
1

0
<
0
Z
c
< Z

Docima de hipotesis para la media con varianza desconocida y n < 30.


El estadstico adecuado es:
t
c
=
(

X
0
)

n
S
t
(n1)
.
Y las Hipotesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
=
0
=
0
|t
c
| > t
(n1,1

2
)

0
>
0
t
c
> t
(n1,1)

0
<
0
t
c
< t
(n1,)
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 208
Docima de hipotesis para la proporcion. El estadstico adecuado es:
Z
c
=
( p p
0
)
_
p
0
(1p
0
)
n
N(0, 1) .
Y las Hipotesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:
= p
0
= p
0
|Z
c
| > Z
1

2
p
0
> p
0
Z
c
> Z
1
p
0
< p
0
Z
c
< Z

Docima de hipotesis para la varianza. El estadstico adecuado es:

2
c
=
(n 1)S
2

2
0

2
(n1)
.
Y las Hipotesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:

2
=
2
0

2
=
2
0

2
c
>
2
(n1,1

2
)

2
c
<
2
(n1,

2
)

2

2
0

2
>
2
0

2
c
>
2
(n1,1)

2

2
0

2
<
2
0

2
c
<
2
(n1,)
Ejemplo 5.3.2 Retomando, del ejemplo anterior se tiene que la muestra
presenta los siguientes resultados:
16.2 23.3 35.4 15.3 25.2 16.1 27.4 12.5
34.6 45.7 24.2 10.0 9.3 14.2 35.2 12.3
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 209
Lo cual nos entrega el siguiente promedio x = 22,31. Entonces,
Z
c
=
(22,31 21)

16
3
= 1,75 .
De esa forma, se se considera un nivel de conanza del 95 %, el estadstico
con el cual debemos comparar es con Z
0,975
= 1,96.
Y como 1,75 < 1,96, entonces no existe evidencia para rechazar H
0
:
21,0(g/g), el nivel medio de metilmercurio no es superior a 21,0(g/g), con
5 % de signicacion.
5.3.4. Docimas Bivariadas
Supongamos ahora que, no solo nos interesa saber que sucede con una
poblacion, si no que estamos interesados en comparar dos conjuntos de datos,
para determinar si corresponden a poblaciones diferentes.
Docima de hipotesis para la comparacion de medias con varianzas cono-
cidas. El estadstico adecuado es:
Z
c
=
(

X
1


X
2
)
0
_

2
1
n
1
+

2
2
n
2
N(0, 1) .
Y las Hipotesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:

2
=
0

1

2
=
0
|Z
c
| > Z
1

2

0

1

2
>
0
Z
c
> Z
1

2

0

1

2
<
0
Z
c
< Z

Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 210
Docima de hipotesis para la comparacion de medias con varianzas des-
conocidas y n
1
30 y n
2
30. El estadstico adecuado es:
Z
c
=
(

X
1


X
2
)
0
_
S
2
1
n
1
+
S
2
2
n
2
N(0, 1) .
Y las Hipotesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:

2
=
0

1

2
=
0
|Z
c
| > Z
1

2

0

1

2
>
0
Z
c
> Z
1

2

0

1

2
<
0
Z
c
< Z

Docima de hipotesis para la comparacion de medias con varianzas des-


conocidas y n
1
< 30 y n
2
< 30, pero
2
1
y
2
2
son estadsticamente
iguales.
El estadstico adecuado es:
t
c
=
(

X
1


X
2
)
0
S
p
_
1
n
1
+
1
n
2
t
(n
1
+n
2
2)
,
donde
S
2
p
=
(n
1
1)S
2
1
+ (n
2
1)S
2
2
n
1
+ n
2
2
.
Y las Hipotesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:

2
=
0

1

2
=
0
|t
c
| > t
(n
1
+n
2
2,1

2
)

2

0

1

2
>
0
t
c
> t
(n
1
+n
2
2,1)

2

0

1

2
<
0
t
c
< t
(n
1
+n
2
2,)
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 211
Docima de hipotesis para la comparacion de medias con varianzas des-
conocidas y n
1
< 30 y n
2
< 30 pero
2
1
y
2
2
son estadsticamente
distintas.
El estadstico adecuado es:
t
c
=
(

X
1


X
2
)
0
_
S
2
1
n
1
+
S
2
2
n
2
t
()
,
donde
=
_
S
2
1
n
1
+
S
2
2
n
2
_
2

S
2
1
n
1

2
n
1
1
+

S
2
2
n
2

2
n
2
1
.
Y las Hipotesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:

2
=
0

1

2
=
0
|t
c
| > t
(,1

2
)

2

0

1

2
>
0
t
c
> t
(,1)

2

0

1

2
<
0
t
c
< t
(,)
Docima de hipotesis para muestras pareadas.
El estadstico adecuado es:
t
c
=

d
0
S
d

n
t
(n1)
.
Y las Hipotesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:

0

d
=
0
|t
c
| > t
(n1,1

2
)

d

0

d
>
0
t
c
> t
(n1,1)

d

0

d
<
0
t
c
< t
(n1,)
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 212
Donde

d =

n
i=1
(x
i
y
i
)/n y S
2
d
=

n
i=1
(d
i


d)/(n 1), con n el
n umero de observaciones conjuntas para la variable X antes y despues
del tratamiento.
Docima de hipotesis para la comparacion de proporciones. El estadstico
adecuado es:
Z
c
=
( p
1
p
2
)
0
_
p
1
(1p
1
)
n
1
+
p
2
(1p
2
)
n
2
N(0, 1) .
Y las Hipotesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:

2
=
0

1

2
=
0
|Z
c
| > Z
1

2

0

1

2
>
0
Z
c
> Z
1

2

0

1

2
<
0
Z
c
< Z

Docima de hipotesis para la comparacion de varianzas. El estadstico


adecuado es:
F
c
=
S
2
1
S
2
2

F
(n
1
1,n
2
1)
.
Y las Hipotesis son:
H
0
H
1
Existe evidencia en contra de H
0
si:

2
1

2
2
=

2
1

2
2
= F
c
>
1

F
(n
1
1,n
2
1,1

2
)
F
c
<
1

F
(n
1
1,n
2
1,

2
)

2
1

2
2


2
1

2
2
> F
c
>
1

F
(n
1
1,n
2
1,1)

2
1

2
2


2
1

2
2
< F
c
<
1

F
(n
1
1,n
2
1,)
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 213
Ejemplo 5.3.3 En un estudio sobre habitos de alimentacion en murcielagos,
se marcan 25 hembras y 11 machos y se les rastrea por radio. Una variable
de interes es la distancia que recorre volando en una pasada en busca de
alimento, se cree que las hembras hacen un recorrido mayor que los machos.
El experimento proporciono la siguiente informacion:
Hembras Machos
n
1
= 25 n
2
= 11
x
1
= 205 metros x
2
= 135 metros
s
1
= 100 metros s
2
= 95 metros
Como s
2
1
/s
2
2
= 100
2
/95
2
= 1,11, se puede considerar que las varianzas
son estadsticamente iguales.
De esa froma se tiene que al realizar la prueba con un 5 % de signicacion:
La hipotesis intrnseca es, H
0
:
1
=
2
versus H
1
:
1
=
2
, as:
t
c
=
(205 135) 0
98,56
_
1
25
+
1
11
= 1,96 ,
y al ser comparado con el valor del estadstico de tabla t
(
25+112,1
0,05
2
)
=
2,0322.
Se tiene que no hay evidencia para rechazar H
0
, es decir, no existen difer-
encias signicativas entre las distancias recorridas por los distintos grupos.
Ademas, el valor p > 0,0608, que es mayor que el nivel de signicacion.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 214
5.4. Docimas de Hipotesis No Parametricas
5.4.1. Prueba de Suma de Rangos de Wilcoxon
Es una alternativa a la prueba t para comparar medias cuando no se
cumple el supuesto de normalidad y cuando las muestras son independientes.
Denicion 5.4.1 Sean X
1
, X
2
, . . . , X
n
1
y Y
1
, Y
2
, . . . , Y
n
2
muestras aleato-
rias de dos poblaciones que dieren solo en su medida de tendencia central.
Ademas, las poblaciones tienen la misma forma y dispersion, pero no nece-
sariamente normales.
El procedimiento para la prueba es primero, determinar el rango o posicion
de cada dato en la muestra combinada. Luego se calcula la suma de rangos
para la estadstica T de solo los datos de la primera muestra. Si n
1
10 y
n
2
10, la distribucion de T es aproximadamente normal. Y el estadstico
de prueba es:
Z
c
=
T IE(T)
_
VVar(T)
N(0,1) ,
donde IE(T) = n
1
(n
1
+n
2
+ 1)/2 y VVar(T) = n
1
n
2
(n
1
+ n
2
+ 1)/12.
Y las hipotesis son:
H
1
Existe evidencia en contra de H
0
si:
f
1
(x) esta desplazada de f
2
(y) |Z
c
| > Z
1

2
f
1
(x) esta desplazada hacia la derecha de f
2
(y) Z
c
> Z
1
f
1
(x) esta desplazada hacia la derecha de f
2
(y) Z
c
< Z

Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 215
Ejemplo 5.4.1 Una compa na de taxis quiere probar dos programas para
mejorar el uso del combustible por partye de sus choferes. A los conductores
del programa A, se les asigna un rendimiento objetivo y se les da un bono
cuando lo superan. A los conductores del programa B se les otorga una cuota
mensual maxima de gasolina, si esta se agota, el chofer debera pagar de su
bolsillo la gasolina extra. Todos los taxis son del mismo modelo y se les da
el mismo mantenimiento. Despues de 3 meses, se calcula el rendimiento de
cada chofer en millas recorridas por galon de combustible. Los datos basados
en dos muestras independientes son los siguientes:
A 22, 17 24, 25 26, 33 23, 47 25, 29 23, 99
23, 6 22, 56 23, 34 23, 73
B 22, 43 22, 04 21, 39 22, 95 20, 87 21, 65
22, 82 22, 3 23, 21
Se puede inferir de estos datos que los conductores de taxis del programa A
consumjen mas combustible que los del programa B?
De esa froma se tiene que al realizar la prueba con un 5 % de signicacion:
La hipotesis intrnseca es, H
0
: f
A
(x) = f
B
(x) versus H
1
: f
1
(x) esta
desplazada a la derecha de f
2
(x). Luego determinamos los rangos de las ob-
servaciones:
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 216
A Rango B Rango
22, 17 5 20, 87 1
22, 56 8 21, 39 2
23, 34 12 21, 65 3
23, 47 13 22, 04 4
23, 60 14 22, 3 6
23, 73 15 22, 43 7
23, 99 16 22, 82 9
24, 25 17 22, 95 10
25, 29 18 23, 21 11
26, 33 19
Ahora se determina la suma de los rangos de la primera muestra T = 137,
como as tambien IE(T) = 10(10 + 9 + 1)/2 = 100, VVar(T) = 10 9(10 + 9 +
1)/12 = 150, de esa forma:
Z
c
=
137 100

150
= 3,02 ,
y al ser comparado con el valor del estadstico de tabla Z
0,975
= 1,96.
Se tiene que hay evidencia para rechazar H
0
, es decir, la distribucion del
grupo A esta desplazada hacia la derecha de de la del grupo B.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 217
5.4.2. Docima de Bondad de Ajuste Chi-cuadrado
La idea es poder determinar si una variable con distribucion desconoci-
da, al formular una hipotesis respecto a una posible distribucion de esta es
efectiva o no.
De las observaciones de una muestra se estiman los valores de los paramet-
ros de la funcion de probabdilidad, o de densidad, que se han postulado en
la hipotesis.
Sean:
1. n
i
, es el n umero de observaciones en la i-esima clase.
2. n =

k
i=1
n
i
, es el n umero total de observaciones en las k celdas.
3. p
i
= IP(X = x
i
) o p
i
= IP(x
i1
X x
i
), es la probabilidad que
el valor de x
i
este en la i-esima celda, si la variable es discreta, o la
probabilidad que el valor de la variable este en el intervalo (x
i1
, x
i
) si
la variable es continua.
4.

IE(n
i
) = np
i
n umerop esperado de observaciones en la i-esima celda.
Con estos elementos se dene la estadstica
2
c
, como:

2
c
=
k

i=1
(n
i


IE(n
i
))
2

IE(n
i
)
,
si
2
c
>
2
(ks1,1)
se rechaza la hipotesis que la distribucion de la variable
es la especicada, porque la distancia entre el valor observado y el esperado
es demaciado grande. Donde s es el n umero de parametros de la distribucion
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 218
que se conjetura que se estiman con las observaciones recolectadas en la
muestra.
Ejemplo 5.4.2 En un experimento sobre la duracion de baterias, en a nos,
se desea comprobar si la distribucion de frecuencias de esta variable sigue
una distribucion normal. Para ello se toma una muestra de 40 baterias y
se registra su duracion hasta que estas dejan de funcionar, los resultados se
resumen en la siguiente tabla
6
:
x
i
X n
i
p
i
n p
i
(n
i
n p
i
)
2
(n
i
n p
i
)
2
n p
i
2, 2 1, 45 2, 95 7 0, 2641 10, 5640 12, 7021 1, 2024
3, 2 2, 95 3, 45 15 0, 2603 10, 4120 21, 0497 2, 0217
3, 7 3, 45 3, 95 10 0, 2485 9, 9400 0, 0036 0, 0004
4, 45 3, 95 4, 95 8 0, 2074 8, 2960 0, 0876 0, 0106
40 3, 2350
As,
2
c
= 3,2350 y al ser comparado con el valor de tabla
(421,10,05)
=
3,841, se tiene que no existe evidencia en contra de suponer que la duracion
de las bateras tengan una distribucion norma.
5.4.3. Tablas de Contingencia
En este caso trabajaremos con variables nominales y ordinales (en general
variables categoricas). Este tipo de variables aparecen en todos los campos,
en particular en ciencias biologicas y ciencias sociales.
6
Note que, los valores de p
i
en la tabla, corresponden al calculo de probabilidad de una
N(3,4; 0,723
2
)
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 219
Cuando las observaciones en una muestra pueden ser clasicadas de acuer-
do a sus valores con respecto a dos variables categoricas, se puede formar una
tabla de contingencia como una de las formas de estudiarlas conjuntamente.
De esa forma una tabla de este estilo, tiene la siguiente forma:
Y
Y
1
Y
2
Y
J
Total
X
1
n
11
n
12
n
1J
n
1+
X X
2
n
21
n
22
n
2J
n
2+
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
X
I
n
I1
n
I2
n
IJ
n
I+
Total n
+1
n
+2
n
+J
n
++
donde, n
ij
es el n umero de elementos observados en la celda (i, j); n
i+
es el
n umero de elementos totales de la i-esima la; n
+j
es el n umero de elemen-
tos totales de la j-esima columna y n
++
es el n umero de elementos totales
observados, en una tabla de I J. Ademas:
n
i+
=
J

j=1
n
ij
, n
+j
=
I

i=1
n
ij
, n
++
=
I

i=1
J

j=1
n
ij
.
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 220
Ademas, podemos denir las proporciones observadas en la tabla como:
Y
Y
1
Y
2
Y
J
Total
X
1
p
11
p
12
p
1J
p
1+
X X
2
p
21
p
22
p
2J
p
2+
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
X
I
p
I1
p
I2
p
IJ
p
I+
Total p
+1
p
+2
p
+J
1
donde, p
ij
= n
ij
/n
++
es la proporcion de elementos observados en la celda
(i, j); p
i+
= n
i+
/n
++
es la proporcion de elementos totales de la i-esima la;
p
+j
= n
+j
/n
++
es la proporcion de elementos totales de la j-esima columna.
Ademas:
p
i+
=
J

j=1
p
ij
, p
+j
=
I

i=1
p
ij
,
I

i=1
J

j=1
p
ij
= 1 .
5.4.4. Docima Chi-cuadrado de Independencia
La pregunta clave aca es si existe alg un tipo de asociacion entre dos vari-
ables de una tabla de contingencia. el concepto contrario o complementario
de asociacion es el de independencia estadstica.
Entonces, dos variables categoricas (nominales u ordinales) son estadsti-
camente independientes, si las distribuciones condicionales, en la poblacion,
de una de ellas son iguales para cada nivel de la otra.
Usualmente solo tenemos la informacion de la muestra y desconocemos,
en consecuencia, las distribuciones condicionales en la poblacion. Pero si las
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 221
variables no son independientes, sus distribuciones condicionales muestrales
discreparan en forma importane.
Pero hay suciente evidencia en los datos para rechazar la independencia
de las variables?
La prueba Chi-cuadrado nos permite docimar la independencia de dos
variables categoricas.
H
0
: Las variables son estadsticamente independientes.
H
1
: Las variables son estadsticamente dependientes.
La estadstica de prueba es:

2
c
=
I

i=1
J

j=1
(o
ij
e
ij
)
2
e
ij
,
donde o
ij
es la frecuencia observada para la celda (i, j) y e
ij
= n
i+
n
+j
/n
++
es
la frecuencia esperada para la celda (i, j) bajo H
0
. Si
2
c
>
2
((I1)(J1),1)
se
rechaza la hipotesis de que las variables son estadsticamente independientes.
Ejemplo 5.4.3 En un estudio sobre la posible inuencia genetica de la mano
diestra de los padres (derecha o izquierda) sobre la mano diestra de sus hijos,
una muestra de 400 ni nos fueron clasicados de acuerdo a su mano diestra
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 222
y a la de sus padres, obteniendose:
Mano diestra Mano diestra hijo
Padre-Madre Derecha Izquierda Total
Derecha-Derecha 303 37 340
Derecha-Izquierda 29 9 38
Izquierda-Izquierda 16 6 22
Total 348 52 400
Nota:
Podemos usar el docima Chi-cuadrado cuando se cumple lo siguiente:
1. Para tablas 22, las frecuencias observadas deben ser al menos iguales
a cinco para cada celda.
2. Para tablas mas grandes, la frecuencia observada debe ser al menos
igual a cinco en el 75 % de las celdas y mayor a 1 en el resto.
Ejemplo 5.4.4 En una empresa se desea estudiar si existe una dependencia
entre el nivel de las remuneraciones y los a nos de experiencia del person-
al de su planta de profesionales. Con este objetivo, se clasican las remu-
neraciones, seg un su monto, en tres categoras (I,II y III) y los a nos de
experiencia, de acuerdo a su n umero en cuatro categoras (A,B,C y D).
La informacion obtenida de acuerdo a una muestra aleatoria de 100 ob-
Carlos Bustos-Lopez
CAP

ITULO 5. INFERENCIA ESTAD

ISTICA 223
servaciones es la siguiente:
Experiencia
A B C D Total
I 4 11 9 14 38
Remuneracion II 12 9 8 4 33
III 10 6 7 6 39
Total 26 26 24 24 100
Carlos Bustos-Lopez
Captulo 6
Muestreo
El interes de tomar una muestra esta basicamente centrado que, en muchas
ocaciones el tama no de la poblacion en estudio es muy grande o desconocido,
como para tomar los datos de cada elemento que la componen, ademas los
costos involucrados son muy altos y se requiere de mucho tiempo para llevar
a cabo este proceso. De esa forma es recomendable tomar una muestra de un
tama no menor a la poblacion, pero que es representativa de ella, desde donde
se extraeran, mediante un proceso de estimacion, los valores estimados de
los correspondientes parametros de interes.
Principalmente se distinguen dos tipos de muestreos, el probabilstico y
el no probabilstico, de ellos solo nos centraremos en el primero. Una muestra
probabilstica tiene como caracterstica basica que, cualquier elemento de la
poblacion tiene la misma probabilidad (= 0) conocida de ser incluido en la
muestra.
Existen varios metodos de muestreos probabilsticos, siendo los mas famosos:
el Muestreo Aleatorio Simple (m.a.s.), el Muestreo Aleatorio Estraticado y
224
CAP

ITULO 6. MUESTREO 225


el Muestreo Sistematico.
Para este estudio las variables de interes son las proporciones de algunas
caractersticas presentes en la poblacion. De esa forma podemos considerar
que el n umero x de elementos de la poblacion que presentan o no la carac-
terstica sigue una distribucion Binomial de parametros n y p
x
, es decir:
x|N = n, p
x
Bin(n, p
x
) n 2 , 0 p
x
1 ,
donde N corresponde al n umero de elementos (tama no) de la poblacion y p
x
la proporcion de elementos que presentan la caracterstica.
Entonces debemos determinar los valores de estos parametros en una
muestra de tama no n para realizar la inferencia sobre la poblacion. Es as co-
mo los estimadores muestrales para la media y la varianza son:
p
x
=

n
i=1
x
i
n
, V ar(p
x
) =
p
x
(1 p
x
)
n
_
N n
N 1
_
.
Pero para poblaciones grandes (N 40) los estimadores siguen asintotica-
mente una distribucion Normal.
As, si queremos asegurar que el valor de nuestra estimacion este con-
tenido en un intervalo de (1 )100 % de conanza, realizamos la siguiente
construccion:
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 226


Como se puede apreciar del graco anterior, si quisieramos garantizar que en
aproximadamente 997 de 1000 muestras, el parametro poblacional estara den-
tro de 3 desviaciones estandar del estimador.
Si p
x
es la proporcion estimada, P
x
es el parametro y SE(p
x
) el error
estandar de p
x
, podemos decir:
p
x
3SE(p
x
) P
x
p
x
+ 3SE(p
x
) .
Entonces el problema de estimacion involucra que debemos escoger un
tama no muestral que mantenga esta condicion.
El dise no muestral considerado para este estudio contempla varias etapas.
6.1. Muestreo
Por que una Muestra?
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 227


1. En muchas ocaciones el tama no de la Poblaci on es muy grande o de-
sconocido como para tomar los datos de cada individuo que la compo-
nen. (A ).
2. Tiene menor costo que un censo.
3. Se requiere menos tiempo.
4. Para no destruir o alterar la poblacion.
Como extraer una Muestra?
El procedimiento es a traves de las Tecnicas de Muestreo. Las mas
comunes son:
6.1.1. Muestreo Aleatorio Simple. (m.a.s.)
Se fundamenta en que todos los elementos de una poblacion tienen la
misma posibilidad de ser seleccionados para constituir la muestra para el
estudio, es decir, si se desea seleccionar una muestra de tama no n desde una
poblacion de tama no N, la probabilidad de que un elemento de la poblacion
sea seleccionado para la muestra (A) es:
IP(A) =
1
N
.
6.1.2. Muestreo Estraticado.
Se fundamenta en que en la poblacion existen elementos con diferencias
evidentes, que pueden ser agrupados en Estratos, que deben ser represen-
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 228


tados proporcionalmente en la muestra. As, si se tiene una poblacion de
tama no N, en la cual se pueden distinguir k estratos, de tal forma que:
k

i=1
N
i
= N ,
donde N
i
es la cantidad total de elementos del i-esimo estrato, tambien se
puede determinar la proporcion que representan cada estrato en la poblacion
como p
i
= N
i
/N, que cumple:
k

i=1
p
i
= 1 ,
de esa forma si se desea extraer una muestra de tama no n desde la poblacion,
los elementos en la muestra deben ser distribuidos como:
n
i
=
N
i
N
n = p
i
n , con
k

i=1
n
i
= n ,
de esa forma la muestra debe contener n
i
elementos del i-esimo estrato.
6.1.3. Muestreo Sistematico.
Se fundamenta en que, el espacio muestral es listado en forma arbitrara,
lo cual produce bloques o grupos que son articiales, por lo cual es necesario
quitar el efecto lista. La idea es seleccionar los n elementos de la muestra,
descartando cada k de ellos. El procedimiento consiste en:
1. Seleccionar un n umero aleatorio m tal que 1 m N, como el punto
de partida para el muestreo, de tal forma que el elemento en la posicion
m, constituye el primer elemento de la muestra.
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 229


2. Determinar el valor del salto sistematico k como el entero k = N/n.
3. Seleccionar los otros (n 1) elementos de la muestra cada k de ellos.
De esa forma, la muestra queda constituida por los siguientes elementos:
m, m +k, m + 2k, . . . , m + (n 1)k .
6.1.4. Tama no Muestral
Un punto interesante en todos los estudios es, cuantas observaciones de-
bo tomar?, es decir, de que tama no debe ser la muestra?
Consideremos lo siguiente:
IC() =
_
_
X Z
1

n
. .

X + Z
1

n
. .
_
_

Es decir, se puede considerar un error para la estimacion del verdadero
valor de la media poblacional, y de esa forma se puede despejar el valor de
n.
As, una forma rapida de determinar el tama no muestral para realizar
inferencia sobre la media de una poblacion, con un nivel de conanza de
(1 ) 100 %, donde la variaci on poblacional es y se pretende cometer
un error de a lo mas un , se puede emplear la siguiente formula:
n =
_
Z
1

_
2
.
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 230


Analogamente, se puede obtener la siguiente formula:
n =
_
Z
1

2
_
p
0
(1 p
0
)

_
2
.
Que permite determinar el tama no muestral para realizar inferencia sobre la
proporcion de una poblacion, con un nivel de conanza de (1 ) 100 %,
y se pretende cometer un error de a lo mas un .
Ejemplo 6.1.1 Cuantas observaciones son necesarias si la desviacion
estandar de la duracion de los aullidos es = 0,25 y se quiere realizar
una estimacion de la duracion media, con un 95 % de conanza y se
desea cometer un error de a lo mas 5 segundos?
n =
_
1,96 0,25
0,08
_
2
= 37,5 38 .
Si consideramos ahora un nivel de conanza del 99 %, se tiene que:
n =
_
2,57 0,25
0,08
_
2
= 64,5 65 .
6.1.5. Plan de Muestreo
1. Primera etapa: Bajo Muestreo Aleatorio Simple y normalidad asint otica,
se tiene que el intervalo de conanza a (1 )100 % para p
x
esta dado
por:
p
x
Z
1/2
SE(p
x
) , (6.1)
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 231


donde Z
1/2
corresponde al percentil (1 /2)100 de la distribicion
normal o tambien denominado coeciente de conabilidad y SE(p
x
) es
la desviacion estandar del estimador (SE(p
x
) =
_
V ar(p
x
)).
As el error muestral para la estimacion debe cumplir que:
Z
1/2
SE(p
x
)

, (6.2)
donde

corresponde a la signicacion de la estimacion (100 %).


Reemplazando el valor de SE(p
x
) por su valor estimado,

SE(p
x
) =
_
p
x
(1 p
x
)
n
_
N n
N 1
__
1/2
,
el cual incorpora el factor de correccion por nitud para tama nos de
poblacion conocidas, se tiene en (2) que:
Z
1/2
_
p
x
(1 p
x
)
n
_
N n
N 1
__
1/2

,
luego,
n
Z
2
1/2
p
x
(1 p
x
)N
(N 1)
2

+ Z
2
1/2
p
x
(1 p
x
)
, (6.3)
de esa forma se determina el mnimo n (tama no muestral) que garantiza
que el intervalo contenga al estimador con (1 )100 % de conanza.
2. Segunda etapa: En general, y este caso no es la escepcion, los com-
ponentes de una poblacion tienen caractersticas que as como los difer-
encian entre ellos tambien otras los reunen en grupos homogeneos en
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 232


si mismos, por ejemplo, si nos interesara conocer el porcentaje de per-
sonas de Europa que preeren el color verde por sobre los otros colores,
es claro que nuestra poblacion correspondera a todos los miembros de
la comunidad europea, pero esta comunidad esta compuesta por varios
paises, de culturas diferentes y que las opiniones y gustos de ellos seran
distintas de pas en pas, a un mas dentro de cada pas se distinguen
dos grupos, hombres y mujeres, que aunque tengan la misma cultura y
crianza tendran preferencias y comportamientos distintos.
Por lo anterior, siempre es importante distinguir estas caractersticas
que estratican la poblacion en estudio, ya que nos permite tener
una mejor representatividad de estos grupos, es decir, que la presencia
de ciertos grupos de la poblacion en la muestra, sea proporcional a su
presencia en la poblacion. Este procedimiento se denomina Muestreo
Estraticado.
Las principales ventajas de la estraticacion por sobre el m.a.s., son:
Dadas ciertas condiciones de regularidad, la precision puede ser
incrementada por sobre el m.a.s.
Es posible obtener estimaciones para cada estrato (grupo) con una
precision especca.
De la misma forma que en la primera etapa, se puede determinar el
tama no de la muestra por estratos, es decir, si hemos determinado que
la muestra total debe ser de tama no n, podemos ahora determinar
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 233


cuantos de estos elementos seran seleccionados de un estrato u otro.
Sea entonces n
h
el tama no muestral del estrato h, con h = 1, . . . , L,
donde L es el total de estratos y N
h
el n umero de componentes total
del estrato h en la poblacion, entonces se tiene que n =

L
h=1
n
h
y
N =

L
h=1
N
h
, luego:
n
h
=
N
h
p
h
(1 p
h
)n

L
h=1
N
h
p
h
(1 p
h
)
, (6.4)
donde p
h
corresponde a la proporcion de los elementos del estrato h en
la poblacion.
Ademas (4) es una muestra autoponderada obtenida a traves de un
muestreo estraticado, pero con el afan de lograr las mejores estima-
ciones posibles, se ha determinado (4) mediante una ajacion optima,
de tal forma que las varianzas de los estimadores sea la menor posi-
ble, es decir, hemos considerado el costo de tomar un elemento dentro
de un estrato, se incorpora el efecto que pueden tener las diferencias
signicativas de las varianzas de los estratos.
3. Tercera etapa: Como se menciono anteriormente la poblacion puede
estar compuesta de estratos y estos a su vez por subestratos, de esa for-
ma si consideramos nuevamente un muestreo estraticado para obtener
una muestra autoponderada con ajacion optima dentro de cada estra-
to se puede proceder como:
Sean i = 1, . . . , I, con I n umero de subestratos dentro del estrato h =
1, . . . , L, N
hi
el n umero de elementos de la poblacion que corresponden
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 234


al subestrato i en el estrato h, p
hi
la proporcion de elementos que
pertenecen al subestrato i del estrato h en la poblacion y n
hi
el n umero
de elementos a muestrear del subestrato i en el estrato h de la poblacion,
entonces podemos denir:
n
hi
=
N
hi
p
hi
(1 p
hi
)n
h

I
i=1
N
hi
p
hi
(1 p
hi
)
. (6.5)
4. Cuarta etapa: Luego de determinados los tama nos muestrales en los
subestratos, estratos y de la poblacion muestral, procedemos a selec-
cionar los elementos. Existen varias tecnicas de seleccion, por ejemplo
repeticion del m.a.s., o a traves de un muestreo sistematico de salto
sitematico k = N/n.
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 235


Bibliografa
1. Agresti, Alan. Statistical methods for the social sciences. 3a ed. Upper
Saddle River, N.J. Prentice Hall, 1997.
2. Azorn Poch, Francisco. Metodos y aplicaciones del muestreo. Madrid:
Alianza, 1986.
3. Azzalini, Adelchi. Statistical inference: based on the likelihood. London:
Chapman & Hall, 1996.
4. Box, George E. P. Statistics for experimenters: design, innovation, and
discovery. 2a ed. Hoboken, N.J. Wiley-Interscience, 2005.
5. Box, George E. P. Bayesian inference in statistical analysis. New York:
Wiley, 1992.
6. Camacho Rosales, Juan. Estadstica con SPSS (versi on 9) para Win-
dows. Mexico: Alfaomega/Ra-Ma, 2001.
7. Casella, George. Statistical inference. 2a ed. Australia: Thomson Learn-
ing, 2002.
8. Cochran, William Gemmell, 1909- . Sampling techniques. 3rd ed. New
York: Wiley, 1977.
9. Cramer, Harald, 1893- . Metodos matematicos de estadstica. Madrid:
Aguilar, 1960.
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 236


10. David, H. A. (Herbert Aron), 1925- . Order statistics. 2nd ed. New
York: John Wiley, 1980.
11. Degroot, Morris H, 1931- . Probability and statistics. 3rd ed. Boston:
Addison-Wesley, 1988.
12. Del Pino M., Guido. Apuntes de inferencia estadstica: versi on prelim-
inar. Santiago, Chile: Ponticia Universidad Catolica de Chile, 1982.
13. Del Pino M., Guido. Analisis estadstico: interpretando problemas de
la vida cotidiana. Santiago, Chile: Ministerio de Educacion, 2003.
14. Fisher, Ronald Aylmer, 1890-1962. Statistical methods, experimental
design, and scientic inference. Oxford: Oxford University Press, 1990.
15. Freeman, Harold Adolph. Introduction to statistical inference. Read-
ings, Mass: Addison-Wesley, 1963.
16. Freund, John E., 1921- . Mathematical statistics. 2nd ed. Englewood
Clis, N. J.: Prentice-Hall, 1971.
17. Gibbons, Jean Dickinson, 1938- . Nonparametric statistical inference.
New York: McGraw-Hill, 1971.
18. Henkel, Ramon E., 1931- . Tests of signicance. Beverly Hills, Calif.:
Sage, 1976.
19. Kendall, Maurice G., 1907- . Kendalls advanced theory of statistics.
London: Edward Arnold, 1994-.
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 237


20. Kendall, Maurice G., 1907- . The advanced theory of statistics. 3rd ed.
New York: Hafner Press, 1976.
21. Larson, Harold J., 1934- . Introduction to probability theory and sta-
tistical inference. 2nd ed. New York: Wiley, 1974.
22. Lehmann, Erich Leo, 1917- . Testing statistical hypotheses. 2nd ed.
New York: Wiley, 1986.
23. Lehmann, Erich Leo, 1917- . Elements of large sample theory. New
York: Springer, 1999.
24. McCollough, Celeste. Analisis estadstico en las ciencias sociales y ed-
ucacion. Mexico: McGraw-Hill, 1976.
25. McCulloch, Charles E. Generalized, linear, and mixed models. New
York: John Wiley & Sons, 2001.
26. Mendenhall, William. Probabilidad y estadstica para ingeniera y cien-
cias. 4a ed. Mexico: Pearson Educacion, 1997.
27. Meyer, Paul L. Introductory probability and statistical applications.
2nd ed. Reading, Mass: Addison-Wesley, 1970.
28. Montgomery, Douglas C. Probabilidad y estadstica aplicadas a la in-
geniera. Mexico, D. F.: McGraw-Hill, 1996.
29. Montgomery, Douglas C. Diseo y analisis de experimentos. 2a ed. Mexi-
co: Limusa Wiley, 2003.
Carlos Bustos-Lopez
CAP

ITULO 6. MUESTREO 238


30. Rao, C. Radhakrishna (Calyampudi Radhakrishna), 1920- . Linear mod-
els: least squares and alternatives. New York: Springer, 1995.
31. Ross, Sheldon M. Introduction to probability and statistics for engi-
neers and scientists. 2nd ed. Amsterdam: Harcourt Academic Press,
2000.
32. Spiegel, Murray R. Estadstica. 3a ed. Mexico: McGraw-Hill, 2002.
33. Walpole, Ronald E. Probabilidad y estadstica para ingenieros. 6a ed.
Mexico: Prentice Hall, 1999.
34. Walpole, Ronald E. Introduction to statistics. 2nd ed. New York: Macmil-
lan, 1974.
Carlos Bustos-Lopez

You might also like