You are on page 1of 198

DPTO.

MTODOS CUANTITATIVOS PARA LA ECONOMA Y LA EMPRESA

UNIVERSIDAD DE GRANADA

TCNICAS CUANTITATIVAS 3
Grado en Marketing e Investigacin de Mercados

Teora y ejercicios.

1
2
NDICE

1. Muestreo aleatorio simple. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7


1.0 Definiciones y conceptos bsicos . . . . . . . . . . . . . . . . . . . . . . . 7
1.1 Seleccin de una muestra aleatoria simple. Nmeros aleatorios. . . . . . . . 8
1.2 Muestreo aleatorio simple en poblaciones infinitas. . . . . . . . . . . . . . 9
1.2.1 Media, varianza y proporcin muestrales: Propiedades. Error de
estimacin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.2.2 Estimacin puntual. Intervalos de confianza. Contrastes de hiptesis. 13
1.2.3 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . . 13
1.3 Muestreo aleatorio simple en poblaciones finitas. . . . . . . . . . . . . . . 15
1.3.1 Estimacin de la media, proporcin y total poblacionales. . . . . . . 15
1.3.2 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . . 18
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

2. Muestreo aleatorio estratificado. . . . . . . . . . . . . . . . . . . . . . . . . . . 28


2.1 Seleccin de una muestra aleatoria estratificada. . . . . . . . . . . . . . . . 28
2.2 Estimacin de la media, proporcin y total poblacionales. . . . . . . . . . . 29
2.3 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . . . . . . 32
2.4 Asignacin de la muestra. . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.4.1 Asignacin ptima. . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4.2 Asignacin de Neyman. . . . . . . . . . . . . . . . . . . . . . . . . 34
2.4.3 Asignacin Proporcional. . . . . . . . . . . . . . . . . . . . . . . . 34
2.5 Estratificacin despus de seleccionar la muestra. . . . . . . . . . . . . . . 40
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3. Muestreo con informacin auxiliar. . . . . . . . . . . . . . . . . . . . . . . . . 53


3.1 Introduccin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.2 Estimacin de razn. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.2.1 Estimacin de la media y total poblacionales. . . . . . . . . . . . . 55
3.2.2 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . . 58
3.3 Estimacin de regresin. . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.3.1 Estimacin de la media y total poblacionales. . . . . . . . . . . . . 60
3.3.2 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . . 61
3.4 Estimacin de diferencia. . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.4.1 Estimacin de la media y total poblacionales. . . . . . . . . . . . . 62
3.4.2 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . . 64
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

4. Muestreo sistemtico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.1 Seleccin de una muestra sistemtica. Usos. Ventajas. . . . . . . . . . . . . 71
4.2 Estimacin de la media, proporcin y total poblacionales. . . . . . . . . . . 72
4.3 Comparacin con el muestreo aleatorio simple: Poblaciones ordenadas,
aleatorias y peridicas. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.4 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . . . . . . 76
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

5. Muestreo por conglomerados. . . . . . . . . . . . . . . . . . . . . . . . . . . . 81


5.1 Necesidad y ventajas del muestreo por conglomerados. . . . . . . . . . . . 81
5.2 Formacin de los conglomerados. Conglomerados y estratos. . . . . . . . . 81
5.3 Estimacin de la media, proporcin y total poblacionales. . . . . . . . . . . 81
5.4 Determinacin del tamao muestral. . . . . . . . . . . . . . . . . . . . . . 86

3
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

6. Muestreo con probabilidades desiguales. . . . . . . . . . . . . . . . . . . . . . 97


6.1 Introduccin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
6.1.1 Probabilidades de inclusin. . . . . . . . . . . . . . . . . . . . . . 97
6.1.2 Pesos del diseo muestral. . . . . . . . . . . . . . . . . . . . . . . 98
6.1.3 Algunos mtodos con probabilidades desiguales. . . . . . . . . . . 99
6.2 Estimacin de la media, proporcin y total poblacionales . . . . . . . . . . . 100
6.3 El problema de la estimacin de la varianza de estimadores: mtodos de
remuestreo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.4 Aplicaciones en encuestas oficiales. . . . . . . . . . . . . . . . . . . . . . 112

7. Estimacin del tamao de la poblacin. . . . . . . . . . . . . . . . . . . . . . 115


7.1 Estimacin del tamao de la poblacin usando muestreo directo . . . . . . . 115
7.2 Estimacin del tamao de la poblacin usando muestreo inverso. . . . . . . 116
7.3 Muestreo por cuadros. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
7.3.1 Estimacin de la densidad y del tamao de la poblacin. . . . . . . . 117
7.3.2 Muestreo por cuadros en el espacio temporal. . . . . . . . . . . . . 119
7.3.3 Cuadros cargados. . . . . . . . . . . . . . . . . . . . . . . . . . . 119
Ejercicios resueltos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121

8. Decisin en ambiente de incertidumbre. . . . . . . . . . . . . . . . . . . . . . . 124


8.1 Elementos de un problema de decisin. . . . . . . . . . . . . . . . . . . . . 124
8.2 Tablas de decisin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.3 Valoracin de los resultados. . . . . . . . . . . . . . . . . . . . . . . . . . 126
8.4 Clasificacin de los problemas de decisin. . . . . . . . . . . . . . . . . . . 127
8.5 Toma de decisiones en ambiente de incertidumbre. . . . . . . . . . . . . . . 127
8.5.1 Criterio de Laplace. . . . . . . . . . . . . . . . . . . . . . . . . . . 128
8.5.2 Criterio de Wald (maximin) . . . . . . . . . . . . . . . . . . . . . . 129
8.5.3 Criterio de Hurwicz. . . . . . . . . . . . . . . . . . . . . . . . . . . 130
8.5.4 Criterio de Savage (minimax) . . . . . . . . . . . . . . . . . . . . . 131

9. Decisin en ambiente de riesgo. . . . . . . . . . . . . . . . . . . . . . . . . . . 137


9.1 El criterio del valor monetario esperado. . . . . . . . . . . . . . . . . . . . 137
9.1.1 Inconvenientes del criterio del valor monetario esperado. . . . . . . 139
9.2 El criterio de la prdida de oportunidad esperada. . . . . . . . . . . . . . . 139
9.3 Valor monetario esperado con informacin perfecta. . . . . . . . . . . . . . 141
9.3.1 El valor de la informacin perfecta. . . . . . . . . . . . . . . . . . . 141

10. Decisin bayesiana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144


10.1 Probabilidad condicionada. Probabilidad total. Teorema de Bayes. . . . . . 144
10.2 Interpretaciones del concepto de probabilidad. . . . . . . . . . . . . . . . 145
10.3 Modificacin de las creencias del decisor. . . . . . . . . . . . . . . . . . . 146
10.4 Valor monetario esperado con informacin imperfecta. Valor de la
informacin imperfecta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147

Relacin de ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152


Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152
Muestreo aleatorio estratificado . . . . . . . . . . . . . . . . . . . . . . . . . . 153
Muestreo con informacin auxiliar . . . . . . . . . . . . . . . . . . . . . . . . 158
Muestreo sistemtico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
Muestreo por conglomerados . . . . . . . . . . . . . . . . . . . . . . . . . . . 164

4
Muestreo con probabilidades desiguales. . . . . . . . . . . . . . . . . . . . . . 169
Estimacin del tamao de la poblacin. . . . . . . . . . . . . . . . . . . . . . . 170
Decisin en ambiente de incertidumbre. . . . . . . . . . . . . . . . . . . . . . . 174
Decisin en ambiente de riesgo. . . . . . . . . . . . . . . . . . . . . . . . . . . 177
Decisin bayesiana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180

Formulario . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
Muestreo aleatorio simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
Muestreo aleatorio estratificado . . . . . . . . . . . . . . . . . . . . . . . . . . 188
Muestreo con informacin auxiliar . . . . . . . . . . . . . . . . . . . . . . . . 191
Muestreo por conglomerados . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
Muestreo con probabilidades desiguales . . . . . . . . . . . . . . . . . . . . . . 195
Estimacin del tamao de la poblacin . . . . . . . . . . . . . . . . . . . . . . 197

5
6
1. Muestreo aleatorio simple.
1.0 Definiciones y conceptos bsicos.
1.1 Seleccin de una muestra aleatoria simple. Nmeros aleatorios. Rutas aleatorias.
1.2 Muestreo aleatorio simple en poblaciones infinitas.
1.2.1 Media, varianza y proporcin muestrales: Propiedades. Error de estimacin.
1.2.2 Estimacin puntual. Intervalos de confianza. Contrastes de hiptesis.
1.2.3 Determinacin del tamao muestral.
1.3 Muestreo aleatorio simple en poblaciones finitas.
1.3.1 Estimacin de la media, proporcin y total poblacionales.
1.3.2 Determinacin del tamao muestral.

1.0 Definiciones y conceptos bsicos


Nuestro objetivo a lo largo de la asignatura ser conocer o investigar alguna caracterstica de
una poblacin, por ejemplo el consumo de determinados productos, la audiencia televisiva de
un programa, la intencin de voto,... Claramente la recogida de informacin sobre toda la
poblacin resultara cara y lenta. Por ello es preferible utilizar un subconjunto pequeo de la
poblacin, la muestra.

La muestra debe ser representativa, es decir, una versin a escala reducida de la poblacin
que refleje las caractersticas de toda la poblacin.

Para obtener una muestra representativa hay diferentes mtodos. Los mtodos de muestreo
ms utilizados son:
Muestreo aleatorio simple.
Muestreo aleatorio estratificado.
Muestreo sistemtico.
Muestreo por conglomerados.
Muestreo con probabilidades desiguales

El error de muestreo es el que surge al considerar una muestra y no examinar toda la


poblacin. El error de muestreo puede ser controlado y medido mediante el diseo de la
muestra.
Otros errores, ms difciles de controlar, pueden ocurrir al estudiar una muestra. Estos otros
errores se llaman errores de no muestreo. En muchas muestras, el error de muestreo cometido
para esa muestra puede ser despreciable en comparacin con los errores que no son de
muestreo.

7
Los errores de no muestreo ms comunes son:
Sesgo de seleccin. Este error ocurre cuando alguna parte de la poblacin objetivo no
puede ser elegida como parte de la muestra. Por ejemplo, si hacemos una encuesta por
los domicilios en horario de trabajo, estamos vetando que ciertos individuos puedan
ser elementos de la muestra.
Sesgo de medicin. El sesgo de medicin ocurre cuando los datos observados difieren
del valor verdadero, por ejemplo:
- Los individuos no reconocen la verdad porque pudiera estar mal visto.
- No comprenden las preguntas.
- La formulacin y el orden de las preguntas pueden afectar a las respuestas
obtenidas.
-
No respuesta. La no respuesta de un individuo seleccionado para formar parte de la
muestra puede causar un sesgo en los datos muestrales similar al sesgo de seleccin.
Puede ocurrir que las personas que respondan no representen a la poblacin objetivo.

Los errores de no muestreo deben controlarse con acciones como reentrevistas, verificacin de
los datos,

Son muchas las razones para el uso del muestreo, entre otras destacamos:
Evitar la destruccin de la poblacin. En algunos casos, por ejemplo en el control de
calidad, la observacin de los elementos lleva a su destruccin.
Rapidez. Los datos se pueden reunir ms rpido, de modo que las estimaciones se
pueden publicar de una manera programada. Por ejemplo las elecciones.
Economa y precisin. El muestreo puede proporcionar informacin fiable con costes
mucho menores que los de un censo (toda la poblacin). Un censo completo implica
mucho trabajo en la recoleccin de los datos y debido a su complejidad se pueden
cometer muchos errores. En una muestra, por su menor tamao, se puede dedicar ms
atencin a la calidad de los datos.

1.1 Seleccin de una muestra aleatoria simple. Nmeros aleatorios. Rutas aleatorias.
Si cada muestra posible de tamao n tiene la misma probabilidad de ser seleccionada, el
procedimiento de muestreo se denomina muestreo aleatorio simple y a la muestra as
seleccionada se le llama muestra aleatoria simple.

8
La condicin de que cada muestra tenga la misma probabilidad de ser seleccionada equivale a
que cada elemento tenga la misma probabilidad de pertenecer a la muestra. Para ello la
seleccin de cada elemento de la muestra se debe hacer con un sorteo completamente
aleatorio. Para facilitar la obtencin de los resultados de ese sorteo aleatorio existen lo que se
conoce como tablas de nmeros aleatorios que suelen aparecer en un apndice al final de
muchos libros de estadstica. Cada vez ms, estas tablas de nmeros aleatorios son sustituidas
por la generacin de nmeros aleatorios mediante programas de ordenador (Excel, SPSS,
R,...). Para asociar el valor de esos nmeros aleatorios con los elementos de la poblacin
necesitamos que sta est numerada, en caso contrario deberamos formar una lista y
numerarla. Esto ltimo, en muchos casos, no es tan sencillo. Una alternativa a la formacin de
una lista numerada para la seleccin mediante nmeros aleatorios de los elementos de la
muestra es el mtodo de las rutas aleatorias. Segn este mtodo cada nmero aleatorio o
grupo de nmeros aleatorios describe el camino hasta el elemento de la muestra. Veamos
cmo se aplicara este mtodo con un sencillo ejemplo:
Se ha seleccionado el nmero aleatorio 11071032, las dos primeras cifras (11) indican el
distrito de la ciudad, las dos siguientes (07) la calle del distrito, las dos siguientes (10) el
nmero de la calle, la siguiente (3) la planta del edificio y la ltima (2) la letra B de dicha
planta.
En muchos casos para llevar a cabo este procedimiento se recurre a la gua telefnica, sobre
todo si la entrevista es por telfono, as el nmero aleatorio 7836 podra interpretarse como
que se selecciona la pgina 78 de la gua y dentro de sta al abonado del telfono que aparece
en el lugar 36 de dicha pgina.

EL NMERO TOTAL DE ELEMENTOS QUE FORMAN UNA MUESTRA TIENE


MENOS IMPORTANCIA QUE EL PRINCIPIO DE SELECCIN ALEATORIA. Utilizar
un mtodo ms sencillo para seleccionar la muestra, con el que fcilmente se obtengan
muchas observaciones, no garantiza una mejor informacin que una muestra aleatoria
simple con muchos menos datos.

1.2 Muestreo aleatorio simple en poblaciones infinitas.


Supongamos que la caracterstica en estudio de la poblacin est representada por la variable
Y (con media y varianza 2), una muestra aleatoria simple de tamao n estar representada
por n variables: Y1,..., Yn, independientes e idnticamente distribuidas (i.i.d.).
Nota: observaciones en poblaciones infinitas y tambin en poblaciones finitas, si se hacen con
reemplazamiento, nos conducen a variables i.i.d.

9
1.2.1 Media, varianza y proporcin muestrales: Propiedades. Error de estimacin.
Como estimador de la media de la poblacin, , se utiliza la media muestral, y .

1 n
y= yi
n i =1

Un valor aislado y del estimador revela poco acerca de la media poblacional, deberamos
evaluar tambin su bondad.
Este estimador tiene propiedades deseables como ser insesgado y tener mnima varianza
2
( )
E y = V y =( ) n
Como estimador de la varianza de la poblacin, 2 , se utiliza la cuasivarianza muestral, S 2 .
1 n
( )
2
S2 = yi y
n 1 i =1
que tambin tiene la propiedad de ser insesgado
E (S2 ) = 2

de forma que la varianza de la media muestral se estima de forma insesgada por


S2
V ( y) =
n

Cuando las variables Y, Y1,..., Yn son dicotmicas o binomiales, slo toman dos valores (0 y
1), su media representa una proporcin que se nota como p y el estimador de la misma, la

proporcin muestral, por p

1 n
p= yi
n i =1
yi = 0, 1

Este estimador, como media muestral que es, tiene las mismas propiedades mencionadas
antes.
La varianza de la poblacin es en este caso 2 = pq , donde q=1-p. Como antes, el estimador
insesgado de la varianza es la cuasivarianza muestral que para este tipo de variables es igual a
n
S2 = pq
n 1
y la varianza estimada de la proporcin muestral es

pq
V ( p) =
n 1

10
Si conocemos ms caractersticas de las variables aleatorias Y, Y1,..., Yn, conoceremos ms
sobre el comportamiento de la media muestral, aparte de lo ya mencionado.
y
Si Y N ( , 2 ) 2 conocida N (0,1)

n

y
Si Y N ( , 2 ) 2 desconocida tn 1 N (0,1)
S
n
(en la prctica para n > 30, tn 1 N (0,1))

y y
Si Y cualquier distribucin N (0,1)
S
n n
(por el Teorema Central del Lmite cuando n , en la prctica para n>30)

Un caso particular del anterior es Y B (1, p ) , variable dicotmica, donde = p y= p

p p p p p p
= N (0,1) (en la prctica para n>30)
pq n pq pq
n n 1 n n 1

Todo lo anterior puede resumirse diciendo que la media muestral (de variables numricas, y ,

o dicotmicas, p ) sigue una distribucin Normal o se puede aproximar por ella si el tamao
de la muestra es suficientemente grande. De forma que podemos conocer la probabilidad de
que dicha variable tome determinados valores, por ejemplo (tomando una de las anteriores
expresiones de la media muestral tipificada, siendo vlido lo que sigue tambin para las otras)

y
P 1, 96 1, 96 = 0,95

n
o en un caso ms general

y
P Z Z = 1
2 2

n

=nivel de significacin 1-=nivel de confianza

11
Para un nivel de confianza del 95% (el ms habitual) se suele redondear el anterior valor
1,962.

En todos los apuntes que siguen trabajaremos con un nivel de confianza del
95% y con Z = 2 . En el formulario consideraremos distintos niveles de
2

confianza, por tanto distintos valores de Z que notaremos Z c para


2

simplificar la notacin.

De las probabilidades anteriores se puede hacer dos lecturas. La primera:



P 2 y 2 = 0, 95 P y 2 = 0, 95
n n n
En esta expresin aparecen valores y expresiones fundamentales en las tcnicas de estimacin:
1-=0,95= nivel de confianza del 95%.

y = error de estimacin o diferencia entre la estimacin que hacemos, y , y el verdadero

valor del parmetro que se quiere estimar, .



2 = cota o lmite para el error de estimacin, es el mximo error de estimacin que se
n
puede estar cometiendo, con una confianza del 95%. En la prctica, es desconocida y se
estima por S .

La segunda lectura:

Py 2 y+2 = 0, 95
n n
expresa la confianza que tenemos de que el verdadero valor del parmetro se encuentre


entre los extremos del intervalo y 2 ,y+2 .
n n

Todo lo anterior se puede asegurar si el estimador sigue una distribucin Normal (si el tamao
de la muestra es suficientemente grande, n>30, est garantizado). Pero qu ocurre si no es as.
En ese caso la desigualdad de Tchebychev nos da la respuesta.
La desigualdad de Tchebychev asegura que si X es una variable aleatoria con media
E ( X ) = y varianza V ( X ) = 2 , sea cual sea su distribucin de probabilidad

12
1
P X k 1
k2
Aplicando lo anterior a la media muestral para k=2 se obtiene
1
P y 2 1 4 = 0, 75
n
resultado parecido al que obtenamos anteriormente

P y 2 = 0, 95
n
salvo que en este caso lo ms que podemos asegurar es que dicha probabilidad es mayor que
0,75.

1.2.2 Estimacin puntual. Intervalos de confianza. Contrastes de hiptesis.


Cuando estimamos el valor de un parmetro poblacional con el valor que ha presentado en una
determinada muestra el estimador asociado, hacemos una estimacin puntual.
Si dicha estimacin puntual se acompaa de un margen de error (lmite para el error de
estimacin) y de una medida de la certidumbre que se tiene en tal estimacin (nivel de
confianza), hablamos de intervalo de confianza. Por ejemplo, utilizando muestras grandes, el
intervalo de confianza para la media poblacional con un nivel de confianza del 95% es

S S
y2 ,y+2
n n
En ocasiones se quiere contrastar con los valores observados en una muestra la posibilidad de
que el verdadero valor de un parmetro de la poblacin sea un valor dado, por ejemplo, se
quiere contrastar la hiptesis nula H 0 : = 0 con un nivel de significacin del 5%. Lo
anterior equivale a comprobar si
S S
0 y 2 ,y+2
n n
en cuyo caso se aceptara la hiptesis nula, rechazndose en caso contrario.

1.2.3 Determinacin del tamao muestral.


Si se fija de antemano el mximo error de estimacin que estamos dispuestos a aceptar en una

estimacin, 2 = B , la cantidad de informacin necesaria para conseguirlo depende del
n
tamao de la muestra segn la siguiente expresin

13
2 2 2 B2
4 =B n=
2
= , D=
n B2 D 4
4
En la prctica la varianza poblacional 2 es desconocida. Si disponemos de S 2 de un estudio

anterior podemos obtener el valor de n sustituyendo en la anterior expresin 2 por S 2 .


Si no se dispone de informacin previa para estimar la varianza podemos usar que en variables
Normales el rango de la muestra es aproximadamente cuatro veces su desviacin tpica
R R2
2
4 16

La proporcin poblacional p es la media de una variable dicotmica ( Y B (1, p ) ,


E (Y ) = p , V (Y ) = pq ), luego el problema de determinar el tamao muestral se hace de forma

anloga sustituyendo 2 por pq


pq B2
n= , D=
D 4
En la prctica p se desconoce. Una aproximacin se obtiene reemplazndolo por el valor

estimado p obtenido en muestras preliminares. Si no se cuenta con informacin anterior,


1
suponiendo p = se obtiene un tamao muestral conservador (mayor que el requerido para
2
obtener la cota del error de estimacin fijada).

Ejemplo 1.1. Un hipermercado desea estimar la proporcin de compras que los clientes pagan
con su Tarjeta de Compras. Durante una semana observaron al azar 200 compras de las
cuales 35 fueron pagadas con la tarjeta.

a) Estime con un intervalo de confianza la proporcin de compras pagadas con dicha tarjeta.

b) Cuntas compras deberan observarse para estimar, con un error inferior al 3%, la
proporcin de compras pagadas con la tarjeta? (Consideren los datos anteriores como una
muestra previa)

c) Si no se tuviera ninguna informacin acerca de los clientes que utilizan la tarjeta, cuntas
compras deberamos observar para asegurar que la anterior estimacin se realiza con un
error inferior al 3%.

d) Este mismo hipermercado desea estimar tambin el valor medio de las compras
realizadas con su Tarjeta de Compras. Basndose en los anteriores datos se observa que

14
el valor total de las compras hechas con la tarjeta fue de 5.600 (siendo la cuasivarianza
de los datos 625). Estime el valor medio de las compras pagadas con la tarjeta y el error
de estimacin asociado.
Solucin:
a)

1 n 35 pq
p=
n i =1
yi =
200
= 0,175 n = 200 q = 1 0,175 = 0,825 V ( p) =
n 1
= 0, 000726

B = 2 V ( p) = 0,0539 p (12,11% , 22,89% )

b)

B2 pq
B = 0, 03 D= = 0, 000225 n= = 641, 6 642
4 D
c)

B2 pq
B = 0, 03 D= = 0, 000225 p = q = 0,5 n= = 1111,1 1112
4 D
d)

1 n 5600
n = 35 y=
n i =1
yi =
35
= 160

S 2 625
S 2 = 625 V ( y) = = = 17,8571 B = 2 V ( y ) = 8, 45
n 35

1.3 Muestreo aleatorio simple en poblaciones finitas.


Suponemos que la poblacin es finita, tiene N elementos, y adems que la muestra se
selecciona sin reemplazamiento (lo que suele ser habitual, en caso contrario estaramos ante
el mismo modelo que el muestreo aleatorio simple en poblaciones infinitas con variables
i.i.d.)

1.3.1 Estimacin de la media, proporcin y total poblacionales.

Estimacin de la media poblacional.


Para estimar la media poblacional, , se utiliza la media muestral
1 n
yi
=y=
n i =1
Este estimador es insesgado y su varianza decrece conforme crece el tamao de la muestra

15
2 N n
( )
E y = ( )
V y =
n N 1
En este tipo de muestreo la cuasivarianza muestral no es un estimador insesgado de la
varianza de la poblacin
N 1 2
E (S2 ) =
N
2 E S =2
N 1 N
De lo anterior se sigue que la varianza de la media muestral puede ser estimada
insesgadamente por

N 1 2 1 N n S N n
( )
2
V y = S =
N n N 1 n N
S2
expresin igual a la del caso de poblaciones infinitas, V ( y ) = , salvo el coeficiente
n

N n
que se denomina coeficiente corrector para poblaciones finitas (c.p.f.).
N
N n
En la prctica el coeficiente c.p.f. suele despreciarse si est prximo a 1, 0, 95 o lo
N
que es equivalente si n 5% N . En muchos casos N no est claramente definido o se
N n
desconoce, pero si N se supone suficientemente grande el c.p.f. se omite, 1.
N

Para calcular el lmite para el error de estimacin, con un 95% de confianza, se halla 2 V ( y ) .
Igual que en el caso de poblaciones infinitas, se habla de un nivel de confianza del 95%
cuando trabajamos con el coeficiente 1,962. Pero en algunos casos, segn la desigualdad de
Tchevychev, slo se puede asegurar que este nivel es mayor que un 75%.

Estimacin del total poblacional.



Para estimar el total poblacional, , dado que = = N utilizaremos el estimador
N
n
N
= N y =
n
y
i =1
i .

Para hallar su varianza usamos que V (kX ) = k 2V ( X ) , por tanto:

Varianza estimada de

2 S N n
2
S2
V ( ) = V ( N y ) = N V ( y ) = N
2
= N ( N n)
n N n

16
Como en el caso de la media, el lmite para el error de estimacin con una confianza del 95%

est dado por 2 V ( ) . Valiendo comentarios anlogos a los hechos anteriormente.

En lo sucesivo se dar solamente el valor de la varianza del estimador para los distintos tipos
de muestreo, omitindose el lmite para el error de estimacin.

Ejemplo 1.2. Un auditor examina las cuentas abiertas con diferentes clientes de una empresa.
Suponga que existen 1.000 cuentas de las cuales se examinan 300. La media muestral de las
cuentas fue y = 1.040 y la cuasivarianza muestral es S2=45.0002. Estime el promedio de la
deuda y el total de la deuda por cobrar para las 1.000 cuentas abiertas con un intervalo de
confianza al 95%.
Solucin:
S n21 N n 45000 1000 300
V ( y) = = = 105 2 V ( y ) = 2 105 = 20, 49
n N 300 1000
(1.040 20, 49 ) = (1.019,51 , 1.060, 49 )
= N y = 1000 1040 = 1.040.000

2 V ( ) = N 2 V ( y ) = 1000 20, 49 = 20.490 (valor exacto 20.493,9)

(1.040.000 20.490 ) = (1.019.510 , 1.060.490 )

Estimacin de la proporcin poblacional.


Para estimar la proporcin poblacional p , dado que se trata de una media usaremos la media
muestral con la siguiente notacin en este caso
1 n
p= yi
n i =1
yi = 0, 1

n pq
su varianza estimada, teniendo en cuenta que S 2 = , es igual a
n 1
S2 N n pq N n
V ( p) = =
n N n 1 N
Para estimar el total poblacional de una variable dicotmica usamos

pq
= N p V ( ) = V ( N p ) = N 2 V ( p ) = N ( N n)
n 1

17
Ejemplo 1.3. Se toma una muestra aleatoria simple de 100 estudiantes de un centro con 900
estudiantes para estimar
La proporcin que votarn a un determinado representante de centro.
La proporcin de ellos que tienen algn tipo de trabajo.
Sean yi , zi (i = 1,...,100) las respuestas del i-simo estudiante seleccionado ( yi = 0 cuando

responden NO, yi = 1 cuando responden SI, anlogamente para zi ).


100 100
Segn la muestra y
i =1
i = 70 z
i =1
i = 25

Usando los datos de la muestra, estime p1 (proporcin de estudiantes que votarn a un


determinado representante), p2 (proporcin de estudiantes con algn tipo de trabajo), 2
(nmero de estudiantes con algn tipo de trabajo) y los lmites para los errores de estimacin
correspondientes.
Solucin:
100 100

y i z i
p1 = i =1
= 0, 70 (70%) p2 = i =1
= 0, 25 (25%)
100 100

p1 q 1 N n p 2 q 2 N n
V ( p1 ) = = 0,0018855 V ( p2 ) = = 0, 0016835
n 1 N n 1 N

2 V ( p1 ) = 0, 0868 (8, 68%) 2 V ( p 2 ) = 0, 0821 (8, 21%)

2 = N p 2 = 900 0, 25 = 225 2 V ( 2 ) = 900 0, 0821 = 73,89

1.3.2 Determinacin del tamao muestral.


El nmero de observaciones necesarias para estimar con un lmite para el error de

estimacin de magnitud B se obtiene resolviendo 2 V ( y ) = B

2 V ( y) = B V y =
B2
4
=D ( )
2 N n N 2
V ( y) = =D n=
n N 1 ( N 1) D + 2
Para estimar el total poblacional con un lmite para el error de estimacin B, dado que
B2
2 V ( ) = N 2 V ( y ) = B , se llega a la misma expresin de n pero con D =
4N 2

18
Habitualmente la varianza poblacional 2 es desconocida. Si disponemos de S 2 de un estudio

anterior podemos obtener el valor de n sustituyendo en la anterior expresin 2 por S 2 .


Si no se dispone de informacin previa para estimar la varianza podemos usar que en variables
Normales el rango de la muestra es aproximadamente cuatro veces su desviacin tpica
R R2
2
4 16

La proporcin poblacional p es la media de una variable dicotmica ( Y B (1, p ) ,


E (Y ) = p , V (Y ) = pq ), luego el problema de determinar el tamao muestral se hace de forma

anloga sustituyendo 2 por pq, obtenindose


Npq B2 B2
n= D= (para la proporcin) D= (para el total)
( N 1) D + pq 4 4N 2

En la prctica p se desconoce. Una aproximacin al mismo se obtiene reemplazndolo por el

valor estimado p obtenido en encuestas preliminares. Si no se cuenta con informacin


1
anterior, suponiendo p = se obtiene un tamao muestral conservador (mayor que el
2
requerido para obtener la cota del error de estimacin fijada).

Ejemplo 1.4. Encuentre el tamao de la muestra necesario para estimar el valor total de 1.000
cuentas por cobrar con un lmite para el error de estimacin de 10.000. Aunque no se cuenta
con datos anteriores para estimar la varianza poblacional, se sabe que la mayora de las
cuentas caen dentro del intervalo (600, 1.400).
Solucin:
B2 10.0002
D= = = 25 4 800 200 2 40.000
4 N 2 4 1.0002
N 2
n= = 615, 62 616
( N 1) D + 2

Si se realizan dos mediciones (o ms) sobre cada elemento de la muestra, se calcularn los
tamaos muestrales que satisfacen los lmites para el error de estimacin fijados para cada
estimacin y finalmente el mayor de los dos ser el tamao de la muestra que satisface ambos
lmites.

19
Ejemplo 1.5. Los alumnos de TC3 de una facultad con 3.000 estudiantes desean realizar una
encuesta para determinar la proporcin de estudiantes que estn a favor de hacer los exmenes
en sbado con un lmite para el error de estimacin del 10%. La informacin previa disponible
indica que el 60% preferan los exmenes en sbado. Tambin se quiere estimar la proporcin
de estudiantes que apoyan al equipo decanal con un error de estimacin del 5%. Determnese
el tamao muestral que se requiere para estimar ambas proporciones con los lmites de error
especificados.
Solucin:
p1 = proporcin de estudiantes que prefieren los exmenes en sbado.

B12 (0,10)2
D1 = = = 0, 0025
4 4
Np1q1 3.000 0, 60 0, 40
n1 = = = 93, 05 94
( N 1) D1 + p1q1 (2.999 0, 0025) + (0, 60 0, 40)

p2 = proporcin de estudiantes que apoyan al equipo decanal.

B22 (0, 05)2


D2 = = = 0, 000625
4 4
Np2 q2 3.000 0,50 0, 50
n2 = = = 353, 04 354
( N 1) D2 + p2 q2 (2.999 0, 000625) + (0,50 0, 50)
para cumplir con ambos objetivos habra que tomar n=354 con lo que el lmite para el error de
la estimacin de p1 disminuira (con un 95% de confianza) hasta:

p1 q 1 N n 0, 60 0, 40 3.000 354
2 V ( p1 ) = 2 =2 = 0, 0489 ( 4,9%)
n 1 N 353 3.000
o bien la cota del error de estimacin del 10% se tiene con un nivel de confianza mucho
mayor

p1 q 1 N n 0, 60 0, 40 3.000 354
z V ( p1 ) = z = z = 0,10
2 2 n 1 N 2 353 3.000
z 0, 02445 = 0,10 z = 4, 09
2 2

buscando en la tabla de la Normal (o con ayuda de la hoja de clculo Excel,...) la probabilidad


comprendida entre (-4,09 , 4,09), se obtiene 0,99995684, es decir, prcticamente un nivel de
confianza del 100%.

20
EJERCICIOS RESUELTOS

1. Se selecciona una m.a.s. de 9 compras de clientes de un centro comercial para estimar el


valor medio de las compras por cliente.
VALOR en 33,5 32 52 43 40 41 45 42,5 39
a) Obtener un intervalo de confianza para el valor medio de las compras.
b) Podemos aceptar que la compra media es de 45?
c) Qu tamao muestral deberamos tomar para que el LEE sea de 2?
SOLUCIN:
33, 5 + ... + 39
a) = y = = 40,89
9

S2 =
1
9 1
( 2 2
)
( 33,5 40,89 ) + ... + ( 39 40,89 ) = 35, 67

( )
V y =
S2
n
= 3,963 ( )
B = 2 V y = 3, 98

( 40,89 3,98 ; 40,89 + 3,98) = ( 36,91; 44,87 )


b) No, porque 45 ( 36,91; 44,87 )

2 S 2 35, 67
c) n = = = 35, 67 36 compras
B2 B2 1
4 4

2. Se han entrevistado 1.000 vecinos, elegidos aleatoriamente entre los ms de cien mil
habitantes de una ciudad para conocer su opinin sobre los nuevos impuestos municipales.
655 manifestaron su opinin desfavorable. Estime la proporcin de vecinos que estn en
contra de los nuevos impuestos y establezca el lmite para el error de estimacin. Se
puede afirmar que la mayora de los habitantes estn en contra?
SOLUCIN:
655
p= = 0, 655 p = 65,5%
1.000

pq 0, 655 (1 0, 655)
V ( p) = = = 0, 0002262012
n 1 999

2 V ( p) = 0, 0301 3, 01%

(65,5% 3, 01% , 65, 5% + 3, 01%) = (62, 49% , 68, 51%)

21
p (62, 49% , 68,51%) p > 50% s se puede afirmar que la mayora de los
habitantes estn en contra

3. El Centro de Estadstica desea estimar el salario medio de los trabajadores de los


invernaderos de una regin. Se decide clasificarlos en dos estratos, los que poseen contrato
fijo y los que tienen un contrato temporal. El salario de los contratos fijos est
comprendido entre los 1.200 y 2.200 euros mensuales, el salario de los contratos
temporales est comprendido entre 500 y 1.700 euros mensuales. Cul debe ser el tamao
muestral total y su asignacin para que se estime el salario medio de los contratos fijos con
un error inferior a 100 y el salario medio de los contratos temporales con un error inferior
a 120?
SOLUCIN:
Ri Ri
i
i2
4
2.200-1.200=1000 250 62.500
1.700-500=1.200 300 90.000

12 12 62.500 62.500
n1 = = 2
= = = 25
D1 B 1 100 2 10.000
4 4 4

22 22 90.000 90.000
n2 = = 2
= = = 25
D2 B 2 120 2 14.400
4 4 4

n = n1 + n2 = 50

4. Entre todas las oficinas bancarias de una pequea ciudad se tienen concedidos 2000
prstamos hipotecarios. Existen razones para pensar que el prstamo hipotecario de menor
cuanta es de algo ms de 1200 euros, siendo de casi 11000 euros el de mayor cuanta.
cul es el tamao muestral necesario para estimar estos dos parmetros:
- la cuanta media de los prestamos cometiendo un error de estimacin menor de 400
euros y
- la proporcin de prstamos pendientes de amortizar ms de la mitad de la deuda
cometiendo un error mximo del 5%?
SOLUCIN:
N = 2.000
R
R = 11.000 1.200 = 9.800 = 2450 2 6.002.500
4

22
B 2 4002
D= = = 40.000
4 4
N 2
n= = 139, 65 140
( N 1) D + 2

B 2 0.052
D= = = 0, 000625
4 4
Npq
p = q = 0,5 n= = 333, 47 334
( N 1) D + pq

Para conseguir estimar los dos parmetros con los niveles de error especificados
necesitamos un tamao muestral igual al mximo de 140 y 334. n = 334 .

5. Se desea estimar el salario medio de los empleados de una empresa y la proporcin de


empleados que apoyan a la actual directiva. La empresa tiene 110 empleados y se sabe que
el salario est comprendido entre los 1500 y 1800 euros mensuales. Cul debe ser el
tamao muestral para que al estimar el salario medio la cota de error se site en 10 euros y
al estimar la proporcin de los que apoyan a la actual directiva el error mximo cometido
sea del 2%?
SOLUCIN:
R
N = 110 R = 1.800 1.500 = 300 = 75 2 5625
4
B 2 102
D= = = 25
4 4
N 2
n= = 74,1 75
( N 1) D + 2

B 2 0.022
D= = = 0, 0001
4 4
Npq
p = q = 0,5 n= = 105, 4 106
( N 1) D + pq

6. Una empresa de trabajo temporal quiere investigar las necesidades de empleo de las
empresas de un pueblo. Para ello decide seleccionar una muestra de 5 de las 25 inscritas en
el registro mercantil. El nmero de bajas en el ltimo ao, el nmero de empleados y la
respuesta de cada empresa sobre si utilizara los servicios de la empresa de trabajo
temporal fueron los siguientes:

23
Empresa Bajas Empleados Respuesta
1 1 7 Si
2 2 15 No
3 9 85 Si
4 0 3 No
5 2 12 No
a) Estime el nmero de bajas en el ltimo ao en las empresas del pueblo. Calcule el
lmite para el error de estimacin.
b) Estime el nmero de empresas que usaran los servicios ofertados. Calcule el lmite
para el error de estimacin.
SOLUCIN:

a) N = 25 n=5
14
y= = 2,8 = N y = 70
5
S2 12, 7
V ( ) = N ( N n) = 25 20 = 1270
n 5
B = 2 V ( ) = 71, 2741

Nota: este apartado podr resolverse de otra forma cuando estudiemos el muestreo por
conglomerados. Vase ejercicio resuelto 4 del tema 5.

b)
2
p= = 0, 4 = N p = 10
5
pq 0, 24
V ( ) = N ( N n) = 25 20 = 30
n 1 4
B = 2 V ( ) = 10,9545

7. El consumo medio de combustible de los taxis de una ciudad es 5.6 litros cada 100 Km.
Puesto que se considera que el consumo es demasiado elevado, en 600 taxis se monta un
dispositivo para disminuirlo. Pasado cierto tiempo se toma una muestra aleatoria de 20
taxis, elegidos entre los 600 que colocaron el dispositivo. El consumo en litros de
combustible por cada 100 Km. se recoge en la siguiente tabla
Taxi n Consumo Taxi n Consumo Taxi n Consumo Taxi n Consumo
1 5,4 6 6,3 11 3,6 16 5,4
2 5,5 7 5,4 12 6,7 17 4,8
3 6,9 8 5 13 5,2 18 4,7
4 3,9 9 4,5 14 5,1 19 5,8
5 4,5 10 4,4 15 5,4 20 6,2
a) Estmese mediante un intervalo de confianza la proporcin de taxis con un consumo
inferior a 5,6 litros/100 Km.

24
b) Cuantos taxis deben observarse para estimar la anterior proporcin con un error
menor o igual que un 10%?
SOLUCIN:
a) 15 de los 20 taxis no superan el consumo de 5,6 litros/100 Km, por tanto

15 pq N n 0, 75 0, 25 580
p= = 0, 75 V ( p) = = = 0, 00954
20 n 1 N 19 600

2 V ( p) = 0,1953

( 0, 75 0,1953 , 0, 75 + 0,1953) = ( 0,5547 , 0,9453) ( 55, 47% , 94,53% )

( 0,10 )
2

b) B = 0,10 D= = 0, 0025
4

Npq 600 0, 75 0, 25
n= = = 66, 77 67
( N 1) D + pq ( 599 0, 0025 ) + ( 0, 75 0, 25 )

8. Una muestra aleatoria simple de 6 deudas de clientes de una farmacia es seleccionada para
estimar la cantidad total de deuda de las 100 cuentas abiertas. Los valores de la muestra
para estas seis cuentas son los siguientes:
Dinero adeudado ()
35,50
32,00
43,00
41,00
44,00
42,50
Estime el total del dinero adeudado y establezca un lmite para el error de estimacin.
SOLUCIN:
yi yi2
35,50 1260,25
32,00 1024,00
43,00 1849,00
41,00 1681,00
44,00 1936,00
42,50 1806,25
n n

y
i =1
i = 238,00 y
i =1
2
i = 9556,50

N n
100
= N y =
n
y
i =1
i =
6
238=3966,6

25
2
n
n yi
yi2 i =1
1 2382
1 n
( ) n
2
S2 = yi y
n 1 i =1
= i =1
n 1
= 9556,50
5 6
= 23,1667

2
S 23,1667
2 V ( ) = 2 N ( N n) = 2 100(100 6) = 381, 02
n 6
Los anteriores clculos que se han realizado a mano o con ayuda de una calculadora bsica
se simplifican notablemente si utilizamos una calculadora cientfica de uso comn. Estas
calculadoras nos proporcionan los valores de un grupo de funciones estadsticas

x , x,
2
x, n y n 1 de forma inmediata.

n = sx = desviacin tpica n 1 = S x = cuasidesviacin tpica

9. En un estudio sociolgico, realizado en una pequea ciudad, se hicieron llamadas


telefnicas para estimar la proporcin de hogares donde habita por lo menos una persona
mayor de 65 aos de edad. La ciudad tiene 5000 hogares, segn la gua de telfonos ms
reciente. Una muestra aleatoria simple de 300 hogares fue seleccionada de la gua. Al
terminar la investigacin de campo, de los 300 hogares muestreados, en 51 habita al
menos una persona mayor de 65 aos. Contraste la hiptesis de que en el 25% de los
hogares de esa ciudad habita al menos una persona mayor de 65 aos.
SOLUCIN: N=5000, n=300

51 pq N n
p= = 0,17 q = 1 p = 0,83 V ( p ) = = 0, 00044359197 2 V ( p ) = 0, 0421
300 n 1 N
25% (17% 4, 21% ) = (12, 79%, 21, 21% )

luego se rechaza la hiptesis de que en el 25% de los hogares de esa ciudad habita al
menos una persona mayor de 65 aos.

10. El gerente de un taller de maquinaria desea estimar el tiempo medio que necesita un
operador para terminar una tarea sencilla. El taller tiene 45 operadores. Se seleccionaron
aleatoriamente 5 operadores y se les tom el tiempo. Los resultados obtenidos son los
siguientes:
Tiempo(minutos) 4,2 5,1 7,9 3,8 5,3
Se puede aceptar la hiptesis de que el tiempo medio que necesitan los operarios del
taller para terminar dicha tarea es inferior a 6 minutos?

26
SOLUCIN: (con las funciones del modo SD de la calculadora )

1 n 1 n
( )
2
N=45, n=5 y= yi = 5, 26
n i =1
S2 = yi y
n 1 i =1
= 2, 563

S2 N n
V ( y) = = 0, 4556 2 V ( y ) = 1,35 Intervalo de confianza : ( 3,91 min ., 6, 61 min .)
n N
Valores mayores e igual a 6 minutos pertenecen al intervalo de confianza, por tanto no
podemos aceptar esa hiptesis.

11. Con objetivos benficos, una asociacin filantrpica ha solicitado firmas para una peticin
en 700 hojas. Cada hoja tiene espacio suficiente para 40 firmas pero en muchas de las
hojas se ha obtenido un nmero menor. Contando el nmero de firmas por hoja en una
muestra aleatoria de 50 hojas se han observado los siguientes resultados:
50 50

Y = 1.450; Y
i =1
i
i =1
i
2
= 54.496

Cul sera la previsin ms optimista y ms pesimista en cuanto al nmero total de firmas


recogidas para la peticin?
SOLUCIN: N=700, n=50
2
n
n yi
yi2 i =1
1 n 1450 n
y=
n i =1
yi =
50
= 29 S 2 = i =1
n 1
= 254

2
S
= N y = 20.300 V ( ) = N ( N n) = 2.311.400 B = 2 V ( ) = 3.040, 66
n
( 20.300 3.040, 66 ) = (17.259,34 , 23.340, 66 )
Previsin ms optimista: 23.340
Previsin ms pesimista: 17.259

27
2. Muestreo aleatorio estratificado.
2.1 Seleccin de una muestra aleatoria estratificada.
2.2 Estimacin de la media, proporcin y total poblacionales.
2.3 Determinacin del tamao muestral.
2.4 Asignacin de la muestra.
2.4.1 Asignacin ptima.
2.4.2 Asignacin de Neyman.
2.4.3 Asignacin Proporcional.
2.5 Estratificacin despus de seleccionar la muestra.

2.1 Seleccin de una muestra aleatoria estratificada.


Una muestra aleatoria estratificada se obtiene mediante la separacin de los elementos de la
poblacin en conjuntos que no presenten interseccin, llamados estratos, y la seleccin
posterior de una muestra aleatoria simple en cada estrato.
Los estratos deben formarse de manera que los elementos de cada estrato sean lo ms
homogneos que se pueda entre s (ms homogneos que el conjunto de la poblacin) y las
diferencias entre un estrato y otro sean las mayores posibles. Esta forma de construir los
estratos conduce a muestras con poca variabilidad entre las mediciones que producirn
pequeas varianzas de los estimadores y por tanto menores lmites para los errores de
estimacin que con otros diseos de la muestra.
Otras ventajas adicionales que presenta este tipo de muestreo son las siguientes:
A veces los estratos se corresponden con zonas compactas bien definidas con lo que se
reduce el coste de la muestra.
Adems de las estimaciones para toda la poblacin, este muestreo permite hacer
estimaciones de los parmetros poblacionales para los estratos.

Antes de continuar fijemos la notacin que va a utilizarse:


L = nmero de estratos
N = tamao de la poblacin n = tamao de la muestra
N i = tamao del estrato ni = tamao de la muestra del estrato i
L L
N = Ni n = ni
i =1 i =1

i = media poblacional del estrato i y i = media muestral del estrato i

i = total poblacional del estrato i

i2 = varianza poblacional del estrato i Si2 = cuasivarianza muestral del estrato i

28
pi = proporcin poblacional del estrato i p i = proporcin muestral del estrato i

ci = coste de una observacin del estrato i

2.2 Estimacin de la media, proporcin y total poblacionales.


En cada estrato se ha realizado un muestreo aleatorio simple, sabemos que en cada estrato
L L
N i y i es un estimador insesgado del total i , estimaremos = i por st = N i y i y la
i =1 i =1

1 L
media poblacional =
N
mediante y st =
N
N
i =1
i yi

NOTA: y st y en general ( y = media muestral de las n observaciones)

st en general ( = N y = estimador del total segn un m.a. simple.)

Varianza estimada de y st
1 L 2 1 L 2 Si2 N i ni
V ( y st ) = i i N2
N 2 i =1
N V ( y ) =
i =1
Ni
ni N i
Se obtiene aplicando que la varianza de la suma de variables independientes es la suma de
sus varianzas y que V (kX ) = k 2V ( X ) .

Varianza estimada de st
L
S2 N n
V ( st ) = N 2 V ( y st ) = N i2 i i i
i =1 ni N i

En el caso de variables dicotmicas los estimadores de la proporcin y total poblacionales as


como sus varianzas toman valores similares a los anteriores, salvo las diferencias ya
comentadas en la leccin anterior.
Estimador de la proporcin poblacional p
L
1
p st =
N
N
i =1
i pi

Varianza estimada de p st

1 L
1 L
pi q i N i ni
V ( p st ) =
N2
N
i =1
i
2
V ( pi ) =
N2
N
i =1
i
2

ni 1 N i

Estimador del total poblacional


L
st = N p st = N i pi
i =1

29
Varianza estimada de st
L
p q N n
V ( st ) = N 2 V ( p st ) = N i2 i i i i
i =1 ni 1 N i

Ejemplo 2.1. Se est interesado en determinar la audiencia de la publicidad televisiva en una


cadena local de un municipio, se decide realizar una encuesta por muestreo para estimar el
nmero de horas por semana que se ve la televisin en las viviendas del municipio. ste est
formado por tres barrios con diferentes perfiles socio-culturales que afectan a la audiencia
televisiva. Hay 210 hogares en el barrio A, 84 en el barrio B y 126 en el barrio C. La empresa
publicitaria tiene tiempo y dinero suficientes para entrevistar 30 hogares y decide seleccionar
muestras aleatorias de tamaos: 15 del barrio A, 6 del barrio B, y 9 del barrio C.
Se seleccionan las muestras aleatorias simples y se realizan las entrevistas. Los resultados,
con mediciones del tiempo que se ve la televisin en horas por semana, se muestran en la
siguiente tabla:

BARRIO A BARRIO B BARRIO C


36 34 26 20 25 14 22
39 38 32 30 15 17
38 37 29 14 21 11
28 41 35 41 20 14
29 37 41 39 24
Estime el tiempo medio que se ve la televisin y el lmite para el error de estimacin, en horas por
semana, para:
a) Los hogares del barrio A.
b) Los hogares del barrio B.
c) Los hogares del barrio C.
d) Todos los hogares

Solucin: en primer lugar se calculan las medias y cuasivarianzas muestrales en cada estrato
y1 = 34, 67 horas / semana y 2 = 28,17 h / s y 3 = 17, 56 h / s S12 = 23, 24 S 22 = 112,57 S32 = 19, 28
y = 28, 23 S 2 = 92, 74

A partir de estos valores calculamos las varianzas de los estimadores de la media en cada
estrato y los lmites para los errores de dichas estimaciones
N1 = 210 N 2 = 84 N 3 = 126 N = N1 + N 2 + N 3 = 420

n1 = 15 n2 = 6 n3 = 9 n = n1 + n2 + n3 = 30

30
S12 N1 n1 S 22 N 2 n2 S32 N 3 n3
V ( y1 ) = = 1, 44 V ( y2 ) = = 17, 42 V ( y3 ) = = 1, 99
n1 N1 n2 N 2 n3 N 3
2 V ( y1 ) = 2, 40 h / s 2 V ( y 2 ) = 8,35 h / s 2 V ( y 3 ) = 2,82 h / s
Para el conjunto de todos los hogares el estimador de la media es
1 3
Ni y i = 28, 23 h / s
y st =
N i =1
y la varianza de este estimador la podemos calcular basndonos en las varianzas de los
estimadores de la media en cada estrato mediante
3
1
V ( y st ) =
N2
N
i =1
i
2
V ( y i ) = 1, 24

o, si se prefiere, utilizando
1 3 2 Si2 N i ni
Ni n N
V ( y st ) =
N 2 i =1 i i
el error para la estimacin de la media para todos los hogares est dado por

2 V ( y st ) = 2, 22 h / s

Ejemplo 2.2. En el caso anterior, tambin se desea saber qu proporcin de hogares ven un
determinado programa, para decidir la conveniencia de insertar un anuncio en los intermedios
del mismo. La respuesta a la pregunta de si ven dicho programa en los hogares de la muestra
anterior se recoge a continuacin:
BARRIO A BARRIO B BARRIO C
SI NO SI SI SI NO SI
SI SI SI NO SI SI
NO NO NO SI SI SI
NO SI NO SI NO NO
SI NO NO SI SI
Estime con un intervalo de confianza la proporcin de hogares del municipio donde se ve el
programa.
Solucin: en primer lugar se calculan las proporciones muestrales en cada estrato
7 5 6
p1 = = 0, 4667 p2 = = 0,8333 p3 = = 0, 6667
15 6 9
La estimacin puntual de la proporcin de hogares del municipio donde se ve el programa es
1 3
Ni pi = 0, 60
p st =
N i =1
la varianza y error de estimacin asociados son

1 3 2 pi q i N i ni
V ( p st ) = Ni n 1 N = 0, 00748
N 2 i =1
2 V ( p st ) = 0,173
i i
y el intervalo de confianza expresado en porcentajes es

31
( 60% 17,3% ) = ( 42, 7%, 77,3% )

2.3 Determinacin del tamao muestral.


El tamao muestral para conseguir un lmite para el error de estimacin de la media, B, viene
1 L
i2 N i ni
dado por 2 V ( y st ) = B donde V ( y st ) = 2
N
Ni =1
i
2

ni N i 1
.

No podemos despejar el valor de todos los ni de una sola ecuacin a menos que conozcamos

la relacin entre los ni y n . Hay diversas formas de asignar el tamao muestral n en los
diferentes estratos (problema de la asignacin de la muestra que estudiaremos a
continuacin), sustituyendo ni = ni en V ( y st ) se puede despejar n en funcin de los i

obteniendo el tamao muestral aproximado que se requiere para estimar con un lmite para
el error de estimacin B.
L
N i2 i2
i =1 i
n= L
N 2 D + N i i2
i =1
2
B B2
D= y la misma expresin vale para el total tomando D = .
4 4N 2
Al igual que en el m.a.s. para poder usar la anterior ecuacin necesitamos conocer las
varianzas poblacionales de los estratos o valores aproximados de ellas, para lo cual se pueden
usar las cuasivarianzas muestrales de una muestra previa o basarnos en el rango de variacin
de las observaciones dentro de cada estrato.
En el caso de variables dicotmicas se obtiene una expresin similar, teniendo en cuenta que
en este caso particular i2 = pi qi
L
N i2 pi qi

i =1 i
n= L
N 2 D + N i pi qi
i =1

B2 B2
D= (para estimar p) y la misma expresin vale para el total tomando D = .
4 4N 2

2.4 Asignacin de la muestra.


Hay diversas formas de asignar el tamao muestral n en los distintos estratos.
El objetivo del diseo de una encuesta por muestreo es proporcionar estimadores con varianza
pequea (por tanto, pequeo error de estimacin) al menor coste posible.

32
El mejor esquema de asignacin est influido por:
El nmero total de elementos en cada estrato.
La variabilidad de las observaciones en cada estrato.
El coste de obtener una observacin en cada estrato.

2.4.1 Asignacin ptima.


La asignacin que minimiza el coste para un lmite para el error de estimacin fijado, B, se
denomina asignacin ptima y est dada por
N j j
cj
j = L
N i i

i =1 ci

sustituyendo los j en la expresin que obtenamos antes para n se tiene el tamao total de la

muestra segn la asignacin ptima


L L
Ni i
Ni i ci
i =1

i =1 ci
n= L
N 2 D + N i i2
i =1

En el caso dicotmico las anteriores expresiones toman los valores


pjq j
Nj
cj
j = L
pi qi
N
i =1
i
ci
L L
pi qi
Ni
i =1
pi qi ci N
i =1
i
ci
n= L
N 2 D + N i pi qi
i =1

B2 B2
D= (para estimar la media o p), D = (para estimar el total).
4 4N 2
En algunas ocasiones interesa encontrar la asignacin que minimiza el error de estimacin
para un coste total fijo de obtencin de la muestra, C. En este caso la asignacin ptima
tambin es la respuesta y el tamao total de la muestra, n, viene dado por:
L
N i i
C
i =1 ci
n= L

N
i =1
i i ci

33
Anlogamente para el caso dicotmico sustituyendo i = pi qi .

2.4.2 Asignacin de Neyman.


Cuando los costes de observacin de cada estrato son los mismos, las expresiones de la
asignacin ptima se simplifican y transforman en:
Caso numrico
N j j
j = L

N
i =1
i i

2
( N )
L

i i
n= i =1
L
N 2 D + N i i2
i =1

Caso dicotmico
N j pjqj
j = L

N
i =1
i pi qi

2
( NL

i pi qi )
n= i =1
L
N 2 D + N i pi qi
i =1

A este tipo de asignacin se le denomina de Neyman que coincide con la asignacin ptima
solamente cuando los costes de observacin son iguales en todos los estratos. Esta asignacin
se utiliza an cuando los costes de observacin no son idnticos, a veces, sencillamente no se
conocen.

2.4.3 Asignacin Proporcional.


Si adems de los costes, coincide el valor de las varianzas en cada uno de los estratos, las
expresiones de la asignacin ptima y de Neyman se simplifican y reducen a
Caso numrico
Nj
j =
N

N i i
2

n= i =1
L
1
ND +
N
N
i =1
i i
2

34
Caso dicotmico
Nj
j =
N
L

N pq i i i
n= i =1
L
1
ND +
N
N pq
i =1
i i i

La asignacin Proporcional puede y suele utilizarse cuando las varianzas y costes de


observacin no son iguales para cada estrato, por la simplicidad de los clculos y por las
ventajas que presenta frente a los anteriores tipos de asignaciones:
Cuando se utiliza la asignacin Proporcional el estimador y st coincide con la media muestral

de la muestra que rene a todas las muestras de cada estrato, y st = y (anlogamente para p st
y el total).
Cuando se observa ms de una variable en cada unidad muestral para estimar ms de un
parmetro poblacional aparecen complicaciones en la asignacin y determinacin del tamao
muestral. Con la asignacin Proporcional y tomando como n el mximo de los valores
encontrados para cada estimacin se resuelve el problema como puede verse en el siguiente
ejemplo:
En la asignacin ptima y en la de Neyman los i dependen de las varianzas y pueden ser
distintos de una variable a otra
1 estimacin: n = 100 1 = 0,10 n1 = 10 2 = 0,90 n2 = 90
2 estimacin: n = 40 1 = 0,50 n1 = 20 2 = 0,50 n2 = 20
An tomando el mayor de los tamaos muestrales (100) y pasando la encuesta a 10 individuos
del estrato 1 y 90 del estrato 2 no tenemos garantizado que se satisfaga el error de estimacin
fijado para la segunda estimacin que necesita al menos 20 individuos de cada estrato.
Nj
En la asignacin Proporcional no ocurre lo anterior pues los j = son iguales para todas
N
las variables al no depender de sus varianzas, as si en dos estimaciones para los niveles de
error requeridos tenemos lo siguiente
1 estimacin: n = 100 1 = 0,30 n1 = 30 2 = 0, 70 n2 = 70
2 estimacin: n = 40 1 = 0,30 n1 = 12 2 = 0, 70 n2 = 28
tomando como n el mximo de los dos (y en general para k variables), se tiene garantizado
que se cumple con los lmites para el error fijados para todas las estimaciones.

35
Ejemplo 2.3 Continuando con el ejemplo 2.1
a) Qu tipo de asignacin se ha utilizado?
Debido a los traslados necesarios no cuesta lo mismo obtener una observacin en un barrio
que en otro. Se estima que el coste de una observacin del barrio A es de 1, 9 para el barrio
B y 4 para el barrio C.

b) Cuntos hogares deberan entrevistarse para estimar el nmero medio de horas a la


semana que se ve la televisin en los hogares del municipio con un error inferior a 1
hora. (Tmese los anteriores datos como una muestra previa para estimar los
parmetros necesarios).
c) Supngase que se tiene slo 600 para gastar en el estudio, determine el tamao de la
muestra y la asignacin que minimizan el error de estimacin. (Como en el apartado
anterior, tmese los datos de la tabla como una muestra previa para estimar las
varianzas de los estratos).
Solucin:
Ni N
a) Podemos comprobar que se cumple ni = n i = i i o equivalentemente que
N N
ni N i
= i
n N
15 210 6 84 9 126
= = 0, 5 = = 0, 2 = = 0, 3
30 420 30 420 30 420
luego la asignacin utilizada ha sido la Proporcional.
b) Segn los datos anteriores estimamos las varianzas de cada estrato por
2 2 2
1 = S12 = 23, 24 2 = S22 = 112,56 3 = S32 = 19, 28
N i i
Ni i ci N i i ci ci N i i2
210 4,8208 1 1012,368 1012,368 4880,4
84 10,6094 3 2673,5688 297,0632 9455,04
126 4,3909 2 1106,5068 276,6267 2429,28
420 4792,4436 1586,0579 16764,72
B2 1
D= = = 0, 25
4 4
3 3
Ni i
N
i =1
i i ci
i =1 ci 4792, 4436 1586, 0579
n= = = 124,89
3
N 2 D + N i i2 ( 4202 0, 25) + 16764, 72
i =1

36
N1 1
c
1 = 3 1 = 0, 6383 2 = 0,1873 3 = 0,1744
N i i
i =1 ci

n1 = n1 = 79, 71 80 n2 = n2 = 23,39 24 n3 = n3 = 21, 78 22


n = 80 + 24 + 22 = 126
c) En el supuesto de que se disponga slo de 600 para realizar el estudio
3
N i i
600
i =1 ci 600 1586, 0679
n= 3
= = 198,57
4792, 4436
N
i =1
i i ci

y la asignacin de la muestra en cada estrato est dada por la asignacin ptima


n1 = 0, 6383n = 126, 75 126 n2 = 0,1873n = 37,19 37 n3 = 0,1744n = 34, 63 34
n = 126 + 37 + 34 = 197
o bien resolviendo la ecuacin
c1n1 + c2 n2 + c3 n3 = 600

donde ni = i n

c11n + c22 n + c33 n = 600

600 600
n= = = 198,57
c11 + c22 + c33 3, 0216

A partir de n se obtienen los ni = i n segn la asignacin ptima.

Ejemplo 2.4 Continuando con el ejemplo 2.2


a) Cuntos hogares deberan entrevistarse si se quisiera hacer dicha estimacin con un
error inferior al 5%. (Supngase que se realiza la entrevista por telfono y el coste de
las observaciones es el mismo para todos los casos al no ser necesarios los traslados.
Tmese los anteriores datos como una muestra previa para estimar los parmetros
necesarios)
b) Respndase a la pregunta anterior pero suponiendo que no se tiene ninguna
informacin previa sobre la proporcin de hogares donde se ve el programa.

37
Solucin: a)
Ni pi qi N i pi qi N i pi qi
210 0,4667 0,5333 52,2671 104,7669
84 0,8333 0,1667 11,6685 31,3075
126 0,6667 0,3333 27,9986 59,3955
420 91,9342 195,4699
B 2 0, 052
D= = = 0, 000625
4 4
2
( N
3

i pi qi ) 195, 46992
n= i =1
= = 188,98
3
N 2 D + N i pi qi ( 4202 0, 000625) + 91,9342
i =1

N1 p1q1 104, 7669


n1 = n1 = n 3
= 188,98 = 101, 29 102
195, 4699
N
i =1
i pi qi

anlogamente n2 = 30, 27 31 n3 = 57, 42 58 n = 102 + 31 + 58 = 191


b)
Ni pi qi N i pi qi
210 0,5 0,5 52,5
84 0,5 0,5 21
126 0,5 0,5 31,5
420 105
L

N pq i i i
105
n= i =1
L
= = 204,878
105
ND +
1
N pq i i i ( 420 0, 000625 ) +
N i =1 420

210
n1 = 204,878 = 102, 439 103 anlogamente n2 = 40,98 41 n3 = 61, 46 62
420
n = 103 + 41 + 62 = 206

El muestreo estratificado no siempre conduce a un estimador con menor error de


estimacin, esto suele ocurrir cuando los estratos no estn formados por elementos
suficientemente homogneos. Muchas veces es debido a que predomina el deseo de obtener
estimaciones en cada estrato (por ejemplo, en un estudio regional tambin se quieren obtener
estimaciones a nivel provincial) frente al objetivo de minimizar los errores de los estimadores.
Este problema queda bien ilustrado con el siguiente ejemplo.

Ejemplo 2.5 Un distribuidor de productos de limpieza desea conocer el consumo por hogar
durante un ao de un determinado producto en una comarca formada por cuatro municipios.
38
Para estimar de paso tambin el consumo en cada municipio decide usar muestreo
estratificado tomando cada municipio como un estrato. Se sabe que el 20% de la poblacin de
la comarca vive en el municipio 1, el 30% en el municipio 2, el 25% en el municipio 3 y el
25% restante en el municipio 4. El distribuidor tiene medios suficientes para controlar y
obtener datos sobre el consumo anual de 20 hogares.
Dado que no tiene informacin previa respecto a las varianzas de los estratos y porque el coste
del muestreo es el mismo en cada municipio, decide aplicar asignacin Proporcional, la cual
conduce a
N1
= 20 0, 20 = 4 de forma similar n2 = 6 n3 = 5 n4 = 5 .
n1 = n
N
Obteniendo los resultados de la tabla siguiente (consumo expresado en euros).
Estrato 1 Estrato 2 Estrato 3 Estrato 4
470 490 540 450
510 500 480 560
500 470 500 460
550 520 470 440
550 470 580
500
y1 = 507,5 S12 = 1091,67 y 2 = 505 S22 = 750 y 3 = 492 S32 = 870 y 4 = 498 S42 = 4420

Estime el consumo anual medio por hogar y fije un lmite para el error de estimacin.

N1 N2 N3 N4
Solucin: = 0, 20 = 0,30 = 0, 25 = 0, 25
N N N N
4 4
1 Ni
y st = N y = Ni i y i = ( 0, 20 507, 5 ) + ( 0,30 505 ) + ( 0, 25 492 ) + ( 0, 25 498 ) = 500,5
N i =1 i =1

Obsrvese que cuando se utiliza la asignacin Proporcional y st = y , efectivamente

1 20 10010
y=
n i =1
yi =
20
= 500,5

En la siguiente expresin consideramos los coeficientes correctores para poblaciones finitas en


cada estrato iguales a la unidad
2
1 4
S2 N n 4
N 2 S2 2
N S2
V ( y st ) = 2
N

i =1
N i i i = i2 i = i i =
i
2

ni N i i =1 N ni i =1 N ni

1091, 67 2 750 2 870 2 4420


= 0, 202 + 0, 30 + 0, 25 + 0, 25 = 88, 29
4 6 5 5

2 V ( y st ) = 18, 79

39
Supongamos que el distribuidor hubiera decidido tomar una muestra aleatoria simple de 20
hogares, los mismos 20 de la tabla anterior, entonces el estimador de la media hubiera sido
1 20
y= yi = 500, 5
n i =1
que coincide con el estimador del muestreo estratificado por las razones mencionadas
anteriormente, pero la varianza estimada y error de estimacin asociados tomaran los valores
S n21 = 1520, 79

S n21 N n 1520, 79 N n
V ( y) = = = 76, 04 , se supone 1
n N 20 N

2 V ( y ) = 17, 44
Se observa que el error de estimacin es menor en el caso del muestreo aleatorio simple, esto
es debido a que el distribuidor no tuvo en cuenta que el consumo vara mucho dentro del
cuarto municipio. Pudo haber obtenido un error menor si hubiera estratificado en base al
tamao de las familias u hogares, esto es, colocando los hogares pequeos en un estrato, los
medianos en otro, ..., es decir, formando los estratos con hogares que tengan un consumo
similar.

2.5 Estratificacin despus de seleccionar la muestra.


A veces no se sabe a qu estrato pertenece un dato hasta que no se observa (por ejemplo,
estratos segn sexo y entrevista telefnica).
Supngase una muestra aleatoria simple de n personas para una encuesta. La muestra puede
ser dividida en n1 masculinos y n2 femeninos despus de que ha sido realizada. Entonces en
Ni
lugar de usar y para estimar , podemos usar y st siempre que sea conocido para todo i.
N
Obsrvese que en esta situacin los ni son aleatorios, ya que varan de una muestra a otra

aunque n sea fijo. Luego esto no es una muestra aleatoria estratificada en pleno sentido, pero
Ni
si es conocido y ni 20 i , entonces este mtodo de estratificar despus de la seleccin
N
es casi tan exacto como el muestreo aleatorio estratificado con asignacin Proporcional. Este
Ni
mtodo no debe usarse si o una buena aproximacin de su valor se desconocen.
N

40
Ejemplo 2.6 En una ciudad se sabe que el 30% de los hogares tienen calefaccin elctrica. Al
realizar una encuesta sobre el consumo de energa (valor en euros de la factura bimensual) se
obtuvieron los siguientes resultados:
Tipo Calefaccin N casas Valor total de las facturas cuasidesviacin tpica muestral
Elctrica 60 5730 200
No elctrica 40 2080 90
Obtenga una estimacin del valor medio de la factura de electricidad en la ciudad y el lmite
para el error de estimacin.
Solucin: Ya que la proporcin observada de facturas de hogares con calefaccin elctrica
(0,60=60/100) est muy alejada de la proporcin verdadera (0,30), es conveniente la
estratificacin despus de que se ha seleccionado la muestra aleatoria simple. Adems el
procedimiento se justifica pues tanto n1 como n2 superan 20.
5730 2080
y1 = = 95,5 y2 = = 52
60 40
2 2
1 Ni
y st =
N
Ni y i =
i =1 i =1 N
y i = (0, 30 95,5) + (0, 70 52) = 65, 05

1 2
Si2 N i ni 2
N2 S2 N n
V ( y st ) =
N2
Ni2
i =1 ni N i
= i2 i i i
i =1 N ni N i
omitiendo el coeficiente corrector por poblaciones finitas se tiene
2
2
N i2 Si2 2
N i Si2 2 200
2
2 90
2
V ( y st ) = = = 0,30 +
0, 70 = 159, 225
i =1 N 2 ni i =1 N ni 60 40

2 V ( y st ) =25,24

A veces este mtodo de estimacin se utiliza para ajustar por no respuesta. Por ejemplo, si
muchos de quienes no respondieron a una muestra aleatoria simple son varones, entonces la
proporcin de varones en la muestra va a ser pequea, y se podra conseguir un estimador
ajustado mediante la estratificacin despus del muestreo.

As, en este ejemplo la baja representacin en la muestra de facturas sin calefaccin elctrica y
la alta de facturas con calefaccin elctrica conducen a una sobreestimacin del valor medio
de las facturas si se utiliza muestreo aleatorio simple y no se ajusta la estimacin de la media
con la estratificacin despus de seleccionar la muestra:
5730 + 2080 7810
y= = = 78,10
60 + 40 100

41
Con el muestreo aleatorio simple sobrevaloraramos el consumo medio de electricidad por
hogar (78,10>>65,05).

EJERCICIOS RESUELTOS

1. Un analista de la opinin pblica tiene un presupuesto de 20.000 euros para realizar una
encuesta sobre el nmero medio de coches por hogar. Se sabe que de los 10.000 hogares
de la ciudad, 9.000 tienen telfono. Las entrevistas por telfono cuestan 10 euros por hogar
llamado y las entrevistas personales cuestan 30 euros por hogar visitado. Suponga que las
varianzas en los estratos con y sin telfono son iguales. Con el objetivo de minimizar el
lmite de error de estimacin Cuntos hogares deben ser entrevistados en cada estrato si
los hogares que cuentan con servicio telefnico son entrevistados por telfono y los
hogares sin telfono son entrevistados personalmente?
SOLUCIN:

L
N i i L
N i L
Ni L
Ni
C C C C
i =1 ci i =1 ci i =1 ci i =1 ci 20.000 3.028, 624
n= L
= L
= L
= L
= = 1784,81
33.937, 726
N
i =1
i i ci N
i =1
i ci N i ci
i =1
N
i =1
i ci

Ni ci Ni N i ci i
ci
9.000 10 2.846,05 28.460,5 2.846,05/3.028,624=0,9397
1.000 182,574 5.477,226 182,574/3.028,624=0,0603
30
10.000 3.028,624 33.937,726 1,0000

n1 = n1 = 1.784,81 0,9397 = 1677, 2 1677


n2 = n2 = 1.784,81 0, 0603 = 107, 59 107
n = n1 + n2 = 1784
O bien
c1n1 + c2 n2 = 20.000
c11n + c22 n = 20.000
9, 397 n + 1,809n = 11, 206n = 20.000
20.000
= 1.784,8 = n
11, 206
Y a partir de n se obtienen n1 y n2 como antes.

42
2. Se desea conocer el nmero de fines de semana que las familias de una gran ciudad salen
fuera de ella. Se sabe que el 425% de las familias tienen de 0 a 2 hijos, el 30% tienen de 3
a 5 hijos y el 275% tienen ms de 5 hijos. Se realiz un muestreo segn el nmero de
hijos y se pregunt a las familias sobre los fines de semana que pasan fuera, obtenindose
los siguientes datos:
Nmero de hijos ni n
S i2
yi
i =1
0-2 25 239 6076
3-5 19 174 6301
Ms de 5 16 78 7824
Estimar el nmero medio de fines de semana que las familias pasan fuera de la ciudad y
dar el lmite de error de estimacin. Omitir el corrector por poblacin finita.
SOLUCIN:
239 174 78
y1 = = 9,56 y2 = = 9,16 y3 = = 4,87
25 19 16
L L
1 Ni
y st = Ni y i = y i = ( 0, 425 9, 56 ) + ( 0, 30 9,16 ) + ( 0, 275 4,87 ) = 8,15
N i =1 i =1 N

N i ni Si2 N i ni
2
Si2 N 2 S2 N i Si
L L L L 2
1 1
Si
Ni
= 1 V ( y st ) = 2
N
Ni2
i =1 ni N i
= 2
N
Ni2
i =1
= i2 i =
ni i =1 N ni i =1

N ni
=

60, 77 2 63, 01 2 78, 24


= 0, 4252 + 0,30 + 0, 275 = 1,107
25 19 16
2 1,107 = 2,1

3. Una compaa de autobuses est planeando una nueva ruta para dar servicio a cuatro
barrios. Se tomaron muestras aleatorias de hogares en cada barrio y se solicit a los
miembros de la muestra que valorasen en una escala de 1 (totalmente opuesto) a 5
(totalmente a favor) su opinin sobre el servicio propuesto. Los resultados se resumen en la
tabla adjunta:
Barrio
1 2 3 4
N i 240 190 350 220
ni 25 25 25 25
y i 3,5 3,6 3,9 3,8
S i 0,8 0,9 1,2 0,7
a) Halle un intervalo de confianza para la opinin media de los hogares que dispondrn del
nuevo servicio.
b) Si se asigna la muestra de 100 hogares de la mejor forma, determine cuntos
perteneceran al barrio 3. (Suponga iguales los costes de observacin)
43
SOLUCIN:
a)
L
1 L
1 L
Si2 N i ni
N = N i = 1000 y st = Ni y i =3, 725 V ( y st ) = Ni2 = 0, 00973
i =1 N i =1 N2 i =1 ni N i
B = 2 V ( y st ) = 0,1973 ( 3,5277 , 3,9223)
b)
N 3 3 350 1, 2
n3 = n3 = 100 = 100 =
4
(240 0,8) + (190 0,9) + (350 1, 2) + (220 0, 7)
N
i =1
i i

= 100 0, 4482 = 44,82 45

4. Una empresa especializada en seguros est pensando en ofrecer sus servicios a las
empresas de los polgonos industriales de una ciudad. Para ajustar sus tarifas desea estimar
el gasto en pequeas reparaciones de mantenimiento (objeto del seguro) de dichas
empresas. Se clasifican las empresas en funcin de su tamao. El nmero de empresas de
cada tipo, el coste de obtencin de esta informacin en cada empresa as como los valores
mnimos, medios y mximos de un estudio similar hecho hace dos aos se expresan en la
siguiente tabla (los costes y gastos estn expresados en euros)
Tipo de Nmero de Costes de Gastos de reparacin
empresa empresas observacin Mnimo Media Mximo
A 100 16 400 500 600
B 500 9 240 300 360
C 700 4 70 100 130
Si la empresa de seguros dispone de hasta 600 para llevar a cabo la estimacin, cuntas
empresas de cada tipo tiene que observar para conseguir que sea mnimo el error de
estimacin asociado?
SOLUCIN:
La asignacin que minimiza la cota del error de estimacin para un coste fijo es la
asignacin ptima.
R
Usamos que R4 y por tanto estimamos que .
4
N i i
Ni ci ci Ri i ci i
100 16 4 600-400 50 1250 01087
500 9 3 360-240 30 5000 04348
700 4 2 130-70 15 5250 04565
11500 1
600 = 16n1 + 9n2 + 4n3 ( ni = in ) 600 = 17392n + 39132n + 1826n = 74784n

n = 600/74784 = 80231

n1 = 1n = 872 8 n2 = 2n = 3488 34 n3 = 3n = 3663 36


44
C = (168) + (934) + (436) = 578 < 600

5. En una poblacin compuesta por aproximadamente igual nmero de hombres que de


mujeres se desea estimar el gasto medio mensual por habitante en ocio. Se lleva a cabo la
encuesta por telfono mediante una muestra aleatoria simple de 500 nmeros de telfono
del citado municipio. Despus de obtenidos los datos se observa que slo 100 de los
encuestados fueron hombres y el resto mujeres. Por ello se decide llevar a cabo una
estratificacin despus de seleccionar la muestra obtenindose los siguientes datos
HOMBRES MUJERES
Ni 2.500 2.700
ni 100 400
yi 120 250
Si2 9.000 16.000
Estime la media poblacional de gasto mensual en ocio y su cota de error, mediante
muestreo aleatorio estratificado despus de seleccionar la muestra.
SOLUCIN:
Ni ni yi Si2 Ni y i N i ni Si2 N i ni
2
Ni
Ni ni N i
2.500 100 120 9.000 300.000 0,96 540.000.000
2.700 400 250 16.000 675.000 0,85185 248.399.460
5.200 500 975.000 788.399.460

L
1 975.000
y st =
N
N y
i =1
i i =
5.200
= 187, 5

1 L
Si2 N i ni 788.399.460
V ( y st ) = 2
N

i =1
i
2
N
ni N i
=
5.2002
= 29,16 2 29,16 = 10,8

6. En una poblacin compuesta por aproximadamente igual nmero de hombres que de


mujeres se desea estimar la proporcin de individuos que ven un determinado programa
de televisin. Se lleva a cabo la encuesta por telfono mediante una muestra aleatoria
simple de 300 nmeros de telfono. Despus de obtenidos los datos se observa que slo
50 de los encuestados fueron hombres y el resto mujeres. Por ello se decide llevar a cabo
una estratificacin despus de seleccionar la muestra obtenindose los siguientes datos
HOMBRES MUJERES
Encuestados 50 250
Ven el programa 12 130
Estime la proporcin de la poblacin que ven el programa de televisin y su cota de error,
mediante muestreo aleatorio estratificado despus de seleccionar la muestra.
45
SOLUCIN:
12 130
p1 = = 0, 24 p2 = = 0,52 q i = 1 p i
50 250
L L
1 Ni
p st = Ni pi = p i = ( 0, 50 0, 24 ) + ( 0,50 0,52 ) = 0,38 p st = 38%
N i =1 i =1 N
N i ni
=1 Si
Ni
1 L 2 p i q i N i ni 1 L 2 p i q i N i2 p i q i N i p i q i
L L 2

V ( p st ) = 2 N i = 2 Ni = = =
N i =1 ni 1 N i N i =1 ni 1 i =1 N 2 ni 1 i =1 N ni 1
0, 24 0, 76 2 0,52 0, 48
= 0,502 + 0,50 = 0, 0011812146
49 249

2 V ( p st ) = 0, 0687 6,87%
7. Se quiere hacer un estudio sobre gasto en ropa en una comarca donde el 41% de los
habitantes son mujeres.
a) Se decide tomar una muestra aleatoria estratificada de 300 observaciones con
asignacin proporcional. Cuntos hombres y mujeres deben entrevistarse?
Se toma la anterior muestra, obtenindose los siguientes valores:
media muestral (en euros) cuasivarianza muestral
HOMBRES 120 4000
MUJERES 170 9000
b) Estime el gasto medio en ropa para toda la comarca y el lmite del error de
estimacin asociado.
c) Quiere repetirse el estudio slo en la poblacin de mujeres para estimar el gasto
medio en ropa de ellas con un error inferior a 10 euros. A cuntas mujeres habra
que preguntarle?
SOLUCIN:
N1 N2
a) = 0,59 = 0, 41 n = 300 n1 = 0,59n = 177 n2 = 0, 41n = 123
N N
L L
1 Ni
b) y st = Ni yi = y i = ( 0, 59 120 ) + ( 0, 41 170 ) = 140,5
N i =1 i =1 N

1 L
Si2 N i ni L
N2 S2 4000 9000
V ( y st ) =
N2
Ni2
i =1 ni N i
= i2 i = 0, 592
i =1 N ni
+ 0, 41
177
2

123
= 20,17

2 V ( y st ) = 8, 98146

B2 2 9000
c) B = 10 D = = 25 n = = = 360
4 D 25
46
8. Una corporacin desea estimar el nmero total de horas perdidas debido a accidentes de
sus empleados, en un determinado mes. Ya que los obreros, tcnicos y administrativos
tienen diferentes tasas de accidentes, la corporacin decide usar muestreo estratificado,
formando con cada grupo un estrato. Datos de aos previos sugieren las cuasivarianzas
mostradas en la siguiente tabla para el nmero de horas perdidas por empleado en los tres
grupos, y de datos actuales se obtienen los tamaos de los estratos. No habiendo
diferencia entre los costes de observacin de cada grupo, determine la mejor asignacin
para una muestra de 40 empleados.
Obreros Tcnicos Administrativos
Si2 36 25 9

Ni 132 92 27
SOLUCIN:
Ni i Si N i i i
132 6 792 792 = 0,5941
1.333
92 5 = 0,3451
460 460
1.333
27 3 81
81 = 0, 0608
1.333
1.333 1
Donde se ha aplicado la asignacin de Neyman al ser los costes de observacin iguales:
N j j n1 = 40 0,5941 = 23,8 24
j = L
n2 = 40 0, 3451 = 13,8 14
N
i =1
i i
n3 = 40 0, 0608 = 2, 4 2 n = 40

9. Se dispone de la siguiente informacin sobre tamaos poblacionales de los estratos, costes


de observacin y estimaciones de las proporciones
Tamao del estrato Coste de observacin Proporciones en %
ESTRATO 1 5000 9 90
ESTRATO 2 2000 25 55
ESTRATO 3 3000 16 70
Determine la mejor asignacin para una muestra de 200 observaciones.
SOLUCIN:
Ni ci pi q i p i q i N i p i q i i
ci
5.000 3 0,90 0,10 0,3 500 500 = 0, 4795
1.042, 695
2.000 5 0,55 0,45 0,4975 199 199 = 0,1909
1.042, 695
3.000 4 0,70 0,30 0,45826 343,695 343, 695 = 0,3296
1.042, 695
1.042,695 1

47
Donde se ha aplicado la asignacin ptima:
p jq j n1 = 200 0, 4795 = 95,9 96
Nj
cj n2 = 200 0,1909 = 38, 2 38
j = L
pi qi n3 = 200 0,3296 = 65,9 66
N i
i =1 ci n = 200

10. La produccin de piezas de una factora se realiza en dos mquinas. El 40% de las piezas
las produce la mquina A y el 60% restante la mquina B. Se les pas control de calidad a
200 piezas; 67 producidas por la mquina A y dos de ellas resultaron defectuosas; las 133
restantes procedan de la mquina B, siendo 6 de ellas defectuosas. Estimar la proporcin
de piezas defectuosas de la factora y dar el lmite de error de estimacin. Omita el
coeficiente corrector por poblacin finita.
SOLUCIN:
p i q i
Estrato Ni ni pi ni 1
A 0.40 N 67 2/67=0.030 0.000441
B 0.60 N 133 6/133=0.045 0.000326
N 200

p=
1
N
( ( 0.40 N 0.030 ) + ( 0.60 N 0.045) ) = ( ( 0.40 0.030 ) + ( 0.60 0.045) ) = 0.039 ( 3.9% )

( )
V p =
N
1
2 ( (
0.402 N 2 0.000441) + ( 0.602 N 2 0.000326 ) = )
( )
= ( 0.402 0.000441) + ( 0.602 0.000326 ) = 0.000188
B = 2 0.000188 = 0.0274 ( 2.74% )

11. Para la comercializacin de un producto se le clasifica, atendiendo al calibre, en tres


categoras: pequea, mediana y grande. Un establecimiento dispone de 300 piezas
pequeas, 500 medianas y 200 piezas grandes. Para estimar el peso total de producto
almacenado se decide tomar una muestra aleatoria que contenga piezas de todas las
categoras, resultando
Categora N de piezas Peso en gramos
Pequea 5 12, 14, 12, 15, 12
Mediana 6 16, 22, 24, 20, 20, 18
Grande 4 30, 33, 31, 34
Considerando los anteriores datos como una muestra previa, obtenga el nmero de
unidades que cada categora debe aportar a la muestra para que el error en la estimacin
del peso total no supere el medio kilo.

48
SOLUCIN:
Peso en gramos (con las funciones del modo SD de la calculadora )
12, 14, 12, 15, 12 S1 = 1, 4142 S12 = 2
16, 22, 24, 20, 20, 18 S 2 = 2,8284 S 22 = 8
30, 33, 31, 34 S3 = 1,8257 S32 = 3, 3333

N j j
j =
Ni i 2
N i i N i 2 L
ni = 71, 66i
i i
N
i =1
i i

300 1,4142 2 424,26 600 0,1925 13, 79 14


500 2,8284 8 1414,2 4000 0,6418 45,99 46
200 1,8257 3,3333 365,14 666,66 0,1657 11,87 12
N = 1000 2203,6 5266,66 1 n = 72
2

B2 250.000
( N )
L

i i
D= 2
= = 0, 0625 n= i =1
L
= 71, 66
4N 4.000.000
N D + N i
2
i
2

i =1

12. Una inspectora de control de calidad debe estimar la proporcin de circuitos integrados de
ordenador defectuosos que provienen de dos diferentes operaciones de ensamble. Ella
sabe que de entre los circuitos integrados que van a ser inspeccionados, 60% procede de
la operacin de ensamble A y 40% de la operacin de ensamble B. En una muestra
aleatoria de 100 circuitos integrados resulta que 20 provienen de la operacin A y 80 de la
operacin B. De entre los circuitos integrados muestreados de la operacin A, 2 son
defectuosos. De entre las piezas muestreadas de la operacin B, 16 son defectuosas.
a. Considerando nicamente la muestra aleatoria simple de 100 circuitos
integrados, estime la proporcin de los defectuosos en el lote, y establezca un
lmite para el error de estimacin.
b. Estratifique la muestra, despus de la seleccin, en circuitos integrados
provenientes de la operacin A y B, estime la proporcin de los defectuosos en
la poblacin, y fije un lmite para el error de estimacin.
c. Qu respuesta encuentra ms aceptable? Por qu?
SOLUCIN:
18 pq
a. p = = 0,18 (18%) V ( p ) = = 0, 001491 2 V ( p ) = 0, 0772 ( 7, 72% )
100 n 1

49
1 L L
Ni 2 16
b. p st = Ni pi = p i = 0, 60 + 0, 40 = 0,14 (14% )
N i =1 i =1 N 20 80
2
1 L
p i q i N i ni L
N i2 p i q i L
N i p i q i
V ( p st ) = 2 N 2

ni 1 N i
i =
i =1 N ni 1
2
=

=
N i =1 i =1 N i n 1

0,10 0,90 2 0, 20 0,80


= ( 0, 60 ) + ( 0, 40 ) = 0, 00203
2

19 79

2 V ( p st ) = 0, 0901 ( 9, 01% )
c. Aunque en el conjunto de la poblacin hay ms elementos que proceden de A (60%)
que de B (40%), la muestra global no representa adecuadamente este hecho,
predominando los elementos de B (80) frente a los de A (20), esto ocasiona que en el

apartado a. la estimacin est sesgada hacia el valor de B ( p 2 = 0, 20 ) frente al de A

( p1 = 0,10 ). En el apartado b. este hecho se corrige dando a p1 y p 2 las


ponderaciones 0,60 y 0,40 respectivamente para estimar p.

13. Una cadena de restaurantes tiene 100 establecimientos en Madrid, 70 en Barcelona y 30


en Sevilla. La direccin est considerando aadir un nuevo producto en el men. Para
contrastar la posible demanda de este producto, lo introdujo en el men de muestras
aleatorias de 10 restaurantes de Madrid, 5 de Barcelona y 5 de Sevilla. Usando los ndice
1, 2 y 3 para designar Madrid, Barcelona y Sevilla, respectivamente, las medias y las
desviaciones tpicas muestrales del nmero de pedidos de este producto recibidos por
restaurante en las tres ciudades durante una semana fueron:
y1 = 21, 2 S1 = 12
y2 = 13, 3 S 2 = 11
y3 = 26,1 S3 = 9
a. Estimar el nmero medio de pedidos semanales por restaurante para los
restaurantes de la cadena. Dar un lmite del error de estimacin.
b. Determinar el tamao muestral y la asignacin para repetir el estudio anterior
cometiendo un error inferior a 3 pedidos.
SOLUCIN:
L
1 3834
a. y st =
N
N y
i =1
i i =
200
= 19,17 pedidos / semana

1 L
Si2 N i ni
V ( y st ) = 2
N

i =1
N i
2

ni N i
= 6, 2965 2 V ( y st ) = 5, 02 pedidos / semana

50
b.
N j j
j =
Ni i 2
N i i N i 2 L
ni = 43, 52i
i i
N
i =1
i i

100 12 144 1200 14400 0,5357 23, 31 24


70 11 121 770 8470 0,3438 14,96 15
30 9 81 270 2430 0,1205 5, 24 6
N = 200 2240 25300 1 n = 45
2

B2 9
( N )
L

i i
D= = = 2, 25 n= i =1
L
= 43,52
4 4
N D + N i
2
i
2

i =1

14. De una ciudad con 350 casas, se sabe que 164 de ellas tienen calefaccin elctrica. Al
realizar una encuesta sobre el consumo de energa (en kilovatios-hora) se obtuvieron los
siguientes resultados:
Tipo Calefaccin N casas Media muestral Cuasivarianza muestral
Elctrica 24 972 202,396
No elctrica 36 463 96,721
a. Obtenga una estimacin del nmero medio de kilovatios-hora utilizado en la
ciudad. D un lmite para el error de estimacin.
b. Obtenga una estimacin del nmero medio de kilovatios-hora utilizado por las
casas que no tienen calefaccin elctrica. D un lmite para el error de
estimacin.
SOLUCIN:
a.
Ni ni yi Si2 Ni y i N i ni Si2 N i ni
N i2
Ni ni N i
164 24 972 202,396 159.408 0,854 193.699,13
186 36 463 96,721 86.118 0,806 74.925,32
350 245.526 268.624,45

L
1 245.526
y st =
N
N y
i =1
i i =
350
= 701, 50

1 L
Si2 N i ni 268.624, 45
V ( y st ) = 2
N

i =1
N i
2

ni N i
=
3502
= 2,19

2 2,19 = 2,96

b.
y 2 = 463

51
S 22 N 2 n2 96, 721 186 36
V ( y2 ) = = = 2,17
n2 N 2 36 186

2 2,17 = 2, 94

52
3. Muestreo con informacin auxiliar.
3.1 Introduccin.
3.2 Estimacin de razn.
3.2.1 Estimacin de la media y total poblacionales.
3.2.2 Determinacin del tamao muestral.
3.3 Estimacin de regresin.
3.3.1 Estimacin de la media y total poblacionales.
3.3.2 Determinacin del tamao muestral.
3.4 Estimacin de diferencia.
3.4.1 Estimacin de la media y total poblacionales.
3.4.2 Determinacin del tamao muestral.

3.1 Introduccin.

Si entre dos variables existe una fuerte relacin es posible utilizar la informacin auxiliar
que tengamos de una variable, como puede ser la media o el total poblacional, para estimar la
media o el total de la otra variable.
Notaremos por
Y Variable bajo estudio
X Variable que proporciona la informacin auxiliar
De las que tomaremos una muestra constituida por n pares de datos:
(x1 , y1 ),..., ( x n , y n )
A partir de los datos muestrales se puede estimar la relacin existente entre ambas
variables.
Pueden utilizarse distintos diseos de muestreo en la estimacin con informacin auxiliar.
Aqu suponemos que se emplea el muestreo aleatorio simple.

La estimacin con informacin auxiliar es importante cuando se pretende estimar el total sin
conocer el nmero de elementos de la poblacin pero s el valor total de la variable que
proporciona la informacin auxiliar.
Por ejemplo, debido a que existe una fuerte relacin entre renta y ahorro, se puede estimar el
valor total de los ahorros de los individuos de una poblacin si se conoce el valor total de las
rentas de dichos individuos. As, si se sabe que por trmino medio el 10% de la renta se dedica
al ahorro y se conoce la renta total, el ahorro total se estima igual al 10% de la renta total.
Observemos que la estimacin del total de ahorro se ha llevado a cabo sin necesidad de
conocer el nmero de individuos de la poblacin, N.

53
Dependiendo de la relacin entre las variables X e Y utilizaremos:
Estimadores de razn ( y = bx o con otra notacin y = rx )

Estimadores de regresin ( y = a + bx )

Estimadores de diferencia ( y = a + x o con otra notacin y = d + x)

Estos estimadores slo se deben utilizar si entre las dos variables existe una fuerte relacin
1
lineal positiva, rxy > .
2

3.2 Estimacin de razn


Dada una poblacin de tamao N en la que se consideran las variables X e Y , se define la
razn como el cociente:
y
R=
x
Es decir, la proporcin del total de Y respecto del total de X . Puesto que y = N y y

x = N x , obtenemos
N Y Y
R= =
N X X
De estas definiciones se deduce que
y = R x
y = R x
Por tanto, si se conocen los valores de la media y el total de la variable X , para estimar la

media y el total de Y slo hay que estimar el valor de R (que notaremos como R = r ):
y = r x
y = r x
Puesto que la razn R es el cociente entre las medias poblacionales, tomando una muestra
aleatoria simple: ( y1 , x1 ) ,..., ( yn , xn ) , podemos estimar R tomando el cociente entre las

medias muestrales:
1 n n

y n y
yi i
ESTIMADOR DE LA RAZN: r= = i =1
= i =1

x 1 n n

xi
n i =1
x
i =1
i

1 S2 N n 1 n
VARIANZA ESTIMADA DE r : V (r ) = 2 r , S
2
= ( yi rxi )2
x n N n 1 i =1
r

54
3.2.1 Estimacin de la media y el total poblacionales
Hemos de suponer que entre X e Y existe una alta correlacin lineal positiva y que el
modelo lineal, donde X es la variable explicativa e Y la explicada, pasa por el origen,
( y = bx, en este contexto se nota b = r dado su significado, y = rx )

ESTIMADOR DE LA MEDIA: y = r x

Para estimar y necesitamos conocer el verdadero valor de x . No vale la estimacin

x x

S2 N n
VARIANZA ESTIMADA DE y : V ( y ) = x2V (r ) = r
n N

ESTIMADOR DEL TOTAL: y = r x

2 S2 N n S r2
VARIANZA ESTIMADA DE y : V (y ) = x2V ( r ) = x2 r = N ( N n )
x n N n

Si x y N son desconocidos no podemos utilizar la expresin anterior. Entonces si

N n 2 S2
N = 1 y aproximando x por x se tiene V ( y ) x2 r
N x n

Comentarios sobre estos estimadores:


Son estimadores sesgados.
N n
Cuando N es desconocido y si estimamos que n 5% N , es decir que 0,95 ,
N
N n
entonces 1 . (Vase ejercicio resuelto 4)
N
x
De la relacin x = , se sigue que conociendo dos de estos elementos se puede
N
3840
calcular el tercero. (Vase ejemplo 3.1: = x = = 5,12 ha / socio )
x N 750
A la hora de estimar el total, aunque conozcamos el tamao de la poblacin, cuando
existe una fuerte correlacin entre las variables, se comporta mejor el muestreo con
informacin auxiliar ( y = r x ) que el muestreo aleatorio simple ( = Ny ) . (Vase

ejemplo 3.5)

55
Ejemplo 3.1
Mediante una tasacin previa se desea estimar la produccin media y la produccin total de
los 750 socios de una cooperativa agrcola. Se sabe que el total de superficie plantada es de
3840 hectreas. Se realiz un sorteo entre los socios para elegir a 20 de ellos a los que se les
pregunt por la superficie plantada y se les tas su produccin. Los resultados fueron:
Superficie Produccin Superficie Produccin
3,7 12 3 8
4,3 14 7 20
4,1 11 5,4 16
5 15 4,4 14
5,5 16 5,5 18
3,8 12 5 15
8 24 5,9 18
5,1 15 5,6 17
5,7 18 5 15
6 20 7,2 22
Estime la produccin media y total mediante los estimadores de razn y muestreo aleatorio
simple. Calcule sus respectivos lmites para el error de estimacin y comprelos.
Solucin
Y = produccin (toneladas, tm) X = Superficie plantada (hectreas, ha)

xi yi xi2 yi2 xi yi
3,7 12 13,69 144 44,4
4,3 14 18,49 196 60,2
4,1 11 16,81 121 45,1
5 15 25 225 75
5,5 16 30,25 256 88
3,8 12 14,44 144 45,6
8 24 64 576 192
5,1 15 26,01 225 76,5
5,7 18 32,49 324 102,6
6 20 36 400 120
3 8 9 64 24
7 20 49 400 140
5,4 16 29,16 256 86,4
4,4 14 19,36 196 61,6
5,5 18 30,25 324 99
5 15 25 225 75
5,9 18 34,81 324 106,2
5,6 17 31,36 289 95,2
5 15 25 225 75
7,2 22 51,84 484 158,4
TOTALES 105,2 320 581,96 5398 1770,2

56
Del enunciado y de la tabla anterior obtenemos:
n = 20 N = 750 socios x = 3840 ha
n n n n n

x
i =1
i = 105, 2 y
i =1
i = 320 x i =1
2
i = 581, 96 y
i =1
2
i = 5398 x y
i =1
i i = 1770, 2

1 n 105, 2 1 n
( ) 1 n 2 581,96
2
xi x
2
x= xi = = 5, 26 sx2 = = xi x = 5, 26 2 = 1, 4304
n i =1 20 n i =1 n i =1 20

1 n 320 1 n
( ) 1 n 2 5398
2
yi y
2
y= yi = = 16 s y2 = = yi y = 16 2 = 13,9
n i =1 20 n i =1 n i =1 20

sxy =
1 n
(
xi x
n i =1
)( yi y =) 1 n

n i =1
xi yi x y =
1770, 2
20
( 5, 26 16 ) = 4, 35

Si queremos calcular las cuasivarianzas a partir de las varianzas:


n 2 20 n 2 20
S x2 = s x = 1, 4304 = 1,5057 S y2 = s y = 13,9 = 14, 6316
n 1 19 n 1 19
y hallando las races cuadradas obtenemos las desviaciones tpicas (s , s )
x y y las

cuasidesviaciones tpicas ( S x , S y ) .

Los anteriores clculos que se han realizado a mano o con ayuda de una calculadora bsica se
simplifican notablemente si utilizamos una calculadora cientfica de uso comn. Estas
calculadoras nos proporcionan los valores de un grupo de funciones estadsticas de forma
inmediata:

x 2
x x n = sx = desviacin tpica n 1 = S x = cuasidesviacin tpica

s xy 4,35
La relacin entre las variables es alta, rxy = = = 0, 9756 . Esto, junto con la
sx s y 1,196 3, 728

informacin auxiliar que disponemos de la variable X, justifica el uso de estimadores de


razn. Por otra parte, dado el contexto, es lgico que la relacin pase por el origen (a 0 ha de
superficie le corresponde una produccin de 0 tm).
20

y i
320
r= i =1
20
= = 3,042 tm/ha
105, 2
xi =1
i

y = r x = 3, 042 3840 = 11680,6 tm

3840
= x = = 5,12 ha / socio
x N 750
y = r x = 3, 042 5,12 = 15,57 tm/socio

57
1 20 1 20 2 2 20 2 20

Sr = ( yi rxi ) = yi + r xi 2r xi yi =0, 706
2 2

n 1 i =1
n 1 i =1 i =1 i =1
S2 N n
V ( y ) = r = 0, 0344 B = 2 V ( y ) = 0,37 tm/socio
n N

x2 Sr2 N n 2 Sr N n
2
V (y ) = 2
=N = 19326,75 B = 2 V (y ) = 278,04 tm
x n N
n N

o B = 750 B = 750 0,37 = 277,5 tm (los dos procedimientos no coinciden por simples

errores de redondeo en el valor de B ).

A continuacin lo estimaremos utilizando muestro aleatorio simple:


S 2 N n 14, 63 750 20
y=
320
20
= 16 tm / socio ( )
V y =
n N
=
20 750
= 0, 712

B = 2 0, 712 = 1, 69 tm / socio

320
= Ny = 750 = 12000 tm
20

2 S N n 2 14,63 750 20
2
V ( ) = N

= 750 = 400539,47
n N 20 750

B = 2 400539, 47 = 1265,76 tm o B = 750 B

Observemos que el lmite del error de estimacin, tanto para la media como para el total, es
mucho mayor que el cometido utilizando estimadores de razn.

3.2.2 Determinacin del tamao muestral


Tamao muestral mnimo para que la estimacin de la razn, la media y el total no supere una
cota de error B
N r2
n=
r2 + ND
donde para estimar:
B 2 x2
la razn: D=
4
B2
la media: D=
4
B2
el total: D=
4N 2

58
Comentarios:
r2 se estima utilizando una muestra previa: r2 = S r2 .
Si x es desconocido, x2 = x 2

Ejemplo 3.2 (continuacin del ejemplo 3.1)


Supongamos que queremos reducir el lmite para el error de estimacin de la media a 0,25
tm/socio y el del total no debe superar las 200 tm a cuntos socios se les debe tasar su
produccin antes de realizar una nueva estimacin?
Solucin
N r2 750 0, 706
MEDIA: n = = = 42,6 43 socios
B2
0, 252
r2 + N 0, 706 + 750
4 4

N r2 N r2 750 0, 706
TOTAL: n = = = = 37, 7 38 socios
B2 B 2
2002
r2 + N r +
2
0, 706 +
4N 2 4N 4 750
Necesitamos al menos 43 socios para cumplir con ambos niveles de error.

3.3 Estimacin de regresin


El uso del estimador de razn es ms efectivo cuando la relacin entre las variables X e Y es
lineal y pasa por el origen de coordenadas (en este caso proporciona estimadores insesgados).
En caso de relacin lineal que no pase por el origen de coordenadas es preferible utilizar
estimadores de regresin.

En el modelo lineal simple Y = a + bX , el mtodo de mnimos cuadrados permite estimar a y


b de la siguiente forma:

s xy ( y i y )( xi x )
b= = i =1
n
sx2
( x x )
2
i
i =1

a = y bx
donde
1 n 1 n
s x2 = ( xi x ) = xi2 x 2
2

n i =1 n i =1
1 n 1 n
s xy = ( i )( i ) n
n i =1
x x y y =
i =1
xi yi x y

59
3.3.1 Estimacin de la media y el total poblacionales
ESTIMADOR DE LA MEDIA: yL = a + b x = y bx + b x = y + b ( x x )

Para estimar yL necesitamos conocer el verdadero valor de x . No vale la estimacin

x x

S L2 N n
VARIANZA ESTIMADA DE yL : V ( yL ) =

n N

siendo S L2 la varianza residual en el modelo lineal simple:

n 2 s xy
2
1 n
(
yi ( y + b ( xi x ) ) ) n 2
s y (1 rxy2 )
2
S =
2
= sy 2 =
n 2 i =1 n2 sx n 2
L

ESTIMADOR DEL TOTAL: yL = N yL


En este caso para estimar el total es necesario conocer el tamao de la poblacin N. No
se puede estimar como yL = a + b x ya que la recta de regresin no pasa por el punto

( x , y ) .

VARIANZA ESTIMADA DE yL : V ( yL ) = N 2V ( yL )

Ejemplo 3.3
Para un grupo de 1000 pequeos establecimientos se desea realizar un estudio sobre las ventas
diarias. Se tiene informacin de que, por trmino medio, el gasto en publicidad es de 5 euros.
Se elige al azar una muestra de 18 establecimientos y se toman datos de su gasto en publicidad
y ventas diarios. Los resultados son:
Gastos Ventas
3,7 120
4,3 140
4,1 135
5 150
5,5 160
3,8 120
8 160
5,1 150
5,7 125
6 130
0 80
7 150
5,4 150
4,4 120
5,5 140
5 150
5,9 150
6,6 170
60
Estime el total de ventas diarias y la media utilizando estimadores de regresin. Obtenga el
lmite para el error de estimacin.
Solucin
Y = ventas diaria (euros) X = gastos diarios en publicidad (euros)

n = 18 establecimientos N = 1000 establecimientos x = 5

Tal y como se explic en la resolucin del ejemplo 3.1 obtenemos:


x = 5, 0556 y = 138,889
sx = 1, 6375 sx2 = 2, 6814
s y = 20,314 s 2y = 412,654
sxy = 27, 7284
La relacin entre las variables es fuerte: rxy = 0,8336 .

yL = y + b ( x x ) = 138,889 + 10, 341( 5 5,0556) = 138, 314


s xy 27,7284
b= 2
= = 10,341
s x 2,6814

yL = N yL = 138314

S2 N n
s y (1 rxy2 ) = 141, 6 V ( yL ) = L
n 2
S L2 = = 7, 73
n2 n N

B = 2 V ( yL ) = 5,56 B = N B = 1000 5,56 = 5560

3.3.2 Determinacin del tamao muestral


Tamao muestral mnimo necesario para que al estimar la media y el total poblacionales la
cota de error no supere el valor B
N L2
n= 2
L + ND
donde para estimar:
B2
la media: D =
4
B2
el total: D=
4N 2
L2 se estima utilizando una muestra previa: L2 = S L2

Ejemplo 3.4 (continuacin del ejemplo 3.3)


Se quiere repetir el estudio anterior de forma que el error para la estimacin del total no supere
los 1000 euros cul debe ser el tamao muestral?

61
Solucin
N L2 1000 141, 6
n= = = 361, 6 362 establecimientos.
B2
1000 2
L2 + N 141, 6 + 1000
4N 2 4 1000 2

3.4 Estimacin de diferencia


El uso del estimador de diferencia tiene un buen comportamiento (cota de error ms baja)
cuando la relacin entre las variables es lineal y la pendiente del modelo es uno.

(y =a+x y = y + ( x x) a = y x = d )
Comnmente se emplea en procedimientos de auditora.

3.4.1 Estimacin de la media y el total poblacionales


ESTIMADOR DE LA MEDIA: yD = y + ( x x ) = x + d d = yx

Para estimar yD necesitamos conocer el verdadero valor de x . No vale la estimacin

x x

S2 N n
VARIANZA ESTIMADA DE yD : V ( yD ) = D
n N

S = 2
D
1 n

n 1 i =1
( ( ))
y i xi + d =
2 1 n

n 1 i =1
(d i d ) , donde d i = y i xi , por tanto S D2 es la
2

cuasivarianza de los d i .

ESTIMADOR DEL TOTAL: yD = N yD


En este caso para estimar el total es necesario conocer el tamao de la poblacin N. No
se puede estimar como yL = y + ( x x ) = x + d por anlogas razones a las expuestas

en el estimador de regresin.
VARIANZA ESTIMADA DE YD : V ( yD ) = N 2V ( yD )

Ejemplo 3.5
Para un grupo de 200 establecimientos se desea realizar un estudio sobre el gasto diario. Se
tiene informacin de que los ingresos medios diarios son de 500 euros. Se elige al azar una
muestra de 10 establecimientos y se toman datos de ingresos y gastos, obtenindose:

62
X=Ingresos Y=Gastos
470 405
650 585
710 650
300 240
475 410
505 435
610 550
380 320
540 480
520 460
Estime el gasto medio y el gasto total diario para los 200 establecimientos utilizando muestreo
aleatorio simple, estimadores de razn, regresin y diferencia. Obtenga el lmite para el error
de estimacin en cada caso.
Solucin
Y = gasto diario (euros) X = ingresos diarios (euros)

n = 10 establecimientos N = 200 establecimientos x = 500


Tal y como se explic en la resolucin del ejemplo 3.1 obtenemos:
x = 516 y = 453,5

s x = 115, 797 s x2 = 13409

s y = 115,738 s 2y = 13395,3

S y2 = 14883,7 s xy = 13396,5

La relacin entre las variables es muy fuerte: rxy = 0,99958 rxy2 = 0,99916 .

MUESTREO ALEATORIO SIMPLE


= y = 453,5 = Ny = 90700
) = Sy N n = 1413,94
2

V( ) = 75,20
B = 2 V( B = 200 B =15040,97

n N
ESTIMADORES DE RAZN
y
r= = 0,879 x = 200 x = 100000 y = r x = 87900 y = r x = 439,5
x
1 n 1 n 2 2 n 2 n

Sr = ( yi rxi ) = + = 227, 717
2 2
y r x 2 r xi yi
n 1 i =1 n 1 i =1
i i
i =1 i =1
S2 N n
V ( y ) = r = 21, 63 B = 9,3
n N
B = N B =1860

63
ESTIMADORES DE REGRESIN

yL = y + b ( x x ) = 437,515
s 13.396,5
b = xy2 = = 0,99907 yL = N yL = 87.503
sx 13.409

S2 N n
s y (1 rxy2 ) = 14,05 V ( yL ) = L
n 2
S L2 = = 1,33
n2 n N
B = 2, 3104 B = NB = 462, 09

ESTIMADORES DE DIFERENCIA
d = 62,5 yD = x + d = 437,5 yD = N yD = 87500

(con la calculadora hallamos n 1 sobre las diferencias d i y lo elevamos al cuadrado)


2

S D2 =
1 n
(
di d
n 1 i =1
) = 12, 5

S2 N n
V ( yD ) = D = 1,1875 B = 2 V ( yD ) = 2,179 B = NB = 435,8899
n N

3.4.2 Determinacin del tamao muestral


Tamao muestral mnimo necesario para que la estimacin no supere un cota de error B al
estimar la media y el total poblacionales
N D2
n=
D2 + ND
donde para estimar:
B2
la media: D =
4
B2
el total: D=
4N 2
D2 se estima utilizando una muestra previa: D2 = S D2

Ejemplo 3.6 (continuacin ejemplo 3.5)


Se quiere repetir el estudio anterior utilizando un estimador de diferencia y cometiendo un
error como mximo de 300 euros al estimar el total cul debe ser el tamao muestral?
Solucin
N D2 200 12,5
n= 2
= = 20 establecimientos
B 300 2
D + N
2
12, 5 +
4N 2 4 200

64
EJERCICIOS RESUELTOS

1. En una poblacin de 500 hogares, para la que es conocido que el gasto total general
durante un ao es de 15000000 , se quiere estimar el gasto total en alimentacin durante
un ao, para lo que se obtiene una muestra aleatoria simple de 4 hogares que proporciona
los siguientes valores anuales en :
Gasto en alimentacin 12500 15000 10000 17500
Gasto general 24000 31000 20000 36000
Estime con un estimador de razn el total de gasto en alimentacin mediante un intervalo
de confianza.
SOLUCIN (trabajaremos en cientos de euros)
xi yi xi2 yi2 xi yi
240 125 57600 15625 30000
310 150 96100 22500 46500
200 100 40000 10000 20000
360 175 129600 30625 63000
1110 550 323300 78750 159500
n

y i
550
N = 500 n = 4 r = i =1
n
= = 0, 4955 y = r x = 0, 4955 150000 = 74325 cientos de
1110
x
i =1
i

y = 7432500

2
1 n 1 n 2 2 n 2 n
62, 2
S r2 = ( i i)
y rx = y + r x 2 r xi yi = = 20, 73
n 1 i =1 n 1 i =1
i i
i =1 i =1 3
2
S
V ( y ) = N ( N n) r = 1285, 4667 2 V ( y ) = 2267,568
n
y ( 72057, 432 ; 76592,568) en cientos de
Para expresarlo en hay que multiplicarlo por cien.

2. Un trabajador social quiere estimar la ratio personas/habitacin en un determinado barrio.


El trabajador social selecciona una muestra aleatoria simple de 25 viviendas de las 275 del
barrio. Sea x el nmero de personas en cada vivienda e y el nmero de habitaciones por
vivienda. A partir de los datos siguientes:
25 25 25
x = 9,1; y = 2, 6; xi2 = 2240;
i =1
yi2 = 169;
i =1
x y
i =1
i i = 522

Estime la razn personas/habitacin en el barrio y establezca el lmite para el error de


estimacin con una confianza del 95%.

65
SOLUCIN (los papeles de las variables x e y deben permutarse en las expresiones
del formulario)
n

x i
x 2
N = 275 n = 25 r = i =1
n
= = 3,5 pers. / hab. y2 y = 2, 62 = 6, 76
y
y
i =1
i

2
1 n 1 n 2 2 n 2 n

S r2 = ( xi ryi ) = x + r y 2 r xi yi = 27,34375
n 1 i =1 n 1 i =1
i i
i =1 i =1
1 ( N n) S r2
V (r ) = 2 = 0,1471 2 V (r ) = 0, 767
y N n

3. Se desea estimar el agua utilizada en la presente campaa por una comunidad de riego
constituida por 250 parcelas. Se seleccionan al azar 10 parcelas cuyo tamao y metros
cbicos utilizados en riego aparecen en la siguiente tabla
m3 600 1800 750 900 1100 1400 950 700 1000 720
Hectreas 50 150 60 70 100 120 80 60 90 60
Estime la media de m3 /hectrea que utiliza la comunidad de regantes y la cota del error de
dicha estimacin.
SOLUCIN:
Y = consumo de m3 de agua, X = tamao de la parcela en hectreas

xi yi xi2 yi2 xi yi
50 600 2500 360000 30000
150 1800 22500 3240000 270000
60 750 3600 562500 45000
70 900 4900 810000 63000
100 1100 10000 1210000 110000
120 1400 14400 1960000 168000
80 950 6400 902500 76000
60 700 3600 490000 42000
90 1000 8100 1000000 90000
60 720 3600 518400 43200
840 9920 79600 11053400 937200

y i
9920
r= i =1
n
= = 11'81 m3 / hectarea
840
x
i =1
i

1 n 1 n 2 2 n 2 n

S r2 = ( yi rxi ) = + xi yi =
2
y r x 2 r
n 1 i =1 n 1 i =1
i i
i =1 i =1
1
= (11053400 + 11102297 '56 22136664 ) = 2114 '84
9
66
840
x = x == 84
10
1 N n S r2 1 240 2114 '84
V (r ) = 2 = 2 = 0 '02877
x N n 84 250 10

2 V (r ) = 0 '3392

4. Se desea estimar el consumo mensual de una ciudad. Se sabe que los ingresos en dicha
ciudad, va declaracin de la renta, ascienden a 1502530 euros mensuales. Se realiza una
encuesta entre 12 hogares elegidos al azar y los resultados de renta y consumo se recogen
en esta tabla.
Renta Consumo
1702,44 1204
1339,56 1000
981,06 800
2537,04 1800
1519,85 1200
3080,19 2600
1502,53 1080
1702,87 1240
1402,36 1000
1803,04 1400
2053,46 1484
3005,06 2000
Estime el consumo total mensual para todos los hogares de la ciudad mediante el
estimador de razn. Obtenga el lmite para el error de estimacin.
SOLUCIN:
Denotemos por Y = consumo mensual X = ingresos mensuales
De la informacin muestral obtenemos
12 12
n = 12 y
i =1
i = 16808 euros x
i =1
i = 22629, 46 euros

y como informacin auxiliar sabemos que x = 1502530 euros.

s xy
Podemos comprobar que el coeficiente de correlacin lineal es alto, rxy = = 0,9677 .
sx s y

Esto junto con la informacin auxiliar nos permite utilizar muestreo con informacin
auxiliar, en concreto utilizaremos estimadores de razn.

67
12
yi
r = i =1
12 = 0, 7 42 7

i =1
xi

y = r x = 1 1 1 6 0 0 2 , 0 7

x2 Sr N n
2
Para calcular V ( Y ) = 2
tenemos en cuenta que:
x n N
12
No conocemos N , pero en la ciudad hay muchos hogares, observando x < ( 5% )
i =1
i x

N n
estimamos que n < ( 5% N ) 1
N
x = x = 1885, 79
1 12 1 12 2 2 12 2 12

Sr = ( )
i i n 1 = + = 16479, 7
2 2
y rx y r x 2 r xi yi
n 1 i =1
i i
i =1 i =1 i =1
V (Y ) = 871825002, 67 B = 2 V (Y ) = 59053,37

5. Las diferencias entre ingresos y gastos, en 5 de las 250 oficinas que tiene abiertas una
agencia de seguros, en el presente mes, han sido (en euros)
570 721 650 650 569
Este mes el gasto medio para el conjunto de todas las oficinas ha sido 12764 euros, estime
el total de ingresos y el lmite para el error de estimacin.
SOLUCIN:
N=250, n=5, x = 12764 , X=gastos, Y=ingresos

(con las funciones del modo SD de la calculadora ) : d = 632 S D2 = 4095,5

yD = x + d = 13396 yD = N yD = 3349000

N n S D2 S2
V ( yD ) = N 2 = N ( N n ) D = 50169875 2 2 V ( yD ) = 14166,14
N n n

6. Una cadena de electrodomsticos est interesada en estimar el total de ganancias por las
ventas de televisores al final de un periodo de tres meses. Se tienen cifras del total de
ganancias de todas las tiendas de la cadena para ese mismo periodo de tres meses
correspondiente al ao anterior, ese total es de 128200 . Una muestra aleatoria simple de
5 tiendas es seleccionada de las 123 tiendas de la cadena resultando los datos de la
siguiente tabla:

68
Oficinas Datos de 3 meses del ao anterior Datos de 3 meses del ao actual
1 550 610
2 720 780
3 1500 1600
4 1020 1030
5 620 600
Usando un estimador de razn, estime el total de ganancias con un intervalo de confianza.
SOLUCIN:
N=123, n=5, x = 128200 , X=ganancias del ao anterior, Y=ganancias del ao actual

(con las funciones del modo SD de la calculadora ) :


5 5 xi yi
x = 882 xi = 4410
i =1
xi2 = 4495700
i =1
335500
5 5
561600
y = 924 y
i =1
i = 4620 y
i =1
2
i = 4961400 2400000
1050600
n 372000
y i
y
5

x y = 4719700
r= i =1
n
= = 1, 047619 y = r x = 134304, 76 i =1
i i

x
x
i =1
i

1 5 1 5 2 2 5 2 5

Sr = ( yi rxi ) = yi + r xi 2r xi yi = 1640, 25
2 2

n 1 i =1
n 1 i =1 i =1 i =1
2
S
V ( y ) = N ( N n ) r = 4761314, 071 2 V ( y ) = 4364, 09
n
y (129940, 67 , 138668,85 )

7. Una agencia de publicidad est interesada en el efecto de una nueva campaa de


promocin regional sobre las ventas totales de un producto en particular. Una muestra
aleatoria simple de 5 tiendas es seleccionada de 452 tiendas regionales en las cuales se
vende el producto. Los datos de las ventas trimestrales son obtenidos para el periodo
actual de tres meses y para el periodo de tres meses previo a la nueva campaa.
Tienda Ventas antes de Ventas
la campaa actuales
1 208 239
2 400 428
3 440 472
4 259 276
5 351 363

69
Usando los anteriores datos para estimar los parmetros necesarios, determine el tamao
de la muestra para estimar y con un lmite para el error de estimacin de 2000,

cuando se utiliza el estimador de razn.


SOLUCIN:
N=452, n=5, X=ventas antes de la campaa, Y=ventas actuales
(con las funciones del modo SD de la calculadora ) :
5 5 xi yi
x = 331, 6 xi = 1658
i =1
xi2 = 587146
i =1
49712
5 5
171200
y = 355, 6 yi =1
i = 1778 y
i =1
2
i = 671034 207680
71484
5 127413
y i
y
5

x y = 627489
r= i =1
5
= = 1, 072376 i =1
i i

x
x i =1
i

1 5 1 5 2 2 5 2 5

Sr = ( i i ) n ' 1
= + = 109, 4775
2 2
y rx y r x 2 r xi yi
n ' 1 i =1
i i
i =1 i =1 i =1
B2 2
D= 2
= 4,8947 r = S r2 = 109, 4775
4N
N r2
n= = 21,3 22
ND + r2

70
4. Muestreo sistemtico.
4.1 Seleccin de una muestra sistemtica. Usos. Ventajas.
4.2 Estimacin de la media, proporcin y total poblacionales.
4.3 Comparacin con el muestreo aleatorio simple: Poblaciones ordenadas, aleatorias
y peridicas.
4.4 Determinacin del tamao muestral.

4.1 Seleccin de una muestra sistemtica. Usos. Ventajas.


En el muestreo sistemtico los elementos de la poblacin se enumeran, o se ordenan. Una
muestra sistemtica de 1 en k es la que se extrae de la siguiente forma:
1. Se selecciona aleatoriamente un elemento (llamado punto de inicio o pivote) de los
primeros k elementos de la poblacin.
2. Despus se seleccionan cada k -simo elemento hasta conseguir una muestra de
tamao n .
N N
k se toma como el nmero entero menor o igual que el cociente : k .
n n

Nos podemos encontrar con las siguientes situaciones:


N
1. k = entero. Entonces se obtienen exactamente n observaciones.
n
N N
2. no es entero. Por ejemplo si N = 103 y n = 5 , entonces = 20,6 y tomamos
n n
k = 20 . Segn el punto inicial nos podemos encontrar con:
a. Si elegimos, por ejemplo, el 2 como punto inicial, obtendramos:
2, 22, 42, 62, 82, 102
Al dividir la poblacin en 5 intervalos de 20 elementos, sobran 3. Podramos
elegir tambin el 102 y la muestra sera de tamao 6.
b. Si se elige, por ejemplo, la observacin 18 como la inicial, obtendramos una
muestra de tamao 5:
18, 38, 58, 78, 98
3. N es desconocido. En este caso, la decisin sobre el valor de k se tomar de forma
que se asegure el nmero mnimo deseado de elementos de la muestra. N se estima
por defecto, as k ser menor de lo necesario y, por tanto, el tamao muestral ser
mayor o igual de lo requerido.

71
Ventajas del muestreo sistemtico frente al muestreo aleatorio simple:
En la prctica el muestreo sistemtico es ms fcil de llevar a cabo y est expuesto a
menos errores del encuestador.
En el muestreo aleatorio simple podra ser un problema si dos nmeros aleatorios fueran
consecutivos o muy prximos. Por ejemplo, sera difcil escoger una muestra aleatoria
simple de personas entre las que entran a un supermercado. Al seleccionar las personas
al azar podramos encontrarnos que no hemos acabado de hacer la encuesta a un cliente
cuando el siguiente a encuestar ya ha pasado. Pero s sera fcil coger 1 de cada 20
personas que pasen hasta completar la muestra.
Frecuentemente, con igual tamao de muestra, el muestreo sistemtico proporciona
mejor informacin que el muestreo aleatorio simple. Esto se debe a que la muestra
sistemtica se extiende uniformemente a lo largo de toda la poblacin, mientras que en
el muestreo aleatorio simple puede ocurrir que un gran nmero de observaciones se
concentre en una parte de la poblacin y descuide otras.
Por ejemplo, supongamos que en una fbrica los primeros 3000 motores se fabrican
correctamente y los ltimos 3000 son defectuosos por un desajuste en la lnea de
montaje. Una muestra aleatoria simple podra seleccionar un gran nmero o incluso
todos del mismo grupo, dando una mala estimacin de la proporcin de defectuosos. El
muestreo sistemtico, en cambio, selecciona el mismo nmero de motores de ambos
grupos, dando una estimacin mejor. En este caso, donde en cierta medida hay un
orden en la poblacin, el muestreo sistemtico es mejor que el muestreo aleatorio
simple.

Usos:
Este tipo de muestreo es muy utilizado por los planes de muestreo para el control de calidad
dentro del proceso de fabricacin, los auditores cuando se enfrentan a largas listas de apuntes
para comprobar y los investigadores de mercados cuando se enfrentan a personas en
movimiento.

4.2 Estimacin de la media, proporcin y el total poblacionales

1 n
ESTIMADOR DE LA MEDIA POBLACIONAL: = ysy = yi +( j 1) k
n j =1
1 i k i=punto de inicio o pivote

72
S2 N n
VARIANZA ESTIMADA DE y sy : ( )
V y sy =
n N

Comentarios.
N n
- Si se desconoce el tamao poblacional por su gran magnitud, entonces 1.
N
- Cuando N no es mltiplo exacto de n , el estimador es sesgado.

Como puede observarse, la varianza del estimador de la media se estima igual que en el
muestreo aleatorio simple (vase 4.3 Comparacin con el muestreo aleatorio simple). Aunque
las varianzas de los estimadores no son realmente iguales, stas son:
2 N n 2
V (y) = y V ( y sy ) = [1 + (n 1) ]
n N 1 n
donde = coeficiente de correlacin entre los elementos de una muestra sistemtica.

El tamao poblacional se desconoce en muchas situaciones prcticas en las que se usa el


muestreo sistemtico. Cuando N es conocido tambin se puede estimar el total poblacional.
ESTIMADOR DEL TOTAL POBLACIONAL: = Ny sy

2 S N n
V ( ) = N V ( y sy ) = N
2
VARIANZA ESTIMADA DE : 2

n N

Ejemplo 4.1
Los funcionarios de un museo estn interesados en el nmero total de personas que visitaron
el lugar durante un periodo de 180 das cuando una costosa coleccin de antigedades estuvo
en exhibicin. Puesto que el control de visitantes en el museo cada da es muy costoso, los
funcionarios decidieron obtener estos datos cada diez das. La informacin de esta muestra
sistemtica de 1 en 10 se resume en esta tabla
Da N personas que visitan el museo
3 160
13 350
23 225

173 290
18 18
yi = 4868
i =1

i =1
yi2 = 1321450
Use estos datos para estimar el nmero total de personas que visitaron el museo durante el
periodo especificado y el lmite para el error de estimacin.

73
Solucin
4868
N = 180 = Nysy = 180 = 48680 visitantes
18
( 4868 )
2

1321450
n
S2 = = 289, 79
n 1
S2 N - n
V ( ) = N 2 = 469461,18 B = 1370,34
n N

Como en el muestreo aleatorio simple, las propiedades del estimador de la proporcin son
anlogas a las propiedades de la media muestral:
1 n
ESTIMADOR DE LA PROPORCIN POBLACIONAL: p sy = yi+( j 1) k
n j =1
, yi = 0, 1

1 i k i=punto de inicio o pivote


p sy q sy N n
VARIANZA ESTIMADA DE p sy : V ( p sy ) =
n 1 N
Notemos, de nuevo, que las varianzas estimadas son iguales a las del muestreo aleatorio
simple.

Ejemplo 4.2
La Guardia Civil de Trfico est interesada en la proporcin de automovilistas que llevan el
permiso de conducir. Se instala un puesto de control en una carretera nacional y se detiene un
conductor de cada siete. Use los datos de la tabla adjunta para estimar la proporcin de
conductores que portan su licencia. Establezca un lmite para el error de estimacin. Suponga
que 2800 autos pasan por el puesto de verificacin durante el periodo de muestreo.
Automvil Respuesta
1 1
8 1
15 0

2794 1
400

i =1
yi = 324
Solucin
324
p sy = y sy = = 0,81
400
p q N n 0,81(1 0,81) 2800 400
V ( p sy ) = sy sy = = 0,000330612 B = 0, 0364
n 1 N 400 1 2800
74
Si la estratificacin de la poblacin fuese ventajosa, el muestreo sistemtico puede utilizarse
dentro de cada estrato en lugar del muestreo aleatorio simple, aplicndose las frmulas del
muestreo aleatorio estratificado, anlogamente a como se han utilizado las del muestreo
aleatorio simple para aproximar el comportamiento del muestreo sistemtico.

4.3 Comparacin con el muestreo aleatorio simple: Poblaciones ordenadas, aleatorias y


peridicas
Veamos bajo qu condiciones la varianza estimada de los estimadores en el muestreo
sistemtico se puede suponer igual a la del muestreo aleatorio simple.
Segn las expresiones
2 N n 2
V (y) = y V ( y sy ) = [1 + (n 1) ]
n N 1 n
N n
stas sern similares cuando 1 y 0 , pero en otros casos no.
N 1

Distinguimos los siguientes casos:


A. Poblacin ordenada ( 0)
Una poblacin es ordenada cuando los elementos que la constituyen estn ordenados
de acuerdo a los valores, crecientes o decrecientes, de una determinada caracterstica.
En este caso es preferible el uso del muestreo sistemtico, ya que la muestra se
extiende uniformemente a lo largo de toda la poblacin:
0 V ( y sy ) V ( y )

Por ejemplo, en una lista de cuentas por cobrar que estn ordenadas de mayor a menor
cantidad, las estimaciones de una muestra sistemtica tendran en general una varianza
menor que las de una muestra aleatoria simple (es posible que sta ltima contenga
solo cantidades grandes o cantidades pequeas).
Al utilizar las varianzas estimadas de los estimadores del muestreo aleatorio simple en
el muestreo sistemtico conseguimos una estimacin conservadora del error (mayor
que el error real que cometemos en el muestreo sistemtico).
B. Poblacin aleatoria ( 0)
Se dice que una poblacin es aleatoria cuando sus elementos estn ordenados al azar.
En este caso es indiferente el uso del muestreo aleatorio simple y el muestreo
sistemtico ya que
0 V ( y sy ) V ( y ) .

75
Por ejemplo, en una lista de estudiantes por orden alfabtico, la estimacin de sus
calificaciones sera similar con ambos muestreos ya que las calificaciones no dependen
del apellido del estudiante.
C. Poblacin peridica ( 0)
Una poblacin es peridica cuando los valores de la variable objeto de estudio tienen
una variacin cclica. En este caso es preferible el muestreo aleatorio simple dado que
0 V ( y sy ) > V ( y ) .

Por ejemplo:
a. Supongamos que tenemos una lista en la que los nombres de mujeres y
hombres se alternan. Una muestra sistemtica con k par proporcionara solo
una lista de mujeres o de hombres.
b. Ventas diarias de un supermercado a partir de una muestra sistemtica con
k = 7.
Para evitar este problema, el investigador puede cambiar varias veces el punto de
inicio aleatorio. Esto tiene el efecto de mezclar los elementos de la poblacin y
comportarse como una poblacin aleatoria, en cuyo caso el uso de las expresiones del
muestreo aleatorio simple en el muestreo sistemtico estara justificado.

4.4 Determinacin del tamao muestral


El tamao muestral requerido para estimar la media poblacional con un lmite B para el error
de estimacin se obtiene de las expresiones del muestreo aleatorio simple. Lo que conduce a
obtener muestras ms grandes de las necesarias en poblaciones ordenadas y muestras ms
pequeas en poblaciones peridicas (si no se mezclaran los elementos cambiando el punto de
inicio). En poblaciones aleatorias no tendremos problemas.

Tamao muestral requerido para estimar y con un lmite B para el error de estimacin

B2
N 2 4 para estimar la media
n= con D = 2
( N 1) D + 2 B para estimar el total
4 N 2

Tamao muestral requerido para estimar p y con un lmite B para el error de estimacin

B2
Npq 4 para estimar p
n= con D = 2
(N - 1)D + pq B para estimar el total
4 N 2

76
Ejemplo 4.3 (continuacin del ejemplo 4.2)
En un nuevo control, la Guardia Civil de Trfico espera que pasen unos 5000 automviles por
el puesto de verificacin. Determine el tamao de muestra y k para estimar p con un error
inferior al 2%. Repita esta ejercicio pero suponiendo que no se dispone de informacin previa.
Solucin
UTILIZANDO LA INFORMACIN PREVIA

p = 0,81 q = 1 p = 0,19
Npq 5000 0,81 (1 0,81)
n= = = 1176,97 1177 automviles
B 2
0, 02 2
( N 1)
4
+ pq (5000 1) + ( 0,81 (1 0,81) )
4

N
k = 4, 25
n
5000 5000
Si tomramos k=5 n = = 1000 . Tomando k=4 n = = 1250 1177 .
5 4
SIN UTILIZAR INFORMACIN PREVIA

p = 0,5 q = 0,5
Npq 5000 0,5 0, 5
n= = = 1666,889 1667 automviles
B 2
0, 02 2
( N 1)
4
+ pq (5000 1) + ( 0,5 0, 5 )
4

N
k = 2.9994
n
Con k=2 debemos obtener un tamao muestral superior a 1667 automviles. En efecto, se
obtiene:
5000
n= = 2500 .
2
Con k=3 se debera obtener un tamao inferior a 1667, tal como se ha explicado con
N
anterioridad, pero en esta ocasin el cociente = 2,9994 est muy prximo a 3 y sucede lo
n
siguiente:
5000
n= = 1666, 667 .
3
En definitiva, si la muestra de tamao 2500 resulta muy elevada se puede optar por utilizar el
valor k=3, y detener el muestreo sistemtico cuando hayan pasado por el control de la Guardia
Civil 5001 automviles, puesto que en este caso la muestra ser del tamao deseado:
5001
n= = 1667
3
77
EJERCICIOS RESUELTOS

1. La gerencia de una compaa privada con 2000 empleados est interesada en estimar la
proporcin de empleados que estn a favor de una nueva poltica de inversin. Una muestra
sistemtica de 1 en 10 es obtenida de los empleados que salen del edificio al final de un da
de trabajo (las respuestas a favor se han representado como 1)
Empleado Respuesta
muestreado
3 1
13 0
23 1

1993 1
200

y
i =1
i = 110

Se quiere volver a repetir el anterior estudio pero con un error de estimacin inferior al 5%
(considerando la muestra anterior como una muestra previa para estimar los parmetros
necesarios). Qu tipo de muestra sistemtica deber obtenerse? (indique n y k).
SOLUCIN
110 0, 052
N = 2000 p= = 0,55 q = 1 p = 0, 45 D = = 0, 000625
200 4
Npq N
n= = 330, 7 331 k = 6, 04 k = 6
( N 1) D + pq n

2. Un auditor se enfrenta a una larga lista de 1000 cuentas por cobrar de una empresa. El
valor de cada una de estas cuentas no suele superar los 21000. El auditor quiere estimar
el valor total de las deudas por cobrar con un error inferior a 1000000 y con una
confianza del 95%. Para ello decide tomar una muestra sistemtica de 1 en k . Determine
el valor de k.
SOLUCIN
21000 2 1000000 2
N = 1000 R = 21000 2 = 27562500 D = = 250000
42 4 1000 2
N 2 N
n= = 99,39 100 k = = 10
( N 1) D + 2
n

3. La tabla anexa muestra el nmero de nacimientos y la tasa de natalidad por cada 1000
individuos para Estados Unidos durante seis aos seleccionados sistemticamente.

78
Ao Nac.Masculinos Nac.Femeninos Total de Nac. Natalidad
1955 2073719 1973576 4047295 26,0
1960 2179708 2078142 4257850 23,7
1965 1927054 1833304 3760358 19,4
1970 1915378 1816008 3731386 18,4
1975 1613135 1531063 3144198 14,6
1980 1852616 1759642 3612258 15,9
Estime el nmero medio de varones nacidos por ao para el periodo 1955-1980, y
establezca un lmite para el error de estimacin.
SOLUCIN
Desde 1955 hasta 1980, ambos inclusive, hay 26 aos. N = 26 .
1 n 1
= ysy = yi = 11.561.610 = 1.926.935
n i =1 6

S 2 = 37913412871,20 (con las funciones estadsticas en el modo SD de la calculadora)

S2 N n
V ( ysy ) = = 4860693957,85 B = 139437,35
n N

4. La seccin de control de calidad de una empresa usa el muestreo sistemtico para estimar
la cantidad media de llenado en latas de 33cl que salen de una lnea de produccin. Los
datos de la tabla adjunta representan una muestra sistemtica 1 en 300 de una produccin
diaria de 1800 latas.
Cantidad de llenado en cl
33 32,5 33,5 33 32 31
Determine el tamao de la muestra y k para estimar el contenido medio de las latas con un
error de estimacin inferior a 0,42cl, considerando la muestra anterior como una muestra
previa para estimar los parmetros necesarios.
SOLUCIN: N=1800 n=6

(con las funciones estadsticas del modo SD de la calculadora ) : S n2'1 = 0,8 2 = Sn2'1

B2 N 2 1800
D= = 0, 0441 n= = 17,97 18 k= = 100
4 ( N 1) D + 2 18

5. Los funcionarios de cierta sociedad profesional desean determinar la proporcin de


miembros que apoyan varias enmiendas propuestas en las prcticas de arbitraje. Los
funcionarios tomaron una muestra sistemtica de 1 en 10, a partir de una lista en orden
alfabtico de los 650 miembros registrados, obteniendo que 47 estaban a favor de los
cambios propuestos. Se quiere repetir el estudio anterior con un error de estimacin

79
inferior al 5%. Considerando la muestra anterior como una muestra previa para estimar los
parmetros necesarios, qu tipo de muestra sistemtica deber obtenerse? (indique n y k).
SOLUCIN:
47
N=650 n=65 p= = 0, 7231 q = 1 0, 7231 = 0, 2769
65
B2
B = 0, 05 D= = 0, 000625
4
Npq 650
n= = 214,8 215 k = 3, 02 k =3
( N 1) D + pq 215

80
5. Muestreo por conglomerados.
5.1 Necesidad y ventajas del muestreo por conglomerados.
5.2 Formacin de los conglomerados. Conglomerados y estratos.
5.3 Estimacin de la media, proporcin y total poblacionales.
5.4 Determinacin del tamao muestral.

5.1 Necesidad y ventajas del muestreo por conglomerados.


Una muestra por conglomerados es una muestra aleatoria en la cual cada unidad de muestreo
es una coleccin (o conglomerado) de elementos.
El muestreo por conglomerados es til para obtener informacin en las siguientes situaciones:
Es complicado disponer de una lista de los elementos de la poblacin, mientras que es
fcil lograr un marco que liste los conglomerados. (Alumnos que asisten a clase =
elemento, aulas = conglomerados)
El coste de obtencin de las observaciones es menor debido al agrupamiento de los
elementos.

5.2 Formacin de los conglomerados. Conglomerados y estratos.


Los elementos de un conglomerado deben ser diferentes entre s, as una muestra con pocos
conglomerados recogera gran cantidad de informacin sobre el parmetro poblacional. Si los
elementos dentro de un conglomerado presentan caractersticas similares, tomar varias
observaciones dentro de un conglomerado no aporta ms informacin.
Recordemos que los estratos deban ser tan homogneos como fuera posible y diferir tanto
como se pudiera uno de otro con respecto a la caracterstica que est siendo estudiada. Los
conglomerados, sin embargo, deben ser tan heterogneos dentro de ellos como sea posible y
muy similar uno a otro para que el muestreo por conglomerados est indicado y proporcione
buenos resultados.
Una vez especificados los conglomerados, se selecciona una muestra aleatoria simple de
conglomerados.

5.3 Estimacin de la media, proporcin y total poblacionales.


Vamos a utilizar la siguiente notacin:
N = conglomerados en la poblacin. n = conglomerados en la muestra.
mi = elementos en el conglomerado i
yi = suma de las observaciones en el conglomerado i

81
N
M = mi = elementos en la poblacin (con frecuencia es desconocido)
i =1
n
m = mi = elementos en la muestra
i =1

1 N
M= mi = tamao medio de los conglomerados de la poblacin (con frecuencia es desconocido)
N i =1
1 n
m = mi = tamao medio de los conglomerados de la muestra (se utiliza para estimar M ).
n i =1

(A) Estimacin de la media.


El estimador de la media poblacional es la media y ,
n

1 n y i
= y = yi = i =1
n
m i =1
m
i =1
i

La media y tiene la forma de un estimador de razn, por lo que la varianza estimada de y


toma la forma de la varianza de un estimador de razn.
1 N n S c2 1 n
( )
2
V ( y) = 2
N n
donde Sc2 = yi ymi
n 1 i =1
M
( M es estimado por m , si se desconoce)
La varianza estimada es sesgada y sera un buen estimador de V ( y ) si n es grande ( n 20 ).
El sesgo desaparece cuando los tamaos de los conglomerados son iguales
( m1 = m2 = ... = mN ).

Notas:

1 N n S c2
La expresin de V ( y) = 2
no se suele simplificar como
M N n

N ( N n ) Sc2
V ( y) = para poder calcularla fcilmente cuando N y M sean desconocidos.
M2 n
N n
A veces N no se conoce debido a su gran tamao y se aproxima por 1. Si M es
N
desconocido M debe ser estimada por m .
Si la variable que estamos estudiando es dicotmica, hablaremos de la proporcin

poblacional p y de la proporcin muestral p . En este caso al nmero total de elementos

82
en el conglomerado i que poseen la caracterstica de inters se nota como ai en lugar de

yi como es habitual en variables numricas. As tendremos que


n

a i
p=y= i =1
n

m
i =1
i

Salvo esta diferencia en la notacin, todo lo anteriormente expuesto para variables


numricas es vlido para variables dicotmicas.

(B) Estimacin del total.



De la relacin entre la media y el total poblacional = se sigue que = M , siendo el
M
estimador del total poblacional

= M y
y la varianza estimada del mismo
S2 M 2 S2
V ( ) = M 2 V ( y ) = N ( N n) c 2 c
n m n
(sea cual sea el valor de M, ste no afecta a la varianza ni al error del estimador, aunque s al
valor del estimador del total)
Como en la estimacin del total con un estimador de razn, cuando M es desconocida y se
N n
estima por m y se aproxima por 1 debido al gran tamao de N, la varianza del
N
M 2 Sc2
estimador del total se aproxima por 2
.
m n

(C) Estimacin del total cuando se desconoce el tamao de la poblacin.


Frecuentemente el nmero de elementos en la poblacin no es conocido en problemas donde
se aplica el muestreo por conglomerados. En ese caso no podemos utilizar el estimador del

total = M y , debemos construir un estimador del total que no dependa de M . La cantidad

1 n
yt = yi , es el promedio de los totales de los conglomerados de la muestra y un estimador
n i =1
insesgado del promedio de los N totales de los conglomerados de la poblacin. Por el mismo
razonamiento empleado en el muestreo aleatorio simple, N y t es un estimador insesgado de la

suma de los totales de todos los conglomerados, o equivalentemente del total poblacional .

83
En resumen

t = N y t
2
S
V ( t ) = N 2 V ( y t ) = N ( N n) t
n
N n St2 1 n
( ) 1 n
2
donde V ( yt ) =
N n
St2 = yi y t
n 1 i =1
yt = yi
n i =1

Si existe una gran variacin entre los tamaos de los conglomerados y adems los tamaos

estn altamente correlacionados con los totales de los conglomerados, la varianza de t = N y t

es generalmente mayor que la varianza de = M y . Esto es debido a que el estimador

t = N y t no usa la informacin proporcionada por los tamaos de los conglomerados, mi , y


por ello puede ser menos preciso.
Cuando los tamaos de los conglomerados son iguales, los dos estimadores del total
coinciden, adems el estimador de la media, y , es un estimador insesgado de la media

poblacional y tambin es insesgado el estimador de su varianza, V ( y ) (lo mismo vale para el


total).

Ejemplo 5.1 En una ciudad se quiere estimar la proporcin de hogares interesados en contratar
el sistema de televisin digital, para lo cual se considera la ciudad dividida en 200 manzanas de
viviendas. Se extrae una muestra piloto de 5 manzanas y se interroga a cada familia acerca de
si estara interesada en contratar la televisin digital. Los datos de la encuesta se encuentran en
la tabla:
Manzana N hogares en la manzana N hogares interesados
1 8 2
2 7 2
3 9 3
4 6 3
5 5 3
a) Estime la proporcin de hogares interesados en contratar el sistema de televisin
digital. Calcule el lmite para el error de estimacin.
b) Con un intervalo de confianza estime el nmero de hogares interesados en
contratar dicho sistema.
c) Responda al apartado b) suponiendo que el nmero de hogares en la ciudad es
1500.

84
SOLUCIN
Aunque en un caso de variables dicotmicas como ste se suele usar en los textos la
notacin ai en lugar de yi , utilizaremos esta ltima para unificar la notacin a emplear en el
muestreo por conglomerados, tanto para variables numricas como dicotmicas.
mi yi mi2 yi2 mi yi
8 2 64 4 16
7 2 49 4 14
9 3 81 9 27
6 3 36 9 18
5 3 25 9 15
35 13 255 35 90

a) N=200 n=5

y i
13
p=y= i =1
n
= = 0,3714 p = 37,14%
35
m
i =1
i

1 n
( ) 1 n 2 3,3222
2 n n

yi ymi
2
Sc2 = = y 2 y y m + y mi2 = = 0,8306
n 1 i =1 n 1 i =1
i i i
i =1 i =1 4

Ya que M es desconocido, M debe ser estimada por m

1 n 35
m=
n i =1
mi =
5
= 7 hogares / manzana

1 N n S c2
V ( y) = 2
= 0, 003305 2 V ( y ) = 0,115 11,5%
m N n

1 n 13
b) yt =
n i =1
yi = = 2, 6
5
t = N y t = 520
2
1 n
(y y )
n n


2
y 2
yi
N ( N n) St2
i t i
n i =1
S =
2 i =1
= i =1 = 0, 3 V ( t ) = = 2.340
n 1 n 1
t
n

2 V ( t ) = 96, 75 ( 423, 25 ; 616, 75)

c)
1500 1 N n Sc2
= M y = 557,14 M= = 7,5 V ( y) = 2
= 0, 0028795
200 M N n
Observe que al conocer M , la estimacin de V ( y ) es diferente de la obtenida en a).
V ( ) = M 2 V ( y ) = 6478,8 2 V ( ) = 160,98 ( 396,16 ; 718,12 )

85
El lmite para el error de estimacin es ms pequeo en b) que en c), debido a que los tamaos
de los conglomerados no estn correlacionados con los totales de los conglomerados
( rmy2 = 0, 08 ). En otras palabras, los tamaos de los conglomerados proporcionan poca

informacin sobre los totales de los conglomerados.

5.4 Determinacin del tamao muestral.


Supongamos que los conglomerados ya estn formados y vamos a seleccionar el nmero de
conglomerados n para conseguir un determinado lmite para el error de estimacin B
N c2
n=
ND + c2

1 n
( )
2
donde c2 se estima mediante Sc2 = yi ymi
n 1 i =1
de una muestra previa, siendo

2
B2 M B2
D= para la estimacin de la media y D = para la estimacin del total.
4 4N 2
Habitualmente el tamao promedio de los conglomerados de la poblacin M no se conoce y
tiene que estimarse por el tamao medio m de los conglomerados de una muestra previa.

Cuando se utiliza N y t para estimar el total, el nmero de conglomerados en la muestra para


obtener un determinado lmite para el error de estimacin B viene dado por
N t2
n=
ND + t2

B2 1 n
( )
2
D=
4N 2
y t
2
se estima mediante S t
2
= yi y t
n 1 i =1
de una muestra previa.

Ejemplo 5.2 Suponiendo que los datos del ejemplo 5.1 representan una muestra previa, cmo
debe tomarse una nueva muestra para estimar la proporcin poblacional del apartado a) con un
lmite para el error de estimacin del 1%.
SOLUCIN
2
1 n 35 B2 M 0, 012 7 2
S = 0,8306
2
c M m = mi = =7 D= = = 0, 001225
n i =1 5 4 4

N c2
n= = 154, 4 155
ND + c2

86
EJERCICIOS RESUELTOS

1. Con motivo del cuarto centenario del Quijote, el Ministerio de Cultura desea estimar el
nmero de libros comprados cada mes en una localidad. Se selecciona una localidad con
6200 hogares agrupados en 700 manzanas de viviendas. Se tiene una encuesta piloto en la
cual se seleccion una muestra de 4 manzanas y se entrevistaron a todas las familias,
obtenindose los siguientes resultados:

manzana libros comprados cada mes por familia


1 1 2 1 0 3 2 1 0 1 2
2 1 0 2 2 0 0 1 3
3 2 1 1 1 1 0 2 1 2 2 2
4 1 1 0 2 1 0 3
Determine, usando los datos de la encuesta piloto, cuntas manzanas debe tener una nueva
muestra si se quiere estimar los libros comprados cada mes con un error de estimacin
inferior a 140 unidades.

SOLUCIN
mi yi mi2 yi2 mi yi
10 13 100 169 130
8 9 64 81 72
11 15 121 225 165
7 8 49 64 56
36 45 334 539 423
n

y i
B2
M = 6200 N = 700 y= i =1
n
= 1, 25 D = = 0, 01
4N 2
m
i =1
i

2
1 n
( ) 1 n 2
n n

yi ymi
2
c2 Sc2 = = y + y m 2
2 y mi yi = 1,125
n 1 i =1 n 1 i =1
i i
i =1 i =1
N c2
n= = 96,92 97
ND + c2

2. Una industria est considerando la revisin de su poltica de jubilacin y quiere estimar la


proporcin de empleados que apoyan la nueva poltica. La industria consta de 57 plantas.
Se selecciona una muestra aleatoria simple de 5 plantas y se obtienen las opiniones de los
empleados en estas plantas a travs de un cuestionario. Los resultados se presentan en esta
tabla:

87
Planta N empleados N empleados que apoyan la nueva poltica
1 51 42
2 62 53
3 49 40
4 73 45
5 101 63
a. Estime la proporcin de empleados en la industria que apoyan la nueva poltica de
jubilacin y establezca un lmite para el error de estimacin.
b. La industria modific su poltica de jubilacin despus de obtener los resultados de la
encuesta. Ahora se quiere estimar la proporcin de empleados a favor de la poltica
modificada Cuntas plantas deben ser muestreadas para tener un lmite del 5% para el
error de estimacin? Use los datos anteriores para aproximar los resultados de la nueva
encuesta.
SOLUCIN:
a) N = 57 n=5
mi yi mi2 yi2 mi yi
51 42 2601 1764 2142
62 53 3844 2809 3286
49 40 2401 1600 1960
73 45 5329 2025 3285
101 63 10201 3969 6363
336 243 24376 12167 17036
n

y i
243
p= i =1
n
= = 0, 7232 p = 72,32%
336
m
i =1
i

1 n
( ) 1 n 2
2 n 2 n
Sc2 = yi pmi
n 1 i =1
=
n 1 i =1
yi 2 p
i =1
y m
i i + p i =1
mi2 = 68, 7

2
2 2 336
M m = = 4515,84
5
1 N n Sc2
V ( p) = 2 = 0, 00278 2 V ( p) = 0,1054 10,54%
M N n
b)
2
B2 M 0, 052 4515,84 N c2
D= = = 2,8224 S
2 2
n= = 17, 06 18
ND + c2
c c
4 4

3. Un socilogo quiere estimar el ingreso medio por persona en cierta ciudad pequea donde
no existe una lista disponible de adultos residentes. Por esta razn para el diseo de la
encuesta utiliza muestreo por conglomerados. Se divide la ciudad en bloques rectangulares
y el socilogo decide que cada bloque rectangular va a ser considerado como un
conglomerado. Los conglomerados son numerados del 1 al 415. El investigador tiene

88
tiempo y dinero suficientes para hacer un muestreo de 25 conglomerados y entrevistar a
cada hogar dentro de cada uno. Se seleccionan aleatoriamente 25 conglomerados y se
realizan las entrevistas, obtenindose estos datos:
Ingreso total por
Conglomerado (i) N de residentes (mi)
conglomerado en (yi)
1 8 96000
2 12 121000
3 4 42000
4 5 65000
5 6 52000
6 6 40000
7 7 75000
8 5 65000
9 8 45000
10 3 50000
11 2 85000
12 6 43000
13 5 54000
14 10 49000
15 9 53000
16 3 50000
17 6 32000
18 5 22000
19 5 45000
20 4 37000
21 6 51000
22 8 30000
23 7 39000
24 3 47000
25 8 41000
151 residentes 1329000
a) Estime el ingreso medio por persona en la ciudad y establezca un lmite para el error de
estimacin.

b) Estime el ingreso total de todos los residentes de la ciudad y el lmite para el error de
estimacin, suponiendo que M es desconocido.

c) Suponiendo que existen 2500 residentes en la ciudad, estime el ingreso total de todos los
residentes de la ciudad mediante un intervalo de confianza.

NOTA: Repetir este ejemplo con todos los mi iguales (por ejemplo, mi = 6 i ,

supongamos conocido M = 6 415 = 2490 ) y estime el total por los dos mtodos

( )
estudiados = M y t = N y t . Observe como coinciden las dos estimaciones as como

la varianza del estimador y el lmite para el error de estimacin.

89
d) Tomando los anteriores datos como una muestra previa, cmo debe tomarse la muestra en
una encuesta futura para estimar el ingreso promedio por persona con un lmite para el
error de estimacin de 500.
SOLUCIN:
a) (este ejemplo no se puede resolver con una calculadora de 10 dgitos de forma exacta
por la dificultad de trabajar con cantidades muy grandes)

n=25 N=415

y i
1329000
=y= i =1
n
= = 8801,32 / residente
151
m
i =1
i

n n

yi2 = 960002 + ... = 82039000000


i =1
m
i =1
2
i = 82 + ... = 1047

y m = ( 96000 8) + ... = 8403000


i =1
i i

1 n
( ) 1 n 2 15227502247
2 n n

yi ymi
2
Sc2 = = y 2 y y m + y mi2 = = 634501213, 40
n 1 i =1 n 1 i =1
i i i
i =1 i =1 24

Ya que M es desconocido, M debe ser estimada por m ,

1 n 151
m=
n i =1
mi =
25
= 6, 04 residente / bloque

1 N n Sc2
V ( y) = 2
= 653785,19 2 V ( y ) = 1.617,14
M N n
b)
1 n 1329000
yt =
n i =1
yi =
25
= 53160 / bloque t = N y t = 22061400

2
n
1 n
y yi
2 1
82039000000 (1329000) 2
( )
i
1 n 2 n i =1
St2 = yi y t
n 1 i =1
= i =1
n 1
=
24
25 =

11389360000
= = 474556666, 6
24
2
S
V ( t ) = N ( N n) t = 3072279860000 2 V ( t ) = 3505584, 04
n

90
2500
c) N = 415 n = 25 M= = 6, 0241 = M y = 22003311, 26
415
1 N n S c2
Sc2 = 634501213, 40 V ( y) = 2
= 657240,9482
M N n

V ( ) = M 2 V ( y ) = 4107755926250 2 V ( ) = 4053519,92

(17949791,34 ; 26056831,18 )
Como puede observarse el lmite para el error de estimacin es ms pequeo en b) que en
c) debido a que los tamaos de los conglomerados no estn altamente correlacionados con
los totales de los conglomerados en este ejemplo ( rmy2 = 0, 0919 ). En otras palabras, los

tamaos de los conglomerados proporcionan poca informacin referente a los totales de


los conglomerados.
2
B2 M 5002 6, 04 2
d) S = 634501213, 40
2
c D= = = 2280100
4 4
N c2
n= = 166,58 167
ND + c2

4. Una empresa de trabajo temporal quiere investigar las necesidades de empleo de las
empresas de un pueblo. Para ello decide seleccionar una muestra de 10 de las 85 inscritas
en el registro mercantil. El nmero de bajas en el ltimo ao, el nmero de empleados y la
respuesta de cada empresa sobre si utilizara los servicios de la empresa de trabajo
temporal fueron los siguientes:
Empresa Bajas Empleados Respuesta
1 1 7 Si
2 2 15 No
3 9 85 Si
4 0 3 No
5 2 12 No
6 0 8 No
7 1 21 Si
8 0 4 No
9 4 35 No
10 6 92 Si
(a) Estime el nmero de bajas en el ltimo ao en las empresas del pueblo y el lmite del
error de estimacin.
(b) Estime la proporcin de empresas que usaran los servicios ofertados y el lmite del
error de estimacin.

91
SOLUCIN:
a) Se trata de un muestreo por conglomerados (cada empresa es un conglomerado) donde
no se conoce el nmero total de empleados para toda la poblacin, por tanto para estimar
el total consideraremos un muestreo aleatorio simple tomando como elementos muestrales
las empresas.

(y y )
2
yi
i t

1 2,25
2 0,25
9 42,25
0 6,25
2 0,25
0 6,25
1 2,25
0 6,25
4 2,25
6 12,25
25 80,5
25
yt =
= 2,5 bajas / empresa t = 85 2,5 = 212,5 bajas
10

80,5 85 10 8,94
St =
2
= 8,94 V ( y t ) = = 0, 7892157 V ( t ) = 852 V ( y t ) = 5702, 08
9 85 10
B = 2 5702.08 = 151, 02 bajas
b)
4
p= = 0, 40 (40%)
10
85 10 0, 4 0, 6
V ( p) = = 0, 02353 B = 2 0, 02353 = 0,3068 (30, 68%)
85 10 1

5. Se disea una encuesta econmica para estimar la cantidad media gastada en servicios por
hogar de una ciudad formada por 3600 hogares. Se selecciona una muestra aleatoria de 3
barrios de la ciudad de un total de 60. Los entrevistadores obtienen el gasto en servicios
de cada hogar en los barrios seleccionados; los gastos totales se muestran en esta tabla:
Barrio N hogares Cantidad total gastada en servicios ()
1 55 2210
2 60 2390
3 63 2430
Estime la cantidad media de gastos en servicios por hogar en la ciudad y el lmite para el
error de estimacin.

92
SOLUCIN:
mi yi
121550
143400
153090
n

m y
i =1
i i = 418040

3600
N = 60 n=3 M= = 60
60
n n n n

mi = 178
i =1
mi2 = 10594
i =1
yi = 7030
i =1
y i =1
2
i = 16501100
n

y i
y== i =1
n
= 39, 49
m i =1
i

1 n
( ) 1 n 2
2 n n

yi ymi i
2
Sc = = + = 2612,04
2 2
y y m 2 y mi yi
n 1 i =1 n 1 i =1
i
i =1 i =1
1 N n Sc2
V ( y) = 2
= 0, 23 2 V ( y ) = 0,96
M N n

6. En un proceso de control del volumen envasado por una fbrica de bebidas se eligen 3 de
los 40 paquetes envasados en una hora, cada uno de los cuales contiene 4 envases, y se
mide el volumen que cada envase contiene. Las observaciones se presentan en la tabla
adjunta:
Paquete n Volumen envasado en cl
1 33,5 32,5 31 34
2 32,5 32 33 32,5
3 30,5 33 33 33,5
Estime el volumen medio de los envases y la cota del error de estimacin.
SOLUCIN:
N=40, n=3, mi yi mi yi
4 131 524
4 130 520
4 130 520
3

m y
i =1
i i = 1564

(con las funciones del modo SD de la calculadora ) :


3 3
M =m=4 mi = 12
i =1
m
i =1
2
i = 48

3 3
y t = 130,33 yi = 391
i =1
y
i =1
2
i = 50961

93
3

y i
yt
y== i =1
3
= = 32,5833 cl
m
m
i =1
i

1 3
( ) 1 3 2
2 3 3

yi ymi
2
Sc = = + = 0,3333
2 2
y y m 2 y mi yi
n 1 i =1 n 1 i =1
i i
i =1 i =1
1 N n Sc2
V ( y) = 2
= 0, 006423 2 V ( y ) = 0,1603 cl
M N n

7. Un fabricante de sierras quiere estimar el coste medio de reparacin mensual para las
sierras que ha vendido a ciertas industrias. El fabricante no puede obtener un coste de
reparacin para cada sierra, pero puede obtener la cantidad total gastada en reparacin y el
nmero de sierras que tiene cada industria. Entonces decide usar muestreo por
conglomerados, con cada industria como un conglomerado. El fabricante selecciona una
muestra aleatoria simple de 5 de 100 industrias a las que da servicio. Los datos sobre coste
total de reparaciones por industria y el nmero de sierras son:
Industria N sierras Costo total de reparacin
para el mes pasado ()
1 3 50
2 7 110
3 11 230
4 9 140
5 2 60
Estime el coste medio de reparacin por sierra para el mes pasado y el lmite para el error
de estimacin.
SOLUCIN: N=100 n=5
mi yi
150
770
2530
1260
120
n

m y
i =1
i i = 4830

(con las funciones del modo SD de la calculadora ) :


n n
M = m = 6, 4 m
i =1
i = 32 m
i =1
2
i = 264

n n
y t = 118 yi = 590
i =1
y
i =1
2
i = 90700

94
5

y i
yt
y== i =1
5
= = 18, 4375
m
m
i =1
i

1 n
( ) 1 n 2
2 n n

yi ymi
2
Sc = = + = 584, 57
2 2
y y m 2 y mi yi
n 1 i =1 n 1 i =1
i i
i =1 i =1
1 N n Sc2
V ( y) = 2
= 2, 7116 2 V ( y ) = 3, 2934
M N n

8. Un peridico quiere estimar la proporcin de votantes que apoyan a cierto candidato A. Ya


que la seleccin y entrevista de una muestra aleatoria simple de votantes registrados es
muy costosa, se utiliza muestreo por conglomerados, con distritos como conglomerados.
Se selecciona una muestra aleatoria de 5 distritos de un total de 495. El peridico quiere
hacer la estimacin el da de la eleccin, pero antes de que se haya hecho el recuento final
de los votos. Los reporteros son enviados a los lugares de votacin de cada distrito en la
muestra, para obtener la informacin pertinente directamente de los votantes. Los
resultados se muestran en la tabla:
N votantes N votantes que apoyan A
1290 680
1170 631
840 475
1620 935
1381 472
Estime la proporcin de votantes que apoyan al candidato A y el lmite para el error de
estimacin.
SOLUCIN:
N=495 n=5 mi yi
877200
738270
399000
1514700
651832
n

m y
i =1
i i = 4181002

(con las funciones del modo SD de la calculadora ) :


n n
M = m = 1260, 2 m i =1
i = 6301 m
i =1
2
i = 8270161
n n
y t = 638, 6 yi = 3193
i =1
y
i =1
2
i = 2183195

95
5

y i
yt
p== i =1
5
= = 0,506745 ( 50, 67% )
m
m
i =1
i

1 n
( ) 1 n 2
2 n n

yi ymi
2
Sc = = + = 17372,505
2 2
y y m 2 y mi yi
n 1 i =1 n 1 i =1
i i
i =1 i =1
1 N n Sc2
V ( p) = 2
= 0, 00216573 2 V ( y ) = 0, 0930748 ( 9,31% )
M N n

96
6. Muestreo con probabilidades desiguales.
6.1 Introduccin.
6.1.1 Probabilidades de inclusin.
6.1.2 Pesos del diseo muestral
6.1.3 Algunos mtodos con probabilidades desiguales.
6.2 Estimacin de la media, proporcin y total poblacionales.
6.3 El problema de la estimacin de la varianza de estimadores: mtodos de
remuestreo.
6.4 Aplicaciones en encuestas oficiales.

6.1.1 Probabilidades de inclusin.

En el captulo 1.3 se ha abordado el problema de seleccionar una muestra aleatoria simple (sin
reemplazamiento) en una poblacin finita. Al mtodo utilizado para la seleccin de una
muestra aleatoria de individuos se le conoce como diseo muestral. El muestreo aleatorio
simple se caracteriza por el hecho de que todas las muestras posibles con el mismo tamao n
tienen la misma probabilidad de ser seleccionadas. A la probabilidad de seleccionar una
determinada muestra s la denotaremos por p ( s ) .

Adicionalmente, cabe destacar que tambin los N individuos de la poblacin finita tienen la
misma probabilidad de ser seleccionados en una muestra de tamao n cuando se aplica un
muestreo aleatorio simple sin reemplazamiento y, en particular, esta probabilidad es n / N .
Sin embargo, en la prctica es muy frecuente que los organismos oficiales de estadstica,
empresas, instituciones y otros centros que realizan encuestas por muestreo hagan uso de
diseos muestrales donde las probabilidades de seleccin de muestras y/o individuos sean
desiguales. En esta situacin, los estimadores estudiados en el captulo 1 no son vlidos y
podran producir importantes errores. Los estimadores de parmetros como totales,
medias o proporciones, e incluso los estimadores de sus correspondientes varianzas deben
incluir en sus expresiones las probabilidades que tienen los individuos de ser
seleccionados en la muestra, para ser ms precisos.

La probabilidad de que el i-simo individuo est incluido en una muestra se denotar por i , y
su definicin es la siguiente:
i = p(s)
s i

A estas probabilidades tambin se les denominan probabilidades de inclusin de primer orden.


Por su parte, tambin pueden definirse las probabilidades de inclusin de segundo orden, o

97
bien la probabilidad de que ambos individuos i y j estn incluidos simultneamente en la
muestra. Esta probabilidad viene dada por:
ij =
s i & j
p(s)

En un muestreo aleatorio simple sin reemplazamiento (captulo 1.3), las probabilidades de


inclusin de primer y segundo orden vienen dadas, respectivamente, por:
n
i =
N
n n 1
ij =
N N 1
Por tanto, dado un muestreo aleatorio simple sin reemplazamiento es posible utilizar tanto las
expresiones que estudiaremos a continuacin como las expresiones ya estudiadas del captulo
1.3, y obtendremos en ambos casos los mismos resultados.

6.1.2 Pesos del diseo muestral (o factores de elevacin).

En general, los organismos oficiales de estadstica, tal como EUROSTAT, suelen llevar a
cabo para sus estudios muestras basadas en diseos muestrales con probabilidades desiguales,
y sus correspondientes bases de datos pblicas incorporan, para cada individuo de la muestra,
los llamados pesos muestrales, pesos del diseo muestral o factores del diseo, en lugar de las
probabilidades de inclusin ya explicadas.
Los pesos muestrales se definen simplemente como la inversa de las probabilidades de
inclusin de primer orden, es decir, el peso muestral del i-simo individuo se define como
1
di =
i

Por tanto, las expresiones de los estimadores en diseos desiguales se pueden expresar tanto
en trminos de las probabilidades de inclusin como en funcin de los pesos muestrales. Si se
desean utilizar las probabilidades de inclusin de primer orden pero slo se conocen los pesos
muestrales, es bastante fcil comprobar a partir de la expresin anterior que tales
probabilidades de inclusin de primer orden se pueden obtener como la inversa de los pesos
muestrales:
1
i =
di

98
Destacamos que es bastante comn por las empresas y agencias estadsticas utilizar diseos
muestrales donde los individuos tienen distinta probabilidad de ser seleccionados, y este hecho
se debe a varias razones. En primer lugar, las muestras con un gran tamao utilizan diseos
muestrales complejos donde combinan, por ejemplo, muestreo por conglomerados en varias
etapas con muestreo estratificado. En estas situaciones resulta muy conveniente y simple
proporcionar los pesos muestrales asociados a cada individuo, de forma que cualquier
investigador o usuario interesado en los datos pueda realizar estimaciones correctas y de una
forma muy simple basadas en los pesos muestrales.
Por otra parte, tambin existen situaciones en las que interesa asignar a ciertos individuos una
mayor probabilidad de ser seleccionados en comparacin con otros individuos. Por ejemplo,
los conocidos diseos muestrales basados en Probabilidades Proporcionales al Tamao (PPT)
y que estudiaremos a continuacin hacen uso de esta metodologa.
Encuestas destinadas a empresas suelen utilizar con bastante frecuencia muestras extradas
mediante PPT debido a la importancia de incluir en la muestra a las empresas ms grandes, las
cuales aportan una mayor cantidad de produccin de bienes o servicios.

6.1.3 Algunos mtodos con probabilidades desiguales.

En el muestreo aleatorio simple y en el muestro sistemtico los individuos tienen la misma


probabilidad de ser seleccionados, es decir, las probabilidades de inclusin de primer orden
son iguales para todos los individuos. A continuacin se describen algunos mtodos de
muestreo donde los individuos tienen distintas probabilidades de ser seleccionados, y se
proporcionan las correspondientes probabilidades de inclusin.

Mtodos con probabilidades proporcionales al tamao.


En primer lugar destacamos los diseos muestrales con probabilidades proporcionales al
tamao (PPT), donde los individuos de la poblacin tienen probabilidades de ser
seleccionados proporcionales a los valores { x1 , , xN } de una variable auxiliar x, y a la cual

tambin se le suele denominar tamao. En estos diseos se asume que los valores
{ x1 , , xN } son conocidos y positivos. Las probabilidades de inclusin de primer orden de un

diseo muestral PPT vienen dados por:


N
xi
i = n , con x = xi
x i =1

99
Algunos mtodos muy conocidos basados en PPT son: mtodo de Lahiri, mtodo de Brewer,
mtodo de Midzuno, mtodo de Madow, mtodo de Sampford,

Muestreo aleatorio estratificado


En el muestreo aleatorio estratificado, salvo que se aplique asignacin proporcional, los
individuos de un estrato tendrn una probabilidad de ser seleccionados distinta de la
probabilidad de ser seleccionados los individuos del resto de estratos de la poblacin, y por
tanto, el muestreo aleatorio estratificado tambin puede considerarse como un diseo muestral
con probabilidades desiguales. En un muestreo aleatorio estratificado, las probabilidades de
inclusin vienen dadas por:
nh
i = si el individuo i pertenece al estrato h.
Nh

nh nh 1
N N 1 si ambos individuos i y j pertenecen al estrato h.

ij = h h
nh nk si el individuo i pertenece al estrato h, y el individuo j al estrato k
N h N k
Por tanto, en un muestreo estratificado se pueden aplicar tanto las expresiones estudiadas en el
captulo 2 como las expresiones que se estudian a continuacin basadas en las probabilidades
de inclusin.

6.2 Estimacin de la media, proporcin y total poblacionales.

Estimacin de la media poblacional.


Dada una muestra seleccionada con probabilidades desiguales, en la prctica se pueden
utilizar dos estimadores diferentes para la media poblacional ( y ) de una variable de inters y:

el estimador de tipo Horvitz-Thompson y el estimador de tipo Hjek.

El estimador de tipo Horvitz-Thompson para la media poblacional viene dado por la


expresin:
n
1 yi
yHT =
N

i =1 i

Este estimador se puede expresar fcilmente en funcin de los pesos muestrales:


n
1
yHT =
N
d y
i =1
i i

100
El estimador de tipo Horvitz-Thompson tiene la propiedad de ser insesgado.
Para estimar la varianza de este estimador podemos utilizar las siguientes expresiones
(complicadas por apoyarse en las probabilidades de inclusin de segundo orden):

1. Estimador de la varianza de tipo Horvitz-Thompson:


1 n
yi2 2 n n ij i j yi y j
VHT ( yHT ) = 2 (1 ) +
N i =1
i
i
2
N2 i =1 j >i ij i j

2. Estimador de la varianza de tipo Sen-Yates-Grundy:


2
1 n n i j ij yi y j
VSYG ( yHT ) = 2
N i =1 j >i ij i j

El estimador de tipo Hjek para la media poblacional viene dado por la expresin:
1 n yi n
1

yH =
N i =1 i
donde =
N i =1 i
.

Si comparamos ambos estimadores de la media poblacional podemos destacar que el


estimador de tipo Hjek no es insesgado, a diferencia del estimador de tipo Horvitz-Thompson
que si lo es. No obstante, el estimador de tipo Hjek es aproximadamente insesgado, lo cual
quiere decir que el valor esperado de este estimador se aproxima a la media poblacional para
tamaos muestrales elevados. Por otra parte, el estimador de tipo Hjek suele tener una
varianza menor que la varianza del estimador de tipo Horvitz-Thompson. Adems, podemos
observar que si el tamao de la poblacin N es conocido se podran obtener ambos
estimadores, mientras que si N es desconocido tan slo sera posible obtener el estimador de
tipo Hjek.

Existen varias tcnicas para estimar la varianza del estimador de tipo Hjek. Por ejemplo, el
estimador de la varianza Quenouille-Tukey (utilizando el mtodo Jackknife) viene dado por la
siguiente expresin:
N n n 1 n
VJ ( yH ) = ( yH ( i ) yH )
2

N n i =1

donde y H (i ) denota el estimador de tipo Hjek pero despus de eliminar de la muestra el i-


simo individuo, es decir,
1 yj 1
yH ( i ) =
N js , j i j
con N (i ) =
js , j i j
(i)

Para muestras con tamaos muestrales elevados ( n > 30 ) tambin se suele asumir que los
estimadores de la media anteriores siguen una distribucin Normal, y por tanto el lmite del

101
error de estimacin y los intervalos de confianza se definen de la misma forma que en
captulos anteriores.

Estimacin de la proporcin poblacional.

En el caso de variables dicotmicas, los estimadores de la proporcin poblacional p se


obtienen siguiendo las mismas expresiones que las proporcionadas para la estimacin de la
media poblacional. De este modo, los estimadores de tipo Horvitz-Thompson y de tipo Hjek
de la proporcin poblacional son, respectivamente:
n n
1 yi 1 yi
p HT =
N

i =1
y p H =
N

i =1
i i

En el caso de que la proporcin poblacional p tome valores prximos a 1, se recomienda


utilizar el estimador de tipo Hjek, debido a que este estimador toma el valor 1 cuando todas
las observaciones yi de la muestra son unos. Esta propiedad no se cumple para el estimador

de tipo Horvitz-Thompson, e incluso se podran obtener estimaciones mayores de 1 en estas


situaciones donde la proporcin poblacional se aproxima a la unidad.

Por otra parte, las expresiones de las varianzas estimadas de los estimadores de la media
poblacional tambin pueden utilizarse para las varianzas estimadas de los estimadores de una
proporcin, y por tanto se tiene:

Estimador de tipo Horvitz-Thompson de la proporcin:

1. Estimador de la varianza de tipo Horvitz-Thompson:


1 n
yi2 2 n n ij i j yi y j
VHT ( yHT ) = 2 (1 ) +
N i =1
i
i
2
N2 i =1 j >i ij i j

2. Estimador de la varianza de tipo Sen-Yates-Grundy:


2
1 n n i j ij yi y j
VSYG ( yHT ) = 2
N i =1 j >i ij i j

Estimador de tipo Hjek de la proporcin:


Estimador de la varianza usando el mtodo Jackknife:
N n n 1 n
( p H (i ) p H )
1 yj 1
VJ ( p H ) =
2
p H (i ) = N ( i ) =
N n i =1 N ( i ) js , j i
j js , j i j

102
Ejemplo 6.1. Segn la agencia de estadstica EUROSTAT, una persona se considera pobre si
sus ingresos por unidad de consumo son inferiores al umbral o lnea de pobreza fijado en el
pas de dicha persona. Supongamos que en una poblacin con 1000 habitantes se selecciona
una muestra con probabilidades desiguales de tamao 10, obtenindose los siguientes
resultados
i Ingresos i i Ingresos i
1 1500 0,020 6 1100 0,010
2 600 0,010 7 1300 0,020
3 2000 0,005 8 1350 0,005
4 450 0,010 9 960 0,010
5 700 0,020 10 1700 0,010
Donde suponemos los i conocidos (la agencia EUROSTAT proporciona los pesos del diseo
muestral).
Si el umbral de pobreza en esta poblacin lo ha fijado EUROSTAT en 750 euros, obtenga un
intervalo de confianza para la proporcin de pobres de esta poblacin con un nivel de
confianza del 95% y basado en el estimador de tipo Hjek.

Solucin: En primer lugar hay que definir la variable dicotmica y, la cual tomar el valor 1 si
la persona se considera pobre y 0 en caso contrario. En otras palabras, la variable y tomar el
valor 1 si su ingreso por unidad de consumo es inferior al umbral de pobreza (750 euros) y la
variable tomar el valor 0 en caso contrario.
1 yi 1 yj
i N (i ) = N ( p p H )
2
I yi p H (i )
i i i js , j i j H (i )

1 0 0,020 50 0 1000 250 0,2500


2 1 0,010 100 100 950 150 0,1579
3 0 0,005 200 0 850 250 0,2941
4 1 0,010 100 100 950 150 0,1579
5 1 0,020 50 50 1000 200 0,2000
6 0 0,010 100 0 950 250 0,2632
7 0 0,020 50 0 1000 250 0,2500
8 0 0,005 200 0 850 250 0,2941
9 0 0,010 100 0 950 250 0,2632
10 0 0,010 100 0 950 250 0,2632

N = 1050 250 0,02276

103
El estimador de tipo Hjek de la proporcin de pobre es:

n n
1 yi 250 1
p H =
N

i =1
=
1050
= 0, 2381 donde N =
i =1 i
i

Se estima que el 23,81% de esta poblacin es considerada como pobre segn EUROSTAT.

Para obtener el estimador de la varianza de tipo Hjek necesitaremos incluir en la tabla


anterior los resultados de las expresiones:

1 yj 1 n 1 1 1
p H (i ) = ; N (i ) =
js , j i j
= = N ,
N( i ) js , j i
j j =1 j i i

El estimador de la varianza que resulta es:

N n n 1 n 1000 10 10 1
VJ ( p H ) = ( p H (i ) p H ) =
2
0, 02276 = 0, 0203
N n i =1 1000 10

El intervalo de confianza viene dado por:

p H 2 VJ ( p H ) = ( 0, 2381 2 0,1425 ; 0, 2381 + 2 0,1425 ) = (0, 05 ; 0,52) = [0 ; 0,52)

Estimacin del total poblacional.


Para estimar el total poblacional, , dado que = = N , el procedimiento es similar
N
al estudiado en captulos anteriores, es decir, para estimar el total slo hay que multiplicar por
N el estimador de la media. Adems, dado que se cumple la propiedad V (kX ) = k 2V ( X ) , para

obtener la varianza del estimador del total habra que multiplicar por N 2 el estimador de la
varianzas estudiadas en el problema de la estimacin de la media. En particular, las
expresiones asociadas a la estimacin del total poblacional son:

Estimador de tipo Horvitz-Thompson para el total poblacional:


n
yi
HT = N yHT =
i =1 i

104
Estimadores de la varianza del estimador de tipo Horvitz-Thompson:

1. Estimador de la varianza de tipo Horvitz-Thompson:


n
n
y2 n
i j yi y j
VHT (HT ) = N 2VHT ( yHT ) = (1 i ) i2 + 2
ij

i =1 i i =1 j > i ij i j

2. Estimador de la varianza de tipo Sen-Yates-Grundy:


2
i j ij
n n yi y j
VSYG (HT ) = N VSYG ( yHT ) =
2

i =1 j >i ij i j

Estimador de tipo Hjek para el total poblacional:


n n
N yi 1
H = N yH =
N

i =1
donde N = .
i =1 i
i

Si N es conocido se pueden obtener ambos estimadores. En el caso de que N sea desconocido


slo es posible obtener el estimador de tipo Horvitz-Thompson.

Estimadores de la varianza del estimador de tipo Hjek (mtodo Jackknife):


N n n 1 n N n n 1 n
VJ (H ) = N 2VJ ( yH ) = N 2 ( H ) (H ( i ) H )
2 2
y H (i ) y =
N n i =1 N n i =1

N yj 1
H (i ) =
N
j
N (i ) = j
( i ) js , j i js , j i

Ejemplo 6.2. Para los datos del Ejemplo 6.1, obtenga la estimacin del nmero total de pobres
en la poblacin en estudio as como el lmite del error de estimacin.

Solucin:
Para estimar el total de pobres hay que multiplicar el estimador de la proporcin por el tamao
de la poblacin:
H = N p H = 1000 0, 2381 = 238,1
Es decir, se estima que en la poblacin hay 238 personas consideradas como pobres.
El lmite del error de estimacin viene dado por:

B = 2 V (H ) = 2 V ( Np H ) = 2 N 2V ( p H ) = 2 N V ( p H ) = 2 1000 0, 0203 = 284,96 .

105
Ejemplo 6.3. Siguiendo con el Ejemplo 2.1, se est interesado de nuevo en determinar la
audiencia de la publicidad televisiva en una cadena local de un municipio, y se decide realizar
una encuesta por muestreo para estimar el nmero de horas por semana que se ve la televisin
en las viviendas del municipio. ste est formado por tres barrios con diferentes perfiles
socio-culturales que afectan a la audiencia televisiva. Hay 210 hogares en el barrio A, 84 en el
barrio B y 126 en el barrio C. En esta ocasin, la empresa publicitaria tiene tiempo y dinero
suficientes para entrevistar 23 hogares y decide seleccionar muestras aleatorias de tamaos: 11
del barrio A, 6 del barrio B, y 6 del barrio C.
Se seleccionan las muestras aleatorias simples y se realizan las entrevistas. Los resultados,
con mediciones del tiempo que se ve la televisin en horas por semana, se muestran en la
siguiente tabla:

BARRIO A BARRIO B BARRIO C


39 34 24 22 40 16 21
27 42 28 17
37 38 17 23
41 37 24 18
30 36 37 25
Estimar el tiempo medio que se ve la televisin por semana en todos los hogares del
municipio usando:
a) Las expresiones del muestreo aleatorio estratificado.
b) Las expresiones para diseos muestrales con probabilidades desiguales.

Solucin:

a) Muestreo aleatorio estratificado

Barrio Ni yi N i yi

A 210 35 7350

B 84 28 2352

C 126 20 2520

420 12222

Usando muestreo aleatorio estratificado, el nmero medio de horas que se ve la televisin a la


semana en todo el municipio es:
3
1
yst =
N
N y
i =1
i i = 29,1 horas/semana

106
b) Muestreo con probabilidades desiguales

Las probabilidades de inclusin de los individuos segn al barrio al que pertenecen son:

n A 11 1 N A 210
1 = = =0,05238 si el individuo i pertenece al barrio A = = =19,090909
N A 210 1 nA 11
nB 6 1 N B 84
2 = = =0,07143 si el individuo i pertenece al barrio B = = =14
N B 84 2 nB 6
nC 6 1 N C 126
3 = = =0,04762 si el individuo i pertenece al barrio C = = =21
N C 126 3 nC 6

A partir de las probabilidades de inclusin podemos observar que los individuos del barrio B
tienen una mayor probabilidad de pertenecer a la muestra, mientras que los individuos del
barrio C son los que tienen la menor probabilidad.

Estimador de tipo Horvitz-Thompson:


n
1 yi 12222, 04
y HT =
N

i =1
=
420
= 29,1 horas/semana
i

Estimador de tipo Hjek:


n
1 yi 12222, 04
yH =
N

i =1
=
420
= 29,1 horas/semana
i

Como ocurre en este ejercicio y en general, el estimador de la media tipo Horvitz-Thompson


y de tipo Hjek coinciden con el estimador de la media basado en muestras aleatorias simples
y en muestras aleatorias estratificadas.

107
yi 1
Barrio yi i
i i
A 39 0,05238 744,5590 19,0909
27 0,05238 515,4639 19,0909
37 0,05238 706,3765 19,0909
41 0,05238 782,7415 19,0909
30 0,05238 572,7377 19,0909
34 0,05238 649,1027 19,0909
42 0,05238 801,8328 19,0909
38 0,05238 725,4677 19,0909
37 0,05238 706,3765 19,0909
36 0,05238 687,2852 19,0909
24 0,05238 458,1901 19,0909
B 22 0,07143 307,9938 14
28 0,07143 391,9922 14
17 0,07143 237,9952 14
24 0,07143 335,9933 14
37 0,07143 517,9896 14
40 0,07143 559,9888 14
C 16 0,04762 335,9933 21
17 0,04762 356,9929 21
23 0,04762 482,9903 21
18 0,04762 377,9924 21
25 0,04762 524,9895 21
21 0,04762 440,9912 21
12222,04 N = 410

6.3 El problema de la estimacin de la varianza de estimadores: mtodos de


remuestreo.

En un muestreo con probabilidades desiguales es bastante comn que las probabilidades de


inclusin de segundo orden sean desconocidas. Este hecho supone un problema para la
estimacin de la varianza de estimadores puesto que tales expresiones dependen de estas
probabilidades de inclusin de segundo orden, tal como se ha podido observar a lo largo de

108
este captulo. Este problema se puede resolver mediantes diferentes tcnicas. Por ejemplo, una
opcin podra ser aproximar las probabilidades de inclusin de segundo orden a partir de las
probabilidades de inclusin de primer orden. Sin embargo, el procedimiento ms comn que
suele utilizarse en la prctica es recurrir a un mtodo de estimacin de la varianza por
remuestreo. En general, este procedimiento consiste en obtener distintas estimaciones del
parmetro en estudio a partir de los datos muestrales, y aproximar la varianza del estimador a
travs de la variabilidad de estas estimaciones adicionales. Los mtodos de remuestreo ms
comunes son: el mtodo Jackknife y el mtodo Bootstrap.

Para explicar estos mtodos de remuestreo consideremos que el objetivo es estimar un


determinado parmetro (por ejemplo, la media, la proporcin o el total poblacional) a partir
de una muestra de tamao n, y donde representa el correspondiente estimador de .

1. Mtodo Jackknife. Denotando por (i ) al estimador despus de eliminar de la muestra la

observacin i-sima, el estimador de la varianza de por el mtodo Jackknife tiene la


siguiente expresin:
N n n 1 n
() ( )
2
VJ =
N
(i )
n i =1

2. Mtodo Bootstrap Consiste en replicar d i veces las observaciones xi de la muestra, de


forma que se obtiene una nueva poblacin llamada poblacin Bootstrap, y la cual tiene un
tamao aproximado de N valores (igual que la poblacin original). A partir de esta
poblacin se extraen B muestras (llamadas muestras Bootstrap). En general, habra que
considerar un valor de B mayor que 100 para obtener una buena aproximacin de la

varianza (algunos autores sugieren hasta B>1000). Denotaremos por (b ) al estimador

obtenido en la b-sima muestra Bootstrap. El estimador de la varianza de por el mtodo


Bootstrap tiene la siguiente expresin:

() 1 B
( ) 1 B
2
VB = (b ) B
B 1 b =1
; B = (b )
B b =1

N
En el caso del muestreo aleatorio simple d i = el anterior estimador de la varianza no
n
es insesgado. Pero lo es si las muestras Bootstrap se toman de tamao n-1.

109
Los mtodos de remuestreo, tal como el Jackknife y el Bootstrap, tienen una carga
computacional muy elevada y suelen utilizarse programas especficos para su clculo.

Ejemplo 6.4. Un banco tiene repartidos 100 cajeros automticos en la provincia de Granada.
El responsable de este banco desea estimar la cantidad media de efectivo que se retiran en
todos sus cajeros automticos en un determinado da, por lo que selecciona una muestra
aleatoria simple sin reemplazamiento de 5 cajeros y obtiene las siguientes cantidades (en miles
de euros):
Cajero 1 2 3 4 5
Efectivo 15 20 10 25 30

Obtenga intervalos de confianza para el importe medio que se retira en los cajeros utilizando
la frmula de la varianza del muestreo aleatorio simple y las varianzas obtenidas por los
mtodos Jackknife y Bootstrap. Para el mtodo Bootstrap considere que se obtuvieron 10
muestras Bootstrap, y stas fueron las siguientes:

b Muestra Bootstrap b Muestra Bootstrap

1 {1,1, 2, 4,5} 6 {1, 2,3,3, 4}


2 {1, 2, 2, 2,5} 7 {1, 2, 2,3,5}
3 {1, 2,3, 4,5} 8 {3,3, 4,5,5}
4 {3,3, 4,5,5} 9 {3,3,3, 4, 4}
5 {1,1,3, 4, 4} 10 {2,3, 4,5,5}

Solucin:
El estimador de la media en un muestreo aleatorio simple es:

1 n 100
y=
n i =1
yi =
5
= 20

Se estima que en los cajeros se retiran de media 20000 euros en el da del estudio.

110
Intervalo de confianza usando la expresin del muestreo aleatorio simple:

S 2 N n 62,5 100 5
V ( y) = = = 11,875
n N 5 100

(y 2 V ( y) , y + 2 V ( y) ) = (13,11, 26,89)

Intervalo de confianza usando el mtodo Jackknife:

(y y)
2
i y(i ) (i )

1 21,25 1,5625
2 20,00 0,0000
3 22.50 6,2500
4 18,75 1,5625
5 17,50 6,2500
15,625

N n n 1 n 100 5 5 1
VJ ( y ) = ( y(i ) y ) =
2
15, 625 = 11,875
N n i =1 100 5

(y 2 VJ ( y ) , y + 2 V J ( y ) ) = (13,11, 26,89)

Intervalo de confianza usando el mtodo Bootstrap:

1 n 1
y(1) = y1i = (15 + 15 + 20 + 25 + 30 ) = 21
n i =1 5
1 n 1
y(2) = y2i = (15 + 20 + 20 + 20 + 30 ) = 21
n i =1 5

1 n 1
y(10) = y2 i = ( 20 + 10 + 25 + 30 + 30 ) = 23
n i =1 5

111
(y 20, 5 )
2
b Muestra Bootstrap y( b )
(b )

1 {1,1, 2, 4,5} 21 0,25

2 {1, 2, 2, 2,5} 21 0,25

3 {1, 2,3, 4,5} 20 0,25

4 {3,3, 4,5,5} 25 20,25

5 {1,1,3, 4, 4} 20 0,25

6 {1, 2,3,3, 4} 16 20,25

7 {1, 2, 2,3,5} 19 2,25

8 {3,3, 4,5,5} 25 20,25

9 {3,3,3, 4, 4} 16 20,25

10 {2,3, 4,5,5} 23 6,25

205 90,5

1 B 205
yB =
B b =1
y( b ) =
10
= 20, 5

()
VB =
1 B

B 1 b =1
( y( b ) yB ) =
2 1
10 1
90, 5 = 10, 0556

(y 2 VB ( y ) , y + 2 V B ( y ) ) = (13, 66, 26,34)

6.4 Aplicaciones en encuestas oficiales

Oficina Europea de Estadstica Eurostat


Encuesta de la Unin Europea sobre ingresos y condiciones de vida (European Union Survey
on Income and Living Condition, EU-SILC).

El objetivo principal de esta encuesta es la recogida de microdatos multidimensionales


transversales y longitudinales sobre ingresos de individuos, pobreza, exclusin social y
112
condiciones de vida. El diseo muestral puede variar entre los distintos pases, aunque el ms
comn es el muestreo polietpico estratificado (stratified multi-stage sampling), tal como
puede verse en la siguiente tabla extrada directamente de Eurostat:

Figura 6.1. Diseos muestrales utilizados por Eurostat en distintos pases de la Unin
Europa. Figura tomada de la web oficial de Eurostat.

Los microdatos de esta encuesta estn disponibles para su explotacin por parte de
investigadores, empresas, etc. Bajo estos diseos muestrales, los individuos de una misma
poblacin tienen distintas probabilidades de ser seleccionados, y por esta razn, los
microdatos incluyen los pesos muestrales asociados a cada individuo, y los cuales deben
tenerse en cuenta en la etapa de estimacin de parmetros.

A modo de ejemplo se presenta en la figura siguiente resultados realizados por Lelkes et al.
(2009) y basados en datos de la encuesta EU-SILC del ao 2006. El objetivo es estimar la
proporcin de pobres de cada pas. Las estimaciones han tenido en cuenta los pesos del diseo
muestral proporcionados junto con los valores observados de las variables en estudio.

113
Figura 6.2. Estimaciones puntuales y por intervalos de confianza usando Bootstrap de la
proporcin de pobres en distintos pases de la Unin Europa. Los datos se han tomado de la
encuesta EU-SILC del ao 2006. Estudio realizado por Lelkes et al. (2009).

Referencia: Lelkes, O., Medgyesi, M., Tth, I. G. and Ward, T. (2009) Income Distribution
and the Risk of Poverty In T. Ward, O. Lelkes, H. Sutherland, and I. G. Tth (eds) European
Inequalities. Social Inclusion and Income Distribution in the European Union (Budapest:
Trki), pp. 1744.

114
7. Estimacin del tamao de la poblacin.
7.1 Muestreo directo.
7.2 Muestreo inverso.
7.3 Muestreo por cuadros.
7.3.1 Estimacin de la densidad y tamao de la poblacin.
7.3.2 Muestreo por cuadros en el espacio temporal.
7.3.3 Cuadros cargados.

7.1 Estimacin del tamao de la poblacin usando muestreo directo


En el muestreo directo se realizan los siguientes pasos:
1. Se selecciona una muestra aleatoria de tamao t , se marcan y se devuelven a la
poblacin.
2. Posteriormente se selecciona una muestra aleatoria de tamao n (tamao fijado de
antemano) de la misma poblacin y se observa cuntos de ellos estn marcados
( s =nmero de elementos marcados en esta 2 muestra)
t t
Sea p = proporcin de elementos marcados en la poblacin, p = , N= , pero p es
N p
desconocido. Entonces estimamos p mediante la proporcin muestral:
s
p = = proporcin de elementos marcados en la 2 muestra
n
Por tanto,
t t nt n, t = constantes
ESTIMADOR DE N : N = = =
p s / n s s = aleatoria

VARIANZA ESTIMADA DE N : ( )
V N =
t 2 n(n s )
s3

Comentarios
s = nmero de elementos marcados en la 2 muestra, ha de ser mayor que 0 para que
las frmulas estn bien definidas. Si en la segunda muestra no aparece ningn
elemento marcado, se aumenta el tamao muestral.

N no es un estimador insesgado de N :

[ ]
E N = N + N
(N t)
nt
N

(N t)
Cuanto mayor sean n y t menor ser el sesgo N .
nt

N tiende a sobreestimar el valor real de N .

115
Ejemplo 7.1
Un club deportivo se interesa por el nmero de truchas de ro en un arroyo. Durante un
periodo de varios das se atrapan 100 truchas, se marcan y se devuelven al arroyo. Obsrvese
que la muestra representa 100 peces diferentes, ya que cualquier pez atrapado que ya hubiera
sido marcado se devolva inmediatamente. Varias semanas despus se atrap una muestra de
120 peces y se observ el nmero de peces marcados. Supongamos que este nmero fue de 27
en la segunda muestra. Estime el tamao total de la poblacin de truchas y d un lmite de
error de estimacin.
Solucin
nt 120 100
N = = = 444, 4
s 27
t 2 n( n s ) 100 2 120(120 27)
( )
V N =

s3
=
273
= 5.669,87

( )
B = 2 V N = 150, 60

7.2 Estimacin del tamao de la poblacin usando muestreo inverso


La diferencia con el muestreo directo es que aqu el tamao de la segunda muestra no est
fijado (es aleatorio), lo que se fija es s = nmero de elementos marcados en la segunda
muestra.
Los pasos para realizar este mtodo son:
1. Se selecciona una muestra inicial de t elementos, se marcan y se devuelven a la
poblacin.
2. Se selecciona una segunda muestra aleatoria hasta que se obtienen s elementos
marcados (sea n el tamao final de dicha muestra).
t t nt t , s = constantes
ESTIMADOR DE N : N = = =
p s / n s n = aleatoria

VARIANZA ESTIMADA DE N : ( ) t 2 n( n s )
V N = 2
s ( s + 1)

Comentario. N es un estimador insesgado de N , por ello, si se pueden aplicar ambos tipos


de muestreo se prefiere el inverso.

116
Ejemplo 7.2
Una zologa desea estimar el tamao de la poblacin de tortugas en determinada rea
geogrfica. Ella cree que el tamao de la poblacin est entre 500 y 1000; por lo que una
muestra inicial de 100 parece ser suficiente. Las 100 tortugas son capturadas, marcadas y
liberadas. Toma una segunda muestra un mes despus y decide continuar muestreando hasta
que se recapturen 15 tortugas marcadas. Atrapa 160 tortugas para obtener las 15 marcadas.
Estime el tamao total de la poblacin de tortugas y establezca un lmite de error de
estimacin.
Solucin
nt 160 100
N = = = 1.066, 67
s 15
t 2 n(n s) 1002 160(160 15)
( )
V N = 2

s ( s + 1)
=
152 (15 + 1)
= 64.444, 44

( )
B = 2 V N = 507, 72

7.3.1 Estimacin de la densidad y del tamao de la poblacin usando muestreo por


cuadros
Con este mtodo se estudia el tamao de la poblacin contenida en un rea delimitada A
conocida. Los pasos a seguir son:
1. Dividir a la poblacin en N cuadros de igual rea a . Sea
mi = nmero de elementos en el cuadro i -simo

2. Tomar una muestra de n cuadros entre los N existentes. Se observa el nmero total
de elementos que contiene la muestra:
n
m = mi
i =1

3. Calcular la densidad de elementos en la muestra (densidad muestral):


n elementos en la muestra m
= =
rea de la muestra na
4. La densidad poblacional es
n elementos en la poblacin M M
= = =
rea de la poblacin Na A
entonces M = A . Por tanto:

117
m
ESTIMADOR DE LA DENSIDAD: =
na
m 1
VARIANZA ESTIMADA DE : V ( ) = 2 2 =
a n na
m
ESTIMADOR DEL TAMAO POBLACIONAL: M = A = A
na
A2 m
VARIANZA ESTIMADA DE M : V ( M ) = A V ( ) = 2 2
2

a n

Ejemplo 7.3
La polica de Madrid est interesada en conocer el nmero de aficionados que se reunieron en
torno a la fuente de Neptuno para celebrar el triunfo de su equipo. Con este dato se puede
conocer la cuanta de medios materiales y humanos (polica, proteccin civil, personal
sanitario, etc.) necesaria para atender futuras concentraciones. Para estimar el nmero de
aficionados se toma una fotografa area de la zona ocupada por stos, tras lo cual se traza
sobre ella una cuadrcula que divide el rea total en 300 cuadros de 10 metros de lado cada
uno. Posteriormente se numeran y se extrae una muestra aleatoria de 20 de estos cuadros; por
ltimo se cuenta el nmero de aficionados que hay en cada uno de los cuadros seleccionados,
obtenindose los resultados de la tabla:
Nmero de aficionados Nmero de aficionados
N del cuadro N del cuadro
en el cuadro en el cuadro
1 193 11 160
2 216 12 220
3 250 13 163
4 163 14 306
5 209 15 319
6 195 16 289
7 232 17 205
8 174 18 210
9 215 19 209
10 198 20 198
a) Estime la densidad de aficionados por metro cuadrado y obtenga su intervalo
de confianza.
b) Estime el nmero total de aficionados concentrados en la plaza de Neptuno y
obtenga su intervalo de confianza.

118
Solucin:
m 4324
a) a = 10 10 = 100 = = = 2,162
na 20 100

2,162
V ( ) = = = 0, 001081 B = 2 0, 001081 = 0, 066
na 2000

= 2,162 aficionados m2 (2, 096 , 2, 228)

b) A = 300 100 = 30.000 m 2

M = A = 30.000 2,162 = 64.860 aficionados B = AB = 30.000 0, 066 = 1.980


(62.880 , 66.840)

7.3.2 Muestreo en el espacio temporal


En determinadas ocasiones podemos tomar los cuadros como intervalos temporales. Vemoslo
con un ejemplo.
Ejemplo 7.4
Se desea estimar el nmero total de personas que diariamente solicitan informacin en una
oficina turstica. Se observa que 114 personas solicitan informacin, durante 12 intervalos de
5 minutos cada uno, repartidos aleatoriamente entre las 8 horas que permanece abierta la
oficina. Estime el total de personas que visitan la oficina diariamente y calcule la cota del
error de estimacin.
Solucin
A = 8 horas= 480 minutos n =12 intervalos a = 5 minutos m =114 personas
114 m
= = 1,9 personas / minuto M = A = 912 personas
5 12 na
A2 m
V ( M ) = 2 2 = 7.296 B = 170,8
a n

7.3.3 Cuadros cargados


En este tipo de muestreo tambin se divide a la poblacin en cuadros, pero el mtodo se utiliza
cuando despus de hecha la divisin son muchos los cuadros que no contienen elementos y
otros contienen pocos, es decir, la densidad de elementos por unidad de superficie es muy
pequea.
Este tipo de muestreo se basa en la identificacin de la presencia o ausencia de elementos en
cada uno de los cuadros de la muestra. Un cuadro se dice cargado cuando contiene al menos
un elemento objeto de estudio.

119
Los pasos a seguir son:
1. Se divide a la poblacin en N cuadros de igual rea a .
2. Se toma una muestra de n cuadros entre los N existentes. Se observa el nmero total
de cuadros no cargados de la muestra, a este nmero de cuadros sin presencia de
elementos se le designa por y . Es importante tener en cuenta que y no puede ser cero
ni n ( 0 < y < n ). Si una vez observada la muestra y = 0 y = n , ampliaremos el
tamao muestral
3. La densidad poblacional se estima como
1 y
= ln
a n
y su varianza como
1 n y
V ( ) = 2
a ny

Dado que M = A obtenemos


A y
ESTIMADOR DEL TAMAO POBLACIONAL: M = A = ln
a n

A2 n y
VARIANZA ESTIMADA DE M : V ( M ) = 2
a ny

Ejemplo 7.5
Se desea estimar el nmero total de autobuses que, entre las 6 y las 24 horas del domingo,
circulan por un determinado punto kilomtrico de una carretera. La observacin se realiza
mediante 40 intervalos, de 10 minutos cada uno, repartidos a lo largo del periodo en estudio.
En 18 ocasiones, de las cuarenta que se estableci el control, no circul por el punto en
cuestin ningn autobs. Estimar el nmero total de autobuses que circularon entre las 6 y las
24 horas. Dar un lmite de error de estimacin.
Solucin
A = 24-6=18 horas=1.080 minutos n = 40 intervalos a =10 minutos
A y 1.080 18
y =18 intervalos sin autobuses M = ln = ln = 86, 24
a n 10 40
A2 n y 1.0802 40 18
V ( M ) = 2 = = 356, 4 B = 37,8
a ny 102 40 18

120
EJERCICIOS RESUELTOS

1. En una plantacin de pinos de 200 acres, se va a estimar la densidad de rboles que


presentan hongos parsitos. Se toma una muestra de 10 cuadros de 0,5 acres cada uno. Las
diez parcelas muestreadas tuvieron una media de 2,8 rboles infectados por cuadro.
a) Estime la densidad de rboles infectados y establezca un lmite de error de
estimacin.
b) Estime el total de rboles infectados en los 200 acres de la plantacin y
establezca un lmite de error de estimacin.
SOLUCIN:
m 2,8 10
a) = = = 5, 6 arb. infectados / acre ;
na 10 0,5
1 1
V ( ) = = 5, 6 = 1,12 B = 2,1
na 10 0,5

b) M = A = 200 5, 6 = 1.120; B = AB = 200 2,1 = 423,32

2. Se desea estimar el nmero de vehculos de un modelo determinado que el mes prximo


utilizarn el aparcamiento de Puerta Real. Durante las 720 horas del mes se van a
establecer 5 controles aleatorios de 1 hora de duracin cada uno. Transcurrido el mes, se
ha observado en los 5 controles los siguientes resultados:
Control Nmero de vehculos de ese
modelo que usan el
aparcamiento
1 0
2 1
3 2
4 0
5 3
Estime el nmero total de vehculos del modelo en estudio que utilizaron el aparcamiento.
D el lmite del error de estimacin.
SOLUCIN:
6 m
A = 720 h a = 1 h n = 5 contr. m = 0 + 1 + 2 + 0 + 3 = 6 veh. m = = 1.2 = = 1.2 veh./ h
5 a
M = A = 1.2 720 = 864 veh.

A2
( )
V M =
an
= 124416 B = 2 124416 = 705.45 veh.

121
3. El hermano de un alumno de T.A.M. est pensando en abrir una farmacia de 24 horas.
Para saber si los ingresos compensaran los gastos de esta inversin deciden observar un
establecimiento similar. Este asiduo alumno de T.A.M. conoce perfectamente que es una
prdida de tiempo innecesaria observar el flujo de clientes las 24 horas del da por lo que
decide observar la afluencia de clientes en distintos periodos de igual duracin, obteniendo
los datos de la siguiente tabla
clientes
10:00-10:30 15
14:00-14:30 13
18:00-18:30 18
22:00-22:30 8
02:00-02:30 2
06:00-06:30 4
Estime el nmero de clientes diarios de la farmacia observada y el correspondiente lmite
para el error de estimacin.
SOLUCIN:

A = 24h a = 0.5h N = 48 n = 6 m = 60 m = 10

A2 A2 m
M = A =
m
a
( )
A = 480 clientes V M =
an
= 2 = 3840
an
( )
2 V M = 123,94 clientes

4. El ayuntamiento de Barcelona est interesado en conocer el nmero de aficionados que


acudieron al aeropuerto para vitorear al equipo campen. Para ello, dividieron la sala de
espera, de dimensiones 100 metros de largo por 40 metros de ancho, en 100 cuadros de
igual tamao y seleccionaron 20, observando que el nmero de personas era 1.100.
Estime el nmero total de asistentes y el lmite para el error de estimacin.
SOLUCIN:
A = 4000 a = 40 N = 100 n = 20 m = 1100 m = 55

A2 A2 m
m
M = A = A = 5500
a
( )
V M =
an
= 2 = 27500
an
( )
2 V M = 331, 66

5. Un alumno de A.T.C. desea estimar el nmero de alumnos que una determinada maana
han ido a la Facultad. Para ello se basa en que dicho da una conocida marca comercial ha
repartido a primeras horas de la maana en la entrada de la Facultad 500 carpetas. En un
intercambio de clase, sentado en un banco del pasillo, decide contar los alumnos que pasan
hasta observar a 100 que portan la carpeta, para lo que fue necesario contar hasta 382
alumnos.

122
Estime con un intervalo de confianza el nmero de alumnos que asistieron esa maana a la
Facultad.
SOLUCIN: muestreo inverso
t = 500 n = 382 s = 100
t nt
N= = = 1910 alumnos
p s

( )
t 2 n( n s )
V N = 2
s ( s + 1)
= 26664,35643 ( )
2 V N = 326,58 alumnos

(1910 326,58)

6. Se quiere conocer el nmero de enfermos que utilizan el Servicio de Urgencias de un


hospital. Para ello, de un mes (30 das) se seleccionaron al azar 3 das, observndose en
esas 72 horas que 4320 personas usaron el servicio.
a) Estime con un intervalo de confianza el n de enfermos/hora que acudieron al
servicio de urgencias.
b) Si se quisiera repetir en el prximo mes el mismo estudio, garantizando para la
anterior estimacin un error inferior a un enfermo/hora, cuantos das deberamos
observar?
SOLUCIN:
n
m
n=3 a = 1 dia = 24 horas m = mi = 4320 m= = 1440
i =1 n
m m 1440
a) = = = = 60 enfermos / hora
na a 24

( )
V = =
60
an 24 3
= 0,8333 2 V = 1,8257( )
( 60 1,8257 ) = (58,1743 , 61,8257 )

( )
b) 2 V = 1 4V ( ) = 1 4
an
=4
60
24 n
=1 n =
4 60
24
= 10

123
8. Decisin en ambiente de incertidumbre.
8.1 Elementos de un problema de decisin.
8.2 Tablas de decisin.
8.3 Valoracin de los resultados.
8.4 Clasificacin de los problemas de decisin.
8.5 Toma de decisiones en ambiente de incertidumbre.
8.5.1 Criterio de Laplace.
8.5.2 Criterio de Wald (maximin).
8.5.3 Criterio de Hurwicz.
8.5.4 Criterio de Savage (minimax).

8.1 Elementos de un problema de decisin.


En esta parte de la asignatura (Teora de la Decisin) abordaremos la toma racional
(coherente) de decisiones. Estudiaremos cmo deberan tomarse las decisiones en contraste
con la forma incoherente en que muchas veces se suelen tomar en la prctica.
El primer elemento a tener en cuenta en un problema de toma de decisiones es la persona
(empresa,) que tiene que decidir, al que se denomina decisor.
El decisor tiene unas caractersticas, como son sus preferencias, sus creencias y la informacin
de que dispone, que deben tenerse muy en cuenta al estudiar el problema.
Nos ocupamos exclusivamente del problema de decisin unipersonal, en el que hay un nico
decisor. Como caso particular de toma de decisiones estn aquellas situaciones en que dos
individuos han de decidir en conflicto de intereses, de cuyo estudio se encarga la Teora de
Juegos.
El segundo elemento de un problema de decisin es el conjunto de posibles acciones
o alternativas de que dispone el decisor.
En la construccin de un modelo para la toma de decisiones, la primera tarea del decisor, en
la que habr de poner mucha atencin, es la enumeracin exhaustiva de ese conjunto de
alternativas.
La Teora de la Decisin no entra en la elaboracin del conjunto de alternativas, es algo que
ya viene dado. Nosotros suponemos adems que ese conjunto es finito: a1, a2,.....,am, y entre
ellas hay que elegir slo una.
La eleccin de alternativa se har en funcin de sus consecuencias, consecuencias que
dependern de cierta cantidad de factores externos que estn fuera del control del decisor.
Se denomina estado de la naturaleza o simplemente estado a una descripcin completa de
cmo son esos factores externos en una determinada situacin. Si el decisor conociese el
estado de la naturaleza imperante, es decir, si conociese perfectamente cmo van a
124
manifestarse los factores externos, podra predecir con exactitud las consecuencias de sus
acciones.
La segunda tarea en la construccin del modelo para la toma de decisiones consiste en el
anlisis de esos factores externos, juzgando cules son relevantes y cules no, y en la
enumeracin exhaustiva de los estados de la naturaleza.
El conjunto de todos los posibles estados de la naturaleza constituye el tercer elemento de
un problema de decisin. Suponemos que este conjunto es finito, tendremos una lista
exhaustiva de estados de la naturaleza e1, e2, ..., en mutuamente excluyentes.
La conjuncin de una decisin con un estado de la naturaleza determina perfectamente
la consecuencia resultante, notaremos por xij al resultado de adoptar la alternativa ai,
cuando el estado de la naturaleza es ej.

8.2 Tablas de decisin


Muchos procesos de toma de decisiones son tratados por medio de las tablas de decisin,
tambin llamadas matriz de pagos, en las que se representan los elementos caractersticos de
estos problemas:
Los diferentes estados que puede presentar la naturaleza: e1, e2, ..., en.
Las acciones o alternativas entre las que seleccionar el decisor: a1, a2,...,am.
Las consecuencias o resultados xij de la eleccin de la alternativa ai cuando la
naturaleza presenta el estado ej.
Se supone, por simplicidad, un nmero finito de estados y alternativas. El formato general de
una tabla de decisin es el siguiente:

Estados de la Naturaleza

e1 ... ej ... en
a1 x11 ... x1j ... x1n
... ... ... ... ... ...
Alternativas

ai xi1 ... xij ... xin


... ... ... ... ... ...
am xm1 ... xmj ... xmn

125
8.3 Valoracin de los resultados.
Aunque los resultados xij no son necesariamente nmeros, supondremos que el decisor puede
valorarlos numricamente. En el contexto econmico y empresarial esta valoracin suele ser
monetaria. En lo que sigue identificaremos cada resultado con su valoracin numrica. As,
xij har referencia tanto al propio resultado como al valor asignado por el decisor.
Ejemplo 8.1. En cierta ciudad se va a construir un Centro de Congresos en una de dos posibles
localizaciones X e Y, que ser decidido el prximo ao. Una cadena de restaurantes est
interesada en abrir un restaurante cerca del nuevo Centro de Congresos, para lo cual tiene que
decidir qu inmueble comprar. La siguiente tabla muestra el precio de los inmuebles, el
beneficio estimado que obtendr el restaurante en cada posible localizacin, si el Centro de
Congresos se localiza all, y el valor de venta de cada inmueble si finalmente el Centro de
Congresos no se construye en ese lugar. Cul es la decisin ms adecuada?
en X en Y
Precio del inmueble 126 84
Beneficio estimado del restaurante 217 161
Valor de venta del inmueble 42 28
Las alternativas posibles de que dispone el decisor son las siguientes:
Comprar el inmueble en X.

Comprar el inmueble en Y.

Comprar ambos inmuebles.

No comprar ninguno.

Por otra parte, los posibles estados de la naturaleza son:


El Centro de Congresos se construye en X.

El Centro de Congresos se construye en Y.

As, si la cadena de restaurantes compra el terreno en X y el Centro de Congresos se


construye all finalmente, obtendr como rendimiento final el correspondiente a la explotacin
del restaurante, 217, menos la inversin realizada en la compra del inmueble, 126, es decir,
217-126 = 91. Por el contrario, si el Centro de Congresos se construye en Y, el inmueble
adquirido en X deber ser vendido, por lo que se obtendr un beneficio de 42, al que habr que
restar la inversin inicial en la compra, 126. Esto proporciona un rendimiento final de 42-126
= -84.
De manera anloga se determinan los resultados de las restantes alternativas ante cada uno de
los posibles estados de la naturaleza, dando lugar a la siguiente tabla de decisin:

126
Alternativas Estados de la Naturaleza
Inmueble comprado en: Centro de Congresos en X Centro de Congresos en Y
X 91 - 84
Y - 56 77
XeY 35 -7
Ninguno 0 0

8.4 Clasificacin de los problemas de decisin.


Se clasifican en funcin del grado de informacin que sobre los estados de la naturaleza tenga
el decisor:
Problemas de decisin en ambiente de certeza o certidumbre: El decisor conoce el
estado de la naturaleza que ocurrir con absoluta certeza. Solamente hay una
consecuencia para cada alternativa y puede predecir con certeza el resultado de sus
acciones. La tabla de decisin slo tiene una columna.
Problemas de decisin en ambiente de riesgo: Ocurre cuando hay dos o ms estados
de la naturaleza y se conoce la probabilidad de que se presente cada uno de ellos. Es
decir, se conoce una distribucin de probabilidad sobre la ocurrencia de los estados.
Cada alternativa tiene diferentes consecuencias (resultados) con una probabilidad
conocida.
Problemas de decisin en ambiente de incertidumbre: En estos problemas tambin
hay mltiples consecuencias (resultados) para cada alternativa, pero no se conoce la
probabilidad de ocurrencia de cada una de ellas. El decisor solo conoce cuales son los
estados posibles y las consecuencias de sus alternativas segn el estado que se
presente. La decisin final se basa en criterios subjetivos del decisor, jugando un
papel importante su actitud.

8.5 Toma de decisiones en ambiente de incertidumbre.

En los procesos de decisin bajo incertidumbre, el decisor conoce cules son los posibles
estados de la naturaleza, aunque no dispone de informacin alguna sobre cul de ellos
ocurrir. No slo es incapaz de predecir el estado real que se presentar, sino que adems no
puede cuantificar de ninguna forma esta incertidumbre.

A continuacin se describen las diferentes reglas de decisin en ambiente de incertidumbre,


que sern sucesivamente aplicadas al ejemplo de construccin del Centro de Congresos:

Criterio de Laplace
Criterio de Wald

127
Criterio Maximax
Criterio de Hurwicz
Criterio de Savage

8.5.1 Criterio de Laplace.


Este criterio, propuesto por Laplace en 1825, est basado en el principio de razn
insuficiente. Como a priori no existe ninguna razn para suponer que un estado se puede
presentar ms fcilmente que los dems, podemos considerar que todos los estados tienen la
misma probabilidad de ocurrencia, es decir, la ausencia de conocimiento sobre el estado de
la naturaleza equivale a afirmar que todos los estados son equiprobables. As, para un
problema de decisin con n posibles estados de la naturaleza, asignaramos probabilidad 1/n
a cada uno de ellos.
La regla de Laplace selecciona como alternativa ptima aquella que proporciona el mayor
resultado esperado:
1 n
max xij
ai
n j =1

Ejemplo 8.2. Partiendo del ejemplo de construccin del Centro de Congresos, la siguiente
tabla muestra los resultados esperados para cada una de las alternativas:
Estados de la Naturaleza
Alternativas Centro de Centro de Resultado
Inmueble comprado en: Congresos en X Congresos en Y esperado
X 91 - 84 3,5
Y - 56 77 10,5
XeY 35 -7 14
Ninguno 0 0 0
En este caso, cada estado de la naturaleza tendra probabilidad de ocurrencia igual a 1/2.
1 1 1 1
3, 5 = 91 84 14 = 35 7
2 2 2 2

El resultado esperado mximo se obtiene para la tercera alternativa, por lo que la decisin
ptima segn el criterio de Laplace sera comprar ambos inmuebles.
La objecin que se suele hacer al criterio de Laplace es la siguiente: ante una misma
realidad, pueden tenerse distintas probabilidades, segn los estados de la naturaleza que
se consideren. Por ejemplo, los estados de la naturaleza podran ser: Centro de Congresos
en X, Centro de Congresos en Y y Se pospone la localizacin del Centro de Congresos,
con lo que la probabilidad de cada estado de la naturaleza sera 1/3.

128
Desde un punto de vista prctico, la dificultad de aplicacin de este criterio reside en la
necesidad de elaboracin de una lista exhaustiva y mutuamente excluyente de todos los
posibles estados de la naturaleza.
Por otra parte, al ser un criterio basado en el concepto de valor esperado, su resultado es
correcto tras muchas repeticiones del proceso de toma de decisiones. Sin embargo, en aquellos
casos en que la eleccin slo va a realizarse una vez, puede conducir a decisiones poco
acertadas si la distribucin de resultados presenta una gran dispersin, como se muestra en la
siguiente tabla:
Estados de la Naturaleza
Alternativas e1 e2 Resultado esperado
a1 30 -10 10
a2 10 8 9
Este criterio seleccionara la alternativa a1, que puede ser poco conveniente si la toma de
decisiones se realiza una nica vez, ya que podra conducirnos a una prdida (-10).

8.5.2 Criterio de Wald (maximin).

Este es el criterio ms conservador, que est basado en lograr lo mejor en las peores
condiciones posibles. Si xij representa ganancias para el decisor, para ai la peor ganancia,
independientemente de lo que ej pueda ser, es min { xij } . Este resultado recibe el nombre de
ej

nivel de seguridad (al elegir ai se garantiza al menos un beneficio de min { xij } unidades).
ej

Wald sugiri que el decisor debe adoptar aquella alternativa que tenga el mayor nivel de
seguridad, es decir, elegir ai asociada a

max min { xij }


ai ej

Este criterio recibe el nombre de criterio maximin, y corresponde a un pensamiento


pesimista, pues se basa en lo peor que le puede ocurrir al decisor cuando elige una alternativa.

Ejemplo 8.3. Partiendo del ejemplo de construccin del Centro de Congresos, la siguiente
tabla muestra los resultados obtenidos junto con los niveles de seguridad de las diferentes
alternativas:
Estados de la Naturaleza
Alternativas Centro de Centro de min { xij }
ej
Inmueble comprado en: Congresos en X Congresos en Y
X 91 - 84 -84
Y - 56 77 -56
XeY 35 -7 -7
Ninguno 0 0 0

129
La alternativa ptima segn el criterio de Wald sera no comprar ningn inmueble, pues
proporciona el mayor de los niveles de seguridad.

En ocasiones, el criterio de Wald puede conducir a decisiones poco adecuadas. Por ejemplo,
consideremos la siguiente tabla de decisin, en la que se muestran los niveles de seguridad de
las diferentes alternativas.

Alternativas
Estados de la Naturaleza min { xij }
ej
e1 e2
a1 3000 199 199
a2 200 200 200
El criterio de Wald seleccionara la alternativa a2, aunque lo ms razonable parece ser elegir la
alternativa a1, ya que en el caso ms favorable proporciona una recompensa mucho mayor,
mientras que en el caso ms desfavorable la recompensa es similar.
Este criterio sera adecuado si la naturaleza fuese un contrincante que intentase hacernos
perder (Teora de Juegos), pero no es as: la naturaleza presenta un estado u otro
independientemente de los resultados.

8.5.3 Criterio de Hurwicz.

Este criterio representa un rango de actitudes desde la ms optimista hasta la ms pesimista.

En las condiciones ms optimistas se elegira la accin que proporcione el max max xi j


ai ej
{ }
(criterio maximax). Se supone que xij representa ganancia o beneficio. A max xi j
ej
{ } se le

denomina nivel optimista de la accin ai.

Igual de racional es adoptar el criterio pesimista (Wald) que el optimista. A la vista de que
muy poca gente es tan optimista o tan pesimista como estos criterios obligan a ser, Hurwicz
(1951) propuso un criterio intermedio: el decisor ordenar sus alternativas segn una media
ponderada de los niveles optimista y de seguridad por los pesos respectivos y (1- ), donde
01.

Si xij representa beneficio, se selecciona la accin que proporcione:

{ { } { }}
max max xi j + (1 ) min xi j
ai ej ej

El parmetro se conoce como ndice de optimismo: cuando =1, el criterio es el ms


optimista; cuando =0, es el ms pesimista. Un valor de entre cero y uno puede ser
seleccionado dependiendo de si el decisor tiende hacia el pesimismo o al optimismo. En

130
ausencia de una sensacin fuerte de una circunstancia u otra, un valor de =1/2 parece ser
una seleccin razonable1.

Ejemplo 8.4. Partiendo del ejemplo de construccin del Centro de Congresos, la siguiente
tabla muestra los resultados junto con la media ponderada de los niveles optimista y de
seguridad de las diferentes alternativas para un ndice de optimismo = 0,4:
Estados de la Naturaleza
Media
Alternativas Centro de Centro de min { xij } max { xij } ponderada
ej ej
Inmueble Congresos en Congresos en
(=0,4)
comprado en: X Y
X 91 - 84 -84 91 -14
Y - 56 77 -56 77 -2,8
XeY 35 -7 -7 35 9,8
Ninguno 0 0 0 0 0

14 = 0, 4 91 0, 6 84 9,8 = 0, 4 35 0, 6 7

La alternativa ptima segn el criterio de Hurwicz sera comprar los inmuebles X e Y, pues
proporciona la mayor de las medias ponderadas para el valor de seleccionado.

8.5.4 Criterio de Savage (minimax).


En 1951 Savage argumenta que al utilizar los valores xij para realizar la eleccin, el decisor
compara el resultado de una alternativa bajo un estado de la naturaleza con todos los dems
resultados, independientemente del estado de la naturaleza bajo el que ocurran. Sin embargo,
el resultado de una alternativa slo debera ser comparado con los resultados de las dems
alternativas bajo el mismo estado de la naturaleza. Una consecuencia puede ser muy pobre en
el contexto de la tabla completa y sin embargo ser la mejor que puede ocurrir bajo un
determinado estado.
Con este propsito Savage define el concepto de prdida relativa o prdida de oportunidad
pij asociada a un resultado xij como la diferencia entre el resultado de la mejor alternativa
dado que ej es el verdadero estado de la naturaleza y el resultado de la alternativa ai bajo ese
mismo estado ej:

1
Para determinar , se le ofrece al decisor el siguiente problema:
e1 e2
a1 1 0
a2 v v
Haciendo variar v hasta que ambas alternativas le sean indiferentes.
Para la primera alternativa el nivel de seguridad es cero y el nivel optimista es 1, entonces segn el ndice de
optimismo del decisor, su media ponderada es: 1 + (1 ) 0 = . Para la segunda alternativa su media
ponderada es v + (1 )v = v . Por lo que en caso de indiferencia se tendr =v.

131
pij = max { xkj } xij
ak

As, si el verdadero estado en que se presenta la naturaleza es ej y el decisor elige la


alternativa ak que proporciona el mximo resultado xkj, entonces no ha dejado de ganar nada,

pero si elige otra alternativa cualquiera ai , entonces obtendra como ganancia xij y dejara de

ganar xkj xij.


Savage opina que en lugar de trabajar con la tabla de beneficios, debe trabajarse con la tabla
de prdidas de oportunidad y en ella debe actuarse con una filosofa pesimista: propone
seleccionar la alternativa que proporcione la menor de las mayores prdidas relativas, es decir,
min max { pij }
ai ej

Conviene destacar que, como paso previo a la aplicacin de este criterio, se debe calcular la
matriz de prdidas relativas, formada por los elementos pij. Cada columna de esta matriz se
obtiene calculando la diferencia entre el valor mximo de esa columna y cada uno de los
valores que aparecen en ella.
Ejemplo 8.5. Partiendo del ejemplo de construccin del Centro de Congresos, la siguiente
tabla muestra la matriz de prdidas relativas:
Estados de la Naturaleza
Alternativas Centro de Centro de max { pij }
ej
Inmueble Congresos en Congresos en
comprado en: X Y
X 91-91=0 77-(-84)=161 161
Y 91-(-56)=147 77-77=0 147
XeY 91-35=56 77-(-7)=84 84
Ninguno 91-0=91 77-0=77 91
La decisin ptima segn el criterio de Savage sera comprar ambas parcelas.
El criterio de Savage puede dar lugar en ocasiones a decisiones poco razonables. Para
comprobarlo, consideremos la siguiente tabla de resultados:
Estados de la Naturaleza
Alternativas
e1 e2
a1 45 10
a2 20 30
La tabla de prdidas relativas correspondiente a esta tabla de resultados es la siguiente:

Alternativas
Estados de la Naturaleza max { pij }
ej
e1 e2
a1 0 20 20
a2 25 0 25
La alternativa ptima es a1. Supongamos ahora que se aade una alternativa, dando lugar a la
siguiente tabla de resultados:

132
Estados de la Naturaleza
Alternativas
e1 e2
a1 45 10
a2 20 30
a3 15 45
La nueva tabla de prdidas relativas sera:

Alternativas
Estados de la Naturaleza max { pij }
ej
e1 e2
a1 0 35 35
a2 25 15 25
a3 30 0 30
El criterio de Savage selecciona ahora como alternativa ptima a2, cuando antes seleccion a1.
Este cambio de alternativa resulta un poco paradjico: supongamos que a una persona se le da
a elegir entre carne o verduras, y prefiere carne. Si posteriormente se la da a elegir entre carne,
verduras o pescado, ahora prefiere verduras!

Ejemplo 8.6. En este ejemplo la matriz de decisin recoge gastos en lugar de beneficios por
lo que los anteriores criterios de decisin varan en su forma de aplicacin.
Una cafetera debe planificar su nivel de abastecimiento para satisfacer la demanda de sus
clientes en un da de fiesta. El nmero exacto de clientes no se conoce, pero se espera que est
en una de cuatro categoras: 300, 400, 600 y 650 clientes. Se plantean, por lo tanto, cuatro
niveles de abastecimiento. La desviacin respecto del nmero de clientes esperado resulta en
costes adicionales, ya sea por un abastecimiento excesivo sin necesidad o porque la demanda
no puede satisfacerse. La tabla que sigue recoge estos costes en cientos de euros:

e1(300) e2(400) e3(600) e4(650)

a1(300) 15 30 54 75
abastecimiento
Nivel de

a2(400) 24 21 24 69

a3(600) 63 54 36 63

a4(650) 90 66 57 45

Determine cul es el nivel de aprovisionamiento ptimo segn los diferentes criterios.

Solucin: Como los valores de la tabla representan costes, todos los criterios de decisin
estudiados anteriormente donde buscbamos la alternativa con mayor beneficio se
transforman en elegir la alternativa con menor coste. Otra manera sencilla de resolver los
problemas de decisin con costes es cambiar el signo a los resultados y actuar como en los
problemas de decisin con beneficios.
133
Criterio de Laplace:

El principio de Laplace establece que e1, e2, e3, e4 tienen la misma probabilidad de suceder.
Por consiguiente las probabilidades asociadas son P(ei)=1/4 y los costes esperados para las
distintas alternativas son:

E(a1)=(15+30+54+75)/4=43,5

E(a2)=(24+21+24+69)/4=34,5

E(a3)=(63+54+36+63)/4=54

E(a4)=(90+66+57+45)/4=64,5

Valor
e1(300) e2(400) e3(600) e4(650)
esperado

a1(300) 15 30 54 75 43,5
abastecimiento
Nivel de

a2(400) 24 21 24 69 34,5

a3(600) 63 54 36 63 54

a4(650) 90 66 57 45 64,5

Por lo tanto, el mejor nivel de abastecimiento es el asociado al menor coste esperado (34,5)
especificado por a2.

Criterio de Wald:

e1(300) e2(400) e3(600) e4(650) max { xij }


ej

a1(300) 15 30 54 75 75
abastecimiento

a2(400) 24 21 24 69 69
Nivel de

a3(600) 63 54 36 63 63

a4(650) 90 66 57 45 90

Este criterio pesimista basado en suponer que se dan las peores condiciones posibles,
supondr que para cada alternativa nos enfrentamos al mayor coste posible (nivel de

seguridad), max { xij } , y elegir aquella alternativa (a3 ) para la que este valor es el menor de
ej

todos, min max { xij } =63 .


ai ej

134
Criterio de Hurwicz:

Supongamos =1/2, valor que suele tomarse cuando no se especifica un determinado ndice
de optimismo.

Nivel de Nivel
seguridad: optimista: Media
e1(300) e2(400) e3(600) e4(650)
max { xij } min { xij }
ponderada
ej ej

a1(300) 15 30 54 75 75 15 45
abastecimiento

a2(400) 24 21 24 69 69 21 45
Nivel de

a3(600) 63 54 36 63 63 36 49,5

a4(650) 90 66 57 45 90 45 67,5

Al tratarse de costes, elegiremos la alternativa asociada a la menor media ponderada. La


solucin ptima est dada por a1 a2.

Si el ndice de optimismo es =0,7, se multiplicara por este valor el nivel optimista de cada
alternativa y por 0,3=1- su nivel de seguridad, resultando:

Nivel de Nivel
seguridad: optimista: Media
e1(300) e2(400) e3(600) e4(650)
max { xij } min { xij }
ponderada
ej ej

a1(300) 15 30 54 75 75 15 33
abastecimiento

a2(400) 24 21 24 69 69 21 35,4
Nivel de

a3(600) 63 54 36 63 63 36 44,1

a4(650) 90 66 57 45 90 45 58,5

En este caso la solucin ptima es a1.

Criterio de Savage:

La matriz de prdidas de oportunidad, al tratarse de costes, se calculara como:

pij = xij min { xkj }


ak

135
e1(300) e2(400) e3(600) e4(650) max { pij }
ej

a1(300) 0=15-15 9=30-21 30=54-24 30=75-45 30

abastecimiento a2(400) 9=24-15 0=21-21 0=24-24 24=69-45 24


Nivel de

a3(600) 48=63-15 33=54-21 12=36-24 18=63-45 48

a4(650) 75=90-15 45=66-21 33=57-24 0=45-45 75

La solucin ptima est dada por a2.

136
9. El problema de la decisin en ambiente de riesgo.
9.1 El criterio del valor monetario esperado.
9.1.1 Inconvenientes del criterio del valor monetario esperado.
9.2 El criterio de la prdida de oportunidad esperada.
9.3 Valor monetario esperado con informacin perfecta.
9.3.1 El valor de la informacin perfecta.

9.1 El criterio del valor monetario esperado (VME).


Cada estado de la naturaleza puede considerarse un suceso. Como ya se dijo, los estados de la
naturaleza son sucesos mutuamente excluyentes, es imposible que se presenten dos estados
simultneamente, y adems constituyen una enumeracin exhaustiva de todos los factores
externos que pueden presentarse. Cuando un conjunto de sucesos cumplen con las anteriores
propiedades, se dice que son una particin de un espacio muestral y sobre ellos se puede
definir una probabilidad.
En el ambiente de riesgo cada alternativa lleva asociado un conjunto de consecuencias que
dependern del estado de la naturaleza y por tanto cada una de ellas tendr asociada una
probabilidad conocida.
Ejemplo 9.1. Suponga que tiene un negocio de ventas de pinos para Navidad y debe decidir
cuntos pinos pedir para la prxima Navidad. Se debe pagar 5 por cada rbol, se pueden
pedir solo lotes de 100 y se planea venderlos a 9 cada uno. Si no se venden, no tienen valor
de recuperacin. Se revisan las ventas pasadas, llegando a las siguientes estimaciones para la
prxima Navidad:
Venta de pinos (ej) Probabilidad
200 0,4
300 0,4
400 0,2
Con estos datos pueden calcularse los beneficios para cada combinacin de cantidad pedida y
vendida. Por ejemplo, si se ordenan 300 pinos y se venden slo 200, el beneficio ser de 4
por cada rbol vendido menos una prdida de 5 por cada rbol no vendido, es decir:
200x(9-5)-100x5=800-500=300
Haciendo esto para cada posibilidad, se obtienen los resultados mostrados en la tabla de
decisin o matriz de pagos siguiente:

137
Probabilidad p(ej) 0,4 0,4 0,2
Demanda de rboles
e1(200) e2(300) e3(400)

a1(200) 800 800 800

abastecimiento
Nivel de
a2(300) 300 1200 1200

a3(400) -200 700 1600


El problema de decisin lo tenemos tabulado, y las diversas consecuencias valoradas
numricamente. Al desarrollarse en ambiente de riesgo, el decisor no conoce cul es el
verdadero estado de la naturaleza, pero si conoce la probabilidad de que lo sea cada uno de
los estados considerados, es decir, conoce p(e1) p(e2) ........p(en). Al ser los estados

p ( e ) = 1 . En general,
n
considerados exhaustivos y excluyentes ha de verificarse que j la
j =1

tabla de decisin en ambiente de riesgo adopta la siguiente forma:

Probabilidad p(ej) p(e1) p(e2) ... p(en)


Estados de la naturaleza
e1 e2 ... en

a1 x11 x12 ... x1n


Alternativas

a2 x21 x22 ... x2n

... ... ... ... ...

am xm1 xm2 ... xmn

Como puede observarse la tabla de decisin es anloga a la de decisin en ambiente de


incertidumbre, con la informacin aadida sobre las probabilidades de que se presente cada
estado de la naturaleza.
En esta situacin es evidente que adoptada la decisin ai, el decisor puede obtener cualquiera
de las recompensas que figuran en la i-sima fila dependiendo de cul sea el verdadero estado
de la naturaleza: el decisor obtendr la recompensa xi1 con probabilidad p(e1), la recompensa

xi2 con probabilidad p(e2) y as sucesivamente.


Cuando tenemos un conjunto de cantidades numricas, cada una de ellas con una probabilidad
asociada, tomamos como representante de ese conjunto al valor medio o valor esperado. A
cada alternativa le asociamos la esperanza matemtica de los diversos valores monetarios a los
que conduce (Valor Monetario Esperado):

138
VME ( ai ) = xi1 p ( e1 ) + xi 2 p ( e2 ) + + xin p ( en )

Segn este criterio de decisin, la alternativa ptima ser aquella que conduzca al mximo
valor monetario esperado.

Ejemplo 9.2. Resolvamos mediante este criterio el ejemplo de los rboles de Navidad

Probabilidad p(ej) 0,4 0,4 0,2


Demanda de rboles
e1(200) e2(300) e3(400) VME ( ai )

a1(200) 800 800 800 800


abastecimiento
Nivel de

a2(300) 300 1200 1200 840

a3(400) -200 700 1600 520

VME ( a1 ) = 0, 4 800 + 0, 4 800 + 0, 2 800 = 800


VME ( a2 ) = 0, 4 300 + 0, 4 1200 + 0, 2 1200 = 840
VME ( a3 ) = 0, 4 (200) + 0, 4 700 + 0, 2 1600 = 520

La alternativa ptima es la segunda: pedir 300 pinos.

9.1.1 Inconvenientes del criterio del valor monetario esperado.


Analicemos la situacin sobre nuestro ejemplo. El dueo del negocio de rboles de Navidad
adoptaba la decisin de pedir 300 rboles por ser la de mayor VME (840), pero al tomar esa
decisin pueden obtenerse bien 300 o bien 1200, segn cul sea el estado de la naturaleza,
pero nunca 840. El VME no representa el beneficio de una nica decisin, es un promedio.
Si adoptase esa decisin varias veces, cada una con una demanda posiblemente distinta, el
vendedor de rboles obtendra un promedio de 840 por cada vez. Desde esta perspectiva de
decisiones repetitivas el criterio del VME es adecuado.
Pero si las decisiones no se toman de forma repetitiva, sigue siendo vlido el criterio de
VME? Eso lo responder el decisor, para lo cual habr de contemplar otros aspectos de la
distribucin de probabilidad adems de su media, como es la dispersin.

9.2 El criterio de la prdida de oportunidad esperada (POE).


Cuando el problema de decisin se desarrolla en ambiente de riesgo o en ambiente de
incertidumbre, en lugar de decidir en base a una matriz de recompensas o beneficios puede
hacerse con una matriz de prdidas de oportunidad, como se vio en el tema anterior.

139
La prdida de oportunidad es lo que podra haberse ganado de ms si se hubiera conocido el
estado de la naturaleza. Fijado un estado de la naturaleza, la prdida de oportunidad de cada
accin es el beneficio que ha dejado de obtenerse por no ser esa accin la mejor frente al
estado fijado. Por tanto, como ya definimos en el tema anterior, el concepto de prdida
relativa o prdida de oportunidad pij asociada a un resultado xij se define como la
diferencia entre el resultado de la mejor alternativa dado que ej es el verdadero estado de la
naturaleza y el resultado de la alternativa ai bajo ese mismo estado ej:
pij = max { xkj } xij
ak

As, si el verdadero estado en que se presenta la naturaleza es ej y el decisor elige la


alternativa ak que proporciona el mximo resultado xkj, entonces no ha dejado de ganar nada,

pero si elige otra alternativa cualquiera ai , entonces obtendra como ganancia xij y dejara de

ganar xkj xij.


Ejemplo 9.3. En el ejemplo de los pinos de Navidad, su matriz de prdidas de oportunidad
sera:

Probabilidad p(ej) 0,4 0,4 0,2


Demanda de rboles
e1(200) e2(300) e3(400)

a1(200) 800-800=0 1200-800=400 1600-800=800


abastecimiento
Nivel de

a2(300) 800-300=500 1200-1200=0 1600-1200=400

a3(400) 800-(-200)=1000 1200-700=500 1600-1600=0

Salvo por la interpretacin de las cantidades contenidas en la tabla, antes eran beneficios y
ahora son prdidas de oportunidad, la situacin es la misma: a cada alternativa le
corresponden varias cantidades, cada una con una probabilidad asociada. De nuevo, como
representante de todas ellas consideramos su media, que ahora representa la prdida de
oportunidad esperada. La alternativa ptima ser la que conduzca a la menor prdida de
oportunidad esperada.

140
Probabilidad p(ej) 0,4 0,4 0,2
Demanda de rboles
e1(200) e2(300) e3(400) POE ( ai )

a1(200) 0 400 800


abastecimiento
320
Nivel de

a2(300) 500 0 400 280

a3(400) 1000 500 0 600

POE ( a1 ) = 0, 4 0 + 0, 4 400 + 0, 2 800 = 320


POE ( a2 ) = 0, 4 500 + 0, 4 0 + 0, 2 400 = 280
POE ( a3 ) = 0, 4 1000 + 0, 4 500 + 0, 2 0 = 600

La accin ptima segn este criterio es a2: pedir 300 pinos.


Obsrvese que la decisin ptima por el criterio de VME y la decisin ptima por el criterio
de POE coinciden. Esta coincidencia se dar siempre: maximizar el VME es equivalente a
minimizar la POE.

9.3 Valor monetario esperado con informacin perfecta (VMEIP).


Como hemos visto, el decisor incurre en prdidas de oportunidad por tener que adoptar una
alternativa desconociendo el verdadero estado de la naturaleza. Si pudiese disponer de esa
informacin qu beneficios adicionales le proporcionara?, o lo que es lo mismo, cunto
estara dispuesto a pagar por ella?
Concretando sobre el problema de los rboles de navidad: si el decisor supiese que el
verdadero estado es e1 (200 rboles) elegira a1 (200 rboles) y obtendra una beneficio de
800; si el verdadero estado fuese e2 (300 rboles) elegira a2 (300 rboles) y obtendra 1200
y si fuese e3 (400 rboles) adoptara a3 (400 rboles) y ganara 1600. A priori, a la hora de
pagar por la informacin, no se sabe cul es el verdadero estado de la naturaleza, pero si
conoce la probabilidad que cada uno tiene de serlo, por tanto el decisor puede calcular el valor
monetario esperado disponiendo de informacin perfecta (ser la media ponderada de los
mximos de las columnas):
VMEIP = 0, 4 800 + 0, 4 1200 + 0, 2 1600 = 1120

9.3.1 El valor de la informacin perfecta (VIP).


No disponiendo de informacin perfecta el mximo valor monetario esperado que puede
lograr el decisor es 840 como se vio en el ejemplo 9.2.
Por tanto, el beneficio adicional que proporciona la informacin perfecta es:

141
VIP=VMEIP VME(mximo) = 1120 840 = 280
Evidentemente:
a) Esta sera la mxima cantidad que un decisor racional pagara por disponer de informacin
perfecta.
b) Cualquier otra informacin no perfecta valdr menos (como veremos en el prximo tema).

El valor esperado de la informacin perfecta tambin podra haberse calculado desde la


ptica de la prdida de oportunidad. En efecto, con informacin perfecta nunca se incurre en
prdidas de oportunidad, por lo que la POE es nula.
Sin informacin perfecta la mnima POE en nuestro ejemplo de los pinos es 280 (ejemplo
9.3), por tanto:
VIP=POE(mnima) POEIP =280 0 =280

Ejemplo 9.4. El Sr. Ramrez ha heredado 100000 y ha decidido invertir su dinero. Un asesor
de inversiones le ha sugerido cinco inversiones posibles: oro, bonos, negocio en desarrollo,
depsitos y acciones. El heredero debe decidir en qu opcin invertir. La siguiente tabla
representa los beneficios que obtendra para cada posible comportamiento del mercado.
Calcule el valor mximo que debera pagar por un estudio donde le aseguren la ocurrencia de
un determinado estado de la naturaleza.
Probabilidad 0,25 0,25 0,2 0,2 0,1
Estados de la naturaleza
(comportamiento del mercado)
Gran Pequea Sin Pequea Gran
VME(ai)
alza alza cambios baja baja
Oro -2000 2000 4000 6000 0 2000
Alternativas

Bonos 5000 4000 3000 -2000 -3000 2150


Negocio 10000 5000 2000 -4000 -12000 2150
Depsitos 1200 1200 1200 1200 1200 1200
Acciones 4000 3000 3000 -4000 -3000 1250
Primero se calcula el Valor Monetario Esperado para cada alternativa de decisin:
VME (Oro) = 2000 0, 25 + 2000 0, 25 + 4000 0, 2 + 6000 0, 2 + 0 0,1 = 2000
VME ( Bonos ) = 5000 0, 25 + 4000 0, 25 + 3000 0, 2 2000 0, 2 3000 0,1 = 2150
...
El Valor Monetario Esperado Mximo es 2150.
Para calcular el Valor Monetario Esperado disponiendo de informacin perfecta, se eligen los
mximos de cada columna y se calcula su media ponderada:
VMEIP = 10000 0, 25 + 5000 0, 25 + 4000 0, 2 + 6000 0, 2 + 1200 0,1 = 5870
Por tanto el beneficio adicional que proporciona la informacin perfecta es

142
VIP = VMEIP VME maximo = 5870 2150 = 3720
Si puede obtener informacin que le asegure la ocurrencia de un determinado estado de la
naturaleza, podra pagar por ella hasta un mximo de 3720.

143
10. Decisin bayesiana.
10.1 Probabilidad condicionada. Probabilidad total. Teorema de Bayes.
10.2 Interpretaciones del concepto de probabilidad.
10.3 Modificacin de las creencias del decisor.
10.4 Valor monetario esperado con informacin imperfecta. Valor de la informacin
imperfecta.

10.1 Probabilidad condicionada. Probabilidad total. Teorema de Bayes.


Sean A y B dos sucesos y se sabe seguro que ha ocurrido A, cmo afecta esto a la
probabilidad de B?

Notamos por P B ( A) a la probabilidad de B condicionada a A, es decir a la probabilidad de B


una vez que sabemos seguro que ha ocurrido A.
Se define la probabilidad de B condicionada a A como:

( A) = P (PA( A)B )
P B , siendo P ( A) > 0 .

Obsrvese que a partir de esta definicin: P ( A B ) = P ( A) P B ( A)


Puede ocurrir que la probabilidad de B no se vea alterada por la ocurrencia de A, es decir, que

( A) = P ( B ) . En este caso se dice que los sucesos A y B son independientes, y se tiene


P B

que: P ( A B ) = P ( A ) P ( B )

Teorema de la Probabilidad Total.


n

Sea A1, A2, ... An una particin del espacio muestral Ai Aj = , Ai = , entonces para
i =1
cualquier suceso B se tiene que:

P (B) = P B ( A ) P ( A ) + P ( B A ) P ( A ) + ... + P B A P ( A ) = P B A P ( A )
1
1
2
2
n
n
n

i =1 i
i

Teorema de Bayes
Sea A1, A2, ... An una particin del espacio muestral y sea B un suceso cualquiera con
probabilidad estrictamente mayor que cero. Entonces:

P B P ( Ak ) P B P ( Ak )
Ak Ak
P k = n =
A
B
P B A P ( Ai )
P( B)
i =1 i

144
En nuestro caso, la particin estar constituida por el conjunto de estados de la naturaleza,
e1 , e2 ,..., en y B representar la informacin que tenemos acerca de ellos.

10.2 Interpretaciones del concepto de probabilidad.


Sobre el significado que tiene la probabilidad de un suceso hay una fuerte controversia.
El primer concepto de probabilidad surge en el contexto de los juegos de azar, donde se
considera que todos los resultados posibles son equiprobables. Laplace defini la
probabilidad de un suceso como el cociente entre el nmero de resultados favorables a dicho
suceso, y el nmero total de resultados posibles.
Este concepto clsico de la probabilidad es escasamente aplicable, pues en la mayora de las
circunstancias inciertas es imposible clasificar los posibles resultados en clases igualmente
probables. Es fcil aplicarlo al lanzamiento de un dado, pero ya no lo es tanto para determinar
la probabilidad de que maana suba el ndice de la bolsa. Incluso no es aplicable cuando el
dado est trucado.
Otra interpretacin es la frecuentista segn la cual la probabilidad slo tiene sentido en el
marco de un experimento infinitamente repetible. La probabilidad de un suceso ser la
frecuencia relativa de ocurrencia del suceso en infinidad de pruebas repetidas de ese
experimento.
Segn esta interpretacin, obsrvese que la probabilidad slo podr definirse sobre sucesos
que estn ligados a los resultados de un experimento repetible. Por ejemplo podr aplicarse al
lanzamiento de un dado sin necesidad de suponer, de antemano, que el dado no est cargado,
puesto que ese dado puede lanzarse indefinidamente, pero no puede aplicarse a sucesos tales
como el resultado de las prximas elecciones generales, pues stas se desarrollarn en unas
circunstancias irrepetibles.
La tercera interpretacin es la subjetiva, segn la cual la probabilidad representa el grado de
creencia del observador sobre el estado que adoptar el sistema. Segn esta interpretacin, en
la Teora de la Decisin, la probabilidad de un estado de la naturaleza representa el grado de
creencia del decisor en que acontezca ese estado. Cuanto mayor sea su creencia mayor ser la
probabilidad. Obsrvese que admitiendo esta interpretacin:
1.- Puede definirse la probabilidad de prcticamente cualquier suceso, sin necesidad de que se
produzca en el seno de un experimento repetible, ahora s que puede asignarse una
probabilidad a los resultados de las prximas elecciones generales pues el observador
dispondr de unas creencias sobre los mismos (creencias que estarn basadas en unas
informaciones).

145
2.- Como cada uno tiene sus propias creencias, dos observadores distintos pueden asignar
probabilidades distintas al mismo suceso. Por tanto la probabilidad es subjetiva (no
objetiva), es ms propia del sujeto que observa que del suceso (objeto) observado.
De inmediato surge una cuestin: imaginemos un suceso que se produce en el seno de un
experimento repetible, y al que por tanto se le puede asignar una probabilidad frecuentista
(objetiva) e imaginemos un observador racional qu relacin existe entre esas dos
probabilidades? Inicialmente el decisor podra asignarle una probabilidad que nada tuviera que
ver con la frecuencia relativa, pero a medida que va observando los resultados de las sucesivas
repeticiones, el observador va revisando sus creencias, y su probabilidad subjetiva se ir
aproximando a la objetiva del suceso.

10.3 Modificacin de las creencias del decisor.


Las creencias del decisor no son inmutables, sino que cambian constantemente segn su
poseedor asimila nuevos hechos y acumula evidencia. Cmo debe revisar sus creencias un
decisor racional a la luz de una nueva informacin?
La informacin extra, aquella de la que no dispona y ahora se incorpora, se expresa mediante
la ocurrencia de un suceso B. Antes el decisor tena unas creencias y despus de disponer de
esta informacin tendr otras, nuestro objetivo consiste en obtener estas nuevas creencias
(probabilidades) a partir de aquellas.
La probabilidad condicionada representa perfectamente las nuevas creencias del decisor y se
puede utilizar para revisar las probabilidades o creencias iniciales. Suele decirse que P ( ei ) es

la probabilidad a priori (antes de saber que B ha ocurrido) y P i es la probabilidad a


e
B
posteriori (despus de saber que ha ocurrido B).
El teorema de Bayes proporciona la herramienta para obtener las probabilidades a posteriori:
Suponga que el decisor est considerando una tabla de decisin en la que aparecen los estados
e1, e2,...,en. Sus creencias a priori estn reflejadas en las probabilidades P(e1), P(e2),...,P(en), y
si tuviese que tomar una decisin, con ellas calculara los valores monetarios esperados que le
indicaran la accin a tomar.
Pero si antes de tomar la decisin ha ocurrido un suceso B (se tiene nueva informacin
adicional), entonces el decisor deber construir sus probabilidades a posteriori P(e1/B),....,
P(en/B) para calcular con ellas los valores monetarios esperados. Estas probabilidades a
posteriori vendrn dadas por el teorema de Bayes, segn:

146
P ( B ei ) P(ei )
P i = n
e
i = 1,..., n
B P ( B e ) P (e )
j j
j =1

Obsrvese que para aplicar este teorema hace falta calcular (o conocer) previamente, las
probabilidades P(B/ei) , i= 1, 2, , n, es decir la probabilidad de ocurrencia del suceso B,
bajo cada uno de los estados posibles de la naturaleza. A estas probabilidades se les llama
verosimilitudes. Normalmente son conocidas o fciles de obtener.
He aqu la importancia del teorema de Bayes: describe cmo debemos ir aprendiendo de la
experiencia, cmo deben modificarse nuestras creencias, expresadas mediante
probabilidades, al incorporar nueva informacin.

10.4 Valor monetario esperado con informacin imperfecta. Valor de la informacin


imperfecta.
La informacin adicional que se incorpora no siempre es perfecta, muchas veces los estudios
adicionales que se encargan tienen cierto margen de error. La informacin adicional
(imperfecta) mejora el conocimiento sobre la probabilidad de ocurrencia de los estados de la
naturaleza (sin llegar a asegurarnos qu estado va a ocurrir), y ese mejor conocimiento ayuda
a tomar mejores decisiones.

Ejemplo 10.1. Una comunidad de vecinos desea incorporar una red local de internet en su
edificio. Recibe los presupuestos de dos empresas instaladoras: el de la empresa A por 10000
y el de la empresa B por 7500. No obstante, la existencia de antenas colectivas en la
inmediaciones puede provocar interferencias, en el caso de que se produzcan sera necesario
aadir un nuevo aparato que generara unos costes adicionales de 4000 de los cuales la
empresa A slo incluira el 20% de los mismos en el presupuesto, mientras que la empresa B
los incluira en su totalidad.
Despus de tratar de recabar informacin sobre las posibilidades de que haya interferencias, el
presidente de la comunidad no logra obtenerla, por lo que considera que ambas situaciones
son equiprobables. Cul es la mejor alternativa para la comunidad de vecinos?
La tabla de decisin (gastos) con los Valores Monetarios Esperados (VME) es:

147
Probabilidades 0,5 0,5

Estados Sin interferencias Con interferencias VME

Alternativas

Empresa A 10000 10800 10400

Empresa B 7500 11500 9500


10400 = (10000 0,5) + (10800 0,5 ) 9500 = ( 7500 0,5 ) + (11500 0,5)

La empresa escogida sera la B y el gasto medio asociado sera de 9500 euros.


Supongamos ahora que el presidente de la comunidad puede contratar un experto, quien por
100 euros realizara unas mediciones. La probabilidad de que el experto acierte cuando no hay
interferencias es de 0,9 y de que no acierte cuando hay interferencias es de 0,2 (obsrvese que
la informacin que se pagara no es perfecta en cuanto a total seguridad en las afirmaciones
del experto).
Cul sera entonces la decisin a adoptar por la comunidad de vecinos?
La primera decisin que debe tomar el presidente es si contratar o no un experto. Ya sabemos
que sin experto la decisin sera contratar a la empresa B con un gasto medio asociado de
9500 euros. Por tanto, debemos comprobar si la contratacin de un experto conlleva ms
gastos o no.
Las probabilidades de acierto y fallo del experto son, segn los estados de la naturaleza

Estados Sin interferencias Con interferencias

Informe del experto

No hay interferencias 0,9 0,2

Si hay interferencias 0,1 0,8


Con esta informacin podemos actualizar y modificar las probabilidades de los estados de la
naturaleza (sin interferencias, con interferencias).

Notaremos: e1 = Sin interferencias y e2 = Con interferencias


c1 = Informa: no hay interferencias y c2 = Informa: s hay interferencias
La anterior tabla recoge las siguientes probabilidades condicionadas (verosimilitudes):

148
Verosimilitudes
Estados e1 e2
Sin interferencias Con interferencias
Informe del experto

( e ) = 0, 9 ( e ) = 0, 2
c1
No hay interferencias P c1 P c1
1 2

(c e ) = 0,1 (c e ) = 0,8
c2
Si hay interferencias P 2 P 2
1 2

A partir de las verosimilitudes y de las probabilidades a priori, P ( e1 ) = 0,5 y P ( e2 ) = 0,5 ,

con la ayuda del teorema de Bayes obtenemos las probabilidades a posteriori:

P (e c ) = PP((cc ee) P) P(e(e) ) = (0,9 0,50,9) + 0,5


1
1
2
1

1
1

j
1

( 0, 2 0,5)
j
= 0,81818
j =1

P ( c)
e2
1
=
P ( c1 e2 ) P(e2 )
P ( c1 e j ) P(e j )
2
=
0, 2 0,5
( 0,9 0,5) + ( 0, 2 0,5)
= 0,18182
j =1

P (e c ) = PP((cc ee) P) P(e(e) ) = (0,1 0,50,1) + 0,5


1
2
2
2

2
1

j
1

( 0,8 0,5)
j
= 0,11111
j =1

P (e c ) = PP(c(c ee) P) P(e(e) ) = (0,1 0,50,8) + (0,50,8 0,5) = 0,88889


2
2
2
2

2
2

j
2

j
j =1

Una forma cmoda de ordenar los anteriores clculos mediante una tabla es:
Informe del experto: No hay interferencias ( c1 )

P ( c1 ei ) P ( c1 ei ) P(ei ) P i
e
ei P(ei )
c1
e1 : Sin interferencias 0,5 0,9 0,45 0,81818
e2 : Con interferencias 0,5 0,2 0,10 0,18182
SUMA 1 0,55 1

Informe del experto: S hay interferencias ( c2 )

P ( c2 ei ) P ( c2 ei ) P(ei ) P i
e
ei P (ei )
c2
e1 : Sin interferencias 0,5 0,1 0,05 0,11111
e2 : Con interferencias 0,5 0,8 0,40 0,88889
SUMA 1 0,45 1

149
Las anteriores probabilidades a posteriori se recogen en la siguiente tabla:
Probabilidades a posteriori
Estados e1 e2
Sin interferencias Con interferencias
Informe del experto

(e c ) = 0,81818 P (e c ) = 0,18182
c1
No hay interferencias P 1 2
1 1

P(
c )
= 0,11111 P (
c )
c2 e e
Si hay interferencias
1 2= 0,88889
2 2

Con estas probabilidades se actualizan las probabilidades sobre los estados de la naturaleza y
tabla de decisin:

Informe del experto: No hay interferencias ( c1 )

Probabilidades 0,81818 0,18182

Estados Sin interferencias Con interferencias VME

Alternativas

Empresa A 10000 10800 10145,456

Empresa B 7500 11500 8227,28


10145, 456 = (10000 0,81818) + (10800 0,18182 )

8227, 28 = ( 7500 0,81818 ) + (11500 0,18182 )

Si el informe del experto es que no hay interferencias, la empresa escogida sera la B y el


gasto medio asociado sera de 8227,28 euros.

Informe del experto: Si hay interferencias ( c2 )

Probabilidades 0,11111 0,88889

Estados Sin interferencias Con interferencias VME

Alternativas

Empresa A 10000 10800 10711,11

Empresa B 7500 11500 11055,56


10711,112 = (10000 0,11111) + (10800 0,88889 )

11055,56 = ( 7500 0,11111) + (11500 0,88889 )

150
Si el informe del experto es que s hay interferencias, la empresa escogida sera la A y el gasto
medio asociado sera de 10711,11 euros.
El gasto esperado con la informacin adicional del experto depende de cul sea esta.
El experto dir que no hay interferencias ( c1 ) con una probabilidad:

P ( c1 ) = P ( c1 e j ) P(e j ) = ( 0, 9 0,5 ) + ( 0, 2 0, 5 ) = 0, 55
2

j =1

El experto dir que si hay interferencias ( c2 ) con una probabilidad:

P ( c2 ) = P ( c2 e j ) P(e j ) = ( 0,1 0, 5 ) + ( 0,8 0,5 ) = 0, 45


2

j =1

Evidentemente, P ( c j ) = 1 .
2

j =1

El gasto esperado medio con la informacin adicional del experto es (en general llamado:
valor monetario esperado con informacin imperfecta):

(8227,28 P ( c ) ) + (10711,11 P ( c ) ) = (8227,28 0,55) + (10711,11 0, 45) = 9345


1 2

Y sin ella es 9500, luego estaramos dispuestos a pagar:


9500-9345=155 euros
Cantidad que denominamos valor de la informacin imperfecta, VII.
Por tanto se decidira contratar al experto, pues su informacin que nos costara 100 euros
conducira a un ahorro mayor, de 155 euros.
Cuando, en lugar de costes, trabajemos con beneficios en la tabla de decisin, el valor de la
informacin imperfecta se calcular restando al valor monetario esperado con informacin
imperfecta (que ser mayor) el valor monetario esperado sin dicha informacin (que ser
menor).

151
RELACIN DE EJERCICIOS

1. Muestreo Aleatorio Simple

1. Un dentista est interesado en la efectividad de una nueva pasta dental. Un grupo de 1.000
nios de escuela particip en el estudio. Los registros de un estudio anterior mostraron que
haba un promedio de 2,2 caries cada seis meses para el grupo. Despus de un ao de
iniciado el estudio, el dentista muestre 10 nios para determinar cunto haban
progresado con la nueva pasta dental. Usando los datos de la siguiente tabla:
Nmero de caries
Nio
en seis meses
1 0
2 4
3 2
4 3
5 2
6 0
7 3
8 4
9 1
10 1
Se puede decir que la incidencia media de las caries ha disminuido?
Solucin: 2,2 (1,06, 2,94) No
2. Un psiclogo desea estimar el tiempo de reaccin medio para un estmulo en 200
pacientes de un hospital especializado en trastornos nerviosos. Una muestra aleatoria
simple de 20 pacientes fue seleccionada, y fueron medidos sus tiempos de reaccin, con
los resultados siguientes: y = 2,1 segundos y S = 0,4 segundos. Estime la media poblacional
y establezca un lmite para el error de estimacin.
Solucin: = 2,1; B = 0,1697
3. En un estudio sociolgico, realizado en una pequea ciudad, se hicieron llamadas
telefnicas para estimar la proporcin de hogares donde habita por lo menos una persona
mayor de 65 aos de edad. La ciudad tiene 621 hogares, segn la gua de telfonos ms
reciente. Una muestra aleatoria simple de 60 hogares fue seleccionada de la gua. Al
terminar la investigacin de campo, de los 60 hogares muestreados, en 11 habita al menos
una persona mayor de 65 aos. Estime la proporcin poblacional y establezca un lmite
para el error de estimacin.
Solucin: p = 0,1833; B = 0,0958

152
4. Un investigador est interesado en estimar el nmero total de rboles mayores de un cierto
tamao especfico en una plantacin de 1.500 acres. Esta informacin se utiliza para
estimar el volumen total de madera en la plantacin. Una muestra aleatoria simple de 100
parcelas de 1 acre fue seleccionada, y cada parcela fue examinada en relacin con el
nmero de rboles de tamao grande. La media muestral para las 100 parcelas de 1 acre fue
y = 25,2 rboles, con una cuasivarianza muestral de S 2 = 136 . Estime el nmero total de
rboles de tamao grande en la plantacin. Establezca un lmite para el error de estimacin.
Solucin: = 37.800; B = 3.379,9408
5. Usando los datos del ejercicio anterior, determine el tamao de muestra requerido para
estimar el nmero total de rboles grandes en la plantacin, con un lmite para el error de
estimacin de 1.500 rboles.
Solucin: n = 399,413 400
6. Una muestra aleatoria de 30 familias fue extrada de una zona de cierta ciudad que contiene
14.848 familias. El nmero de personas por familia en la muestra obtenida fue el siguiente:
5 6 3 3 2 3 3 3 4 4 3 2 7 4 3
5 4 4 3 3 4 3 3 1 2 4 3 4 2 4
Estimar el nmero total de personas en la zona, construyendo un intervalo de confianza al
95%.
Solucin: (44.842,09, 58.104,04 )

2. Muestreo Aleatorio Estratificado

1. Una gran empresa sabe que el 40% de las facturas que emite son al por mayor y el 60% al
por menor. Sin embargo, identificar las facturas individuales sin consultar un archivo es
complicado. Un auditor desea muestrear 100 de sus facturas para estimar el valor medio
de las facturas de la empresa (Nota para estimar el total necesitaramos conocer N). Una
muestra aleatoria simple present 70 facturas al por mayor y 30 al por menor. Los datos
son separados en facturas al por mayor y al por menor despus del muestreo, con los
siguientes resultados en :
Por mayor Por menor
Valor total facturas=36400 Valor total facturas=8400
n1 = 70 y1 = 520 S1 = 210 n2 = 30 y 2 = 280 S2 = 90

153
Estime el valor medio de las facturas de la empresa, y fije un lmite para el error de
estimacin.
Solucin: yst = 376; B = 28,14
2. De las 1.395 universidades de Estados Unidos, 364 imparten estudios universitarios de
dos aos y 1.031 estudios universitarios de cuatro aos. Se recogieron de manera
independiente, una muestra aleatoria simple de 40 universidades con estudios de dos aos
y otra de 60 con estudios de 4 aos. Las medias muestrales y las desviaciones tpicas del
nmero de estudiantes matriculados el pasado ao en asignaturas de estadstica aparecen a
continuacin.
Carreras de 2 aos Carreras de 4 aos
Media 154,3 411,8
Desviacin tpica 87,3 219,9
a) Estimar el nmero total de estudiantes matriculados en asignaturas de estadsticas. Dar
un lmite de error de estimacin.
b) En el estudio del ejercicio anterior, se investig tambin en qu proporcin de las
universidades la asignatura de estadstica para economistas era impartida por
miembros del departamento de economa. En la muestra se hall que en 7 de las
universidades con carreras de dos aos y en 13 de las que tienen carreras de cuatro
aos suceda esto. Estimar la proporcin de universidades en las que esta asignatura es
impartida por profesores del departamento de economa. Dar un lmite de error de
estimacin.
Solucin: (a) st = 480.731; B = 57.594,84 (b) p st = 0,2058; B = 0,0826
3. Una universidad tiene 152 profesores ayudantes, 127 profesores asociados y 208
profesores titulares. Una reportera del peridico de los estudiantes quiere averiguar si los
profesores estn realmente en sus despachos durante las horas de tutoras. Decide
investigar muestras de 40 profesores ayudantes, 40 asociados y 50 titulares. Algunos
estudiantes voluntarios llamaron a la puerta de los profesores de la muestra durante sus
horas de tutoras. Se hall que 31 de los profesores ayudantes, 29 de los asociados y 34 de
los titulares se encontraban realmente en sus despachos. Hallar un intervalo de confianza
para la proporcin de profesores que permanecen en sus despachos durante las horas de
tutoras.
Solucin: p st = 0,7214; B = 0,0685
4. Un auditor quiere estimar el valor medio de las facturas por cobrar de una compaa. La
poblacin se divide en cuatro estratos que contienen 500, 400, 300 y 200 facturas,
respectivamente. Basndose en una experiencia previa, se estima que las desviaciones

154
tpicas en estos estratos son de 15, 20, 30 y 40 euros, respectivamente. Determinar el
tamao muestral y la asignacin para estimar el valor medio de las facturas por cobrar
cometiendo un error de como mucho 5 euros.
Solucin: n1 = 18,59; n 2 = 19,83; n3 = 22,31; n 4 = 19,83; n = 80,55
5. Un ayuntamiento est interesado en ampliar las instalaciones de un centro de atencin
diurna para nios. Se va a realizar una encuesta para estimar la proporcin de familias con
nios que utilizarn las instalaciones ampliadas. Las familias estn dividas en aquellas que
en la actualidad usan las instalaciones y las que an no la usan. Aproximadamente el 90%
de los que usan las instalaciones y el 50% de los que no las usan van a utilizar las nuevas
instalaciones. Los costos por efectuar la observacin de un cliente actual es de 4 y de 8
para uno que no lo es. Registros existentes nos dan que existen 97 familias que en la
actualidad utilizan las instalaciones y 145 que no lo hacen.
a) Encuentre el tamao muestral aproximado y la asignacin necesaria para estimar la
proporcin poblacional con un lmite de 0,05 para el error de estimacin.
b) Suponga que el costo total de muestreo se fija en 400 . Elija el tamao de la
muestra y la asignacin que minimiza la varianza del estimador para este costo fijo.
Solucin: (a) n1 = 47; n2 = 83; n = 130 (b) n1 = 22; n2 = 39; n = 61
6. En un centro escolar se quiere realizar una encuesta para conocer la proporcin de padres
que estaran dispuestos a participar en actividades. Se quiere estimar la proporcin de
padres tanto a nivel global como para cada grupo de edad de los alumnos por lo que se
decide estratificar segn la edad de los alumnos. A partir de la informacin proporcionada
por la siguiente tabla, obtener el nmero ptimo de padres que, de cada estrato, hay que
encuestar para que la proporcin de participacin de los padres con hijos de edades entre 6
y 8 aos sea estimada con un error menor o igual al 10%. (Suponemos que cada padre
tiene un solo hijo en el centro)
Aos Alumnos Porcentaje de participacin en aos Coste de encuestar a un
matriculados anteriores elemento
4-6 150 40% 4
6-8 130 30% 9
8-12 120 25% 16
12-14 100 20% 25
Sol. n = 200,3; n1 = 94,84 95; n 2 = 51,27 52; n3 = 33,53 34; n 4 = 20,65 21 n = 202
7. El coste de transportar mercancas en avin depende del peso. Un determinado embarque
de una fbrica consista en las mquinas producidas por la citada fbrica a lo largo de las
dos ltimas semanas. Se decide estratificar basndose en las semanas, con el fin de
observar si existe variacin semanal en la cantidad producida. Las muestras aleatorias

155
simples de los pesos (en kilos) de las mquinas transportadas en el embarque, para las dos
semanas, mostraron las siguientes mediciones:
Semana A Semana B
58,3 59,2
60,4 60,1
59,3 59,6
58,7 59,2
59,1 58,8
59,6 60,5
a. Estimar el peso total del embarque de maquinaria, sabiendo que el nmero total de
mquinas producidas ha sido de 162 en la semana A y de 170 en la semana B.
b. Obtenga un intervalo de confianza para el peso total del embarque de maquinaria.
c. Determinar el tamao de la muestra y su asignacin, en el caso de que se quiera
estimar el peso total del embarque, con un lmite para el error de estimacin de 50
kg. Las dispersiones en los pesos se suponen diferentes de una semana a otra.
Considere las muestras anteriores como muestras previas para estimar los
parmetros necesarios.
Solucin: (a) = 19.722,13 (b) (19.593'71, 19.850'56)

(c) n = 65,67; n1 = 34,37 35; n 2 = 31,30 32 n = 67


8. Una cadena de almacenes est interesada en estimar la proporcin de cuentas no cobradas.
La cadena est formada por 4 almacenes, siendo el coste de muestreo igual para todos. Se
usa muestreo aleatorio estratificado, con cada tienda como un estrato.
Estrato I Estrato II Estrato III Estrato IV
N cuentas por cobrar N 1 = 65 N 2 = 42 N 3 = 93 N 4 = 25
Tamao muestra n1 = 14 n2 = 9 n3 = 21 n4 = 6
N cuentas no cobradas 4 2 8 1
a. Estime la proporcin de cuentas no cobradas para la cadena y fije un lmite para el
error de estimacin.
b. Utilice los datos anteriores para determinar la asignacin y el tamao de la muestra
necesarios para estimar la proporcin de cuentas no cobradas, con un lmite del
error de estimacin del 5%.
Solucin: (a) p = 0,30; B = 0,1173

(b) n = 132,30; n1 = 38,35 39; n 2 = 22,80 23; n3 = 58,98 59; n 4 = 12,17 13 n = 134
9. Una escuela desea estimar la calificacin media que puede obtener en el examen final de
matemticas en este curso. Los estudiantes de la escuela se agrupan en tres estratos segn
el tipo de aprendizaje, clasificado como N=Normal, A=Avanzado, L=Lento. En el
presente curso, la distribucin de los alumnos segn el tipo de aprendizaje es 50 normal,

156
30 avanzado y 20 lento, la calificacin media de los estudiantes segn el tipo de
aprendizaje fue en el primer examen parcial: 75 para el normal, 89 para el avanzado y 70
para el lento, con unas cuasivarianzas de 80, 30 y 40 respectivamente.
Para actualizar esta informacin, se tom una muestra aleatoria de estudiantes, se les hizo
el examen final de matemticas y se obtuvieron las siguientes calificaciones (entre
parntesis, el tipo de aprendizaje de cada estudiante):

70(L) 88(A) 72(N) 85(N) 90(N) 82(A) 61(N) 92(N) 65(L) 87(A)
91(A) 81(N) 79(N) 63(L) 82(N) 75(N) 78(A) 71(L) 61(L)
Se pide:

a. Estime la calificacin media en el examen final de matemticas. De una medida del


error de estimacin.
b. Qu ocurre si no se tiene en cuenta el tipo de aprendizaje? Compare los resultados
de ambos mtodos de estimacin, as como determine la ganancia en precisin.
c. Se desea mejorar la estimacin de la nota media del examen final en matemticas,
teniendo en cuenta ms informacin. Usando estos resultados como muestra
previa, qu tamaos muestrales en cada estrato son necesarios para un error
mximo admisible de 2 puntos, utilizando asignacin Proporcional.
d. Estime, con un intervalo de confianza, el nmero de estudiantes con aprendizaje
normal que han superado los 80 puntos. Si se pudiera planificar de nuevo la
muestra, qu tamao de muestra sera necesario para que esta misma estimacin
tuviera un error mximo admisible de 10 estudiantes?
Solucin: (a) = 78,59; B = 3, 21 (b) = 77,53; B = 4,25

(c) n = 36,31; n1 = 18,15 19; n 2 = 10,89 11; n3 = 7,26 8 n = 38

(d) (11,87, 43,69); n = 16,8 17

10. Se desea estimar el salario medio de los empleados de una empresa. Se decide
clasificarlos en dos estratos: los que tienen contrato fijo y los que poseen un contrato
temporal. Los primeros son 143 y su salario vara entre 1500 y 2500 euros mensuales. Los
contratos temporales son 320 y su salario est comprendido entre 700 y 1800 euros
mensuales. Cul debe ser el tamao de la muestra y su asignacin para que al estimar el
salario medio mensual el error de estimacin sea inferior a 100 euros?
Solucin: Neyman n = 26,91 n1 = 7, 77 8 n2 = 19,14 20 n = 28

157
3. Muestreo con informacin auxiliar

1. Una encuesta de consumo fue realizada para determinar la razn de dinero gastado en
alimentos sobre el ingreso por ao, para las familias de una pequea comunidad. Una
muestra aleatoria de 14 familias fue seleccionada de entre 150. Los datos de la muestra se
presentan en la siguiente tabla:
Familia Ingreso Total Gasto en alimentos
1 25100 3800
2 32200 5100
3 29600 4200
4 35000 6200
5 34400 5800
6 26500 4100
7 28700 3900
8 28200 3600
9 34600 3800
10 32700 4100
11 31500 4500
12 30600 5100
13 27700 4200
14 28500 4000
Estime la razn poblacional, y establezca un lmite para el error de estimacin.
Solucin: r = 0,1467; B = 0,0102
2. El ingreso nacional para 1981 ser estimado con base en una muestra de 10 sectores
industriales que declaran sus ingresos de 1981 antes que las 35 restantes. (Existen 45
sectores industriales que se utilizan para determinar el ingreso nacional total). Se dispone
de los datos del ingreso de 1980 para los 45 sectores industriales y los totales son 2.174,2
(en miles de millones). Los datos se presentan en la tabla adjunta:
Industria 1980 1981
Producto de fbricas textiles 13,6 14,5
Productos qumicos y relacionados 37,7 42,7
Madera aserrada y lea 15,2 15,1
Equipo elctrico y electrnico 48,4 53,6
Vehculos y equipo 19,6 25,4
Transporte y almacenaje 33,5 35,9
Banca 44,4 48,5
Bienes Races 198,3 221,2
Servicios de Salud 99,2 114,0
Servicios de Educacin 15,4 17,0
(a) Encuentre el estimador de razn del ingreso total de 1981, y establezca un lmite
para el error de estimacin.

158
(b) Encuentre el estimador de regresin del ingreso total de 1981, y establezca un
lmite para el error de estimacin.
(c) Encuentre el estimador de diferencia del ingreso total de 1981, y establezca un
lmite para el error de estimacin.
(d) Cul de los tres mtodos es el ms apropiado en este caso?Por qu?
Solucin: (a) Y = 2.433,30; B = 45,95 (b) YL = 2.432,91; B = 48,64
(c) Y = 2.455,90; B = 180,07
3. Se desea conocer las ventas medias (en euros / habitante) en este ao de un determinado
producto en un municipio formado por un pueblo A con 291 habitantes y un pueblo B con
200 habitantes. Se sabe que las ventas medias en ese municipio el ao pasado fueron de
170 euros / habitante. Tomamos una muestra aleatoria de 4 habitantes del pueblo A y otra
de 3 habitantes del pueblo B para los que se conoce su consumo del producto bajo estudio
(expresado en euros), este ao (Y) y el ao pasado (X):
Pueblo A Pueblo B
xi yi xi yi
204 210 137 150
143 160 189 200
82 75 119 125
256 280
a. Sin hacer distincin entre pueblos, estime las ventas medias para este ao
utilizando un estimador de razn. D un lmite para el error de estimacin.
b. Qu se obtiene si no se tiene en cuenta los datos del ao pasado pero si el
pueblo?
c. Qu se obtiene si no se tiene en cuenta los datos del ao pasado ni se hace
distincin entre pueblos?
d. Compare los estimadores que se obtienen en cada caso justificadamente.
Solucin: (a) = 180,53; B = 5,69 (b) = 171,91; B = 53,81 (c) = 171,43; B = 49,53

(d) La mejor estimacin es en la que se usa el estimador de razn, por la fuerte relacin
entre las variables. El muestreo estratificado se comporta mal porque los estratos no son
homogneos.

4. Se est investigando la eficacia de una nueva dieta alimenticia en la crianza de conejos.


Los investigadores piensan que hay razones para creer que el comportamiento es diferente
dependiendo de la zona de crianza. Por este motivo, deciden formar estratos observndose
el peso de los conejos antes de introducir la nueva dieta (X) y el peso resultante al cabo de
un mes de tratamiento (Y). Se obtuvieron los siguientes resultados:
N 1 = 80; N 2 = 60; N 3 = 40; n1 = 10; n 2 = 8; n3 = 6

159
Zona A Zona B Zona C
X Y X Y X Y
3,2 4,1 3,1 3,9 2,8 3,8
3,0 4,0 3,0 4,0 2,9 3,7
2,9 4,1 3,1 3,8 2,9 3,8
2,8 3,9 3,2 4,0 3,0 3,6
3,1 3,7 3,0 3,8 3,1 3,8
3,2 4,1 3,2 4,1 3,0 3,7
2,9 4,2 2,9 3,7
2,8 4,0 3,0 3,8
3,1 3,9
2,8 3,8
a. Estimar el peso medio estratificado de los conejos al principio y al final del
tratamiento. Dar una estimacin del error.
b. Si se le permite un error de estimacin de 0,01 para estimar el peso medio
estratificado al final del tratamiento, cules deben ser los nuevos tamaos
muestrales? Usar asignacin Proporcional.
c. Sabiendo que el peso medio de los conejos antes de introducir la nueva dieta era de
3,2 kilogramos, estimar el peso medio de los conejos al final del tratamiento
utilizando un estimador de razn. Dar el lmite de error de estimacin.
d. Estimar el peso medio de los conejos al final del tratamiento utilizando muestreo
aleatorio simple. Comentar los resultados.
Solucin: (a) x = 3,0008; B = 0,0516; y = 3,8944; B = 0,0523

(b) n = 144,4; n1 = 64,2 65; n 2 = 48,15 49; n3 = 32,1 33 n = 147

(c) y = 4,1467; B = 0,0793 (d) = 3,8875; B = 0,0617

5. En una escuela de 560 alumnos, se desea estimar la calificacin media que puede
obtenerse en el examen final de matemticas en el curso 00/01. Se toma como informacin
auxiliar la calificacin de los mismos alumnos en el examen final de matemticas del
curso 99/00 con una nota media de 75. A partir de una muestra aleatoria de estudiantes
para los cuales se observ la nota del examen final en el curso 00/01 y la calificacin de
dicho alumno en la prueba correspondiente al curso 99/00. Los resultados fueron los
siguientes:

160
Nota curso Nota curso
99/00 00/01
80 87
78 65
98 86
45 47
61 67
83 94
79 67
56 67
Estimar la calificacin media del curso 00/01 utilizando como informacin auxiliar la
calificacin obtenida en el curso 99/00 mediante un estimador de razn. Dar una
estimacin del error de muestreo.

Solucin: y = 75; B = 7,45

6. Un director de recursos forestales est interesado en estimar el nmero de abetos muertos


por una plaga en una zona de 300 hectreas. Usando una fotografa area, el director
divide la zona en 200 parcelas de hectrea y media. Se toma una muestra aleatoria de 10
parcelas. El nmero total de abetos muertos, obtenidos segn la cantidad en fotografa es
4200.
Parcela 1 2 3 4 5 6 7 8 9 10
Cantidad en fotografa 12 30 24 24 18 30 12 6 36 42
Cantidad en terreno 18 42 24 36 24 36 14 10 48 54
a. Estime la razn poblacional y obtenga su intervalo de confianza.
b. Estime el nmero total de abetos muertos en el rea de 300 hectreas y fije un
lmite para el error de estimacin.
c. Cul ha de ser el tamao de la muestra necesario para estimar el total de abetos
muertos, con un lmite de error de estimacin de 200 abetos?
Solucin: (a) r = 1,3077; (1'2057, 1'4097) (b) y = 5.492,31; B = 428,44 ) (c) n = 38,9 39

7. De una poblacin de 40 hogares, para la que es conocido que el gasto total general durante
un periodo de un ao, en general, es de 12.000.000 um., se obtiene una muestra aleatoria
simple de tamao 4 que proporciona los siguientes valores anuales (en um):
Gasto en alimentacin 125000 150000 100000 175000
a. Estimar el gasto total en alimentacin para los 40 hogares mediante un intervalo de
confianza.
b. Supongamos que de esos 4 hogares tenemos tambin los valores anuales de su
gasto general (en um):

161
Gasto General 250000 300000 200000 350000
Antes de calcular otro estimador, obtendramos mejores resultados si
utilizamos esta informacin auxiliar?Por qu?

c. Estimar mediante un estimador de razn el total de gasto en alimentacin,


utilizando la informacin auxiliar del apartado b.
d. Corroborar la respuesta del apartado b indicando qu estimador es mejor, el del
apartado a o el del apartado c.
Solucin: (a) (4.275.255, 6.724.744) (b) = 1 (c) y = 6.000.000 (d) B = 0 (lmite del error de

estimacin del apartado (c)

8. En una universidad se realiz una prueba de conocimientos matemticos antes del ingreso
a 486 estudiantes. Se consideraron dichas calificaciones como una variable auxiliar de la
variable calificacin final en clculo. Teniendo en cuenta que 291 eran chicos y las
calificaciones medias del examen previo fueron de 47 para los chicos y 52 para las chicas,
a partir de los datos de la tabla siguiente, se pide:
CHICOS CHICAS
Examen previo Examen de clculo Examen previo Examen de clculo
39 65 57 92
43 78 47 89
21 52 28 73
64 82 75 98
34 56
52 75
a. Sin tener en cuenta el sexo, estima la calificacin media en el examen final de
clculo utilizando un estimador de razn. De una medida del error de estimacin.
b. Qu ocurre si no se tiene en cuenta la informacin auxiliar pero si el sexo?
c. Qu ocurre si no se tiene en cuenta la informacin auxiliar ni el sexo?
d. Compare los estimadores que se obtienen en cada caso justificadamente.
Solucin: (a) y = 80,97; B = 10,54 (b) = 73,76; B = 9,5 (c) = 76; B = 9,46

4. Muestreo Sistemtico

1. La seccin de control de calidad de una empresa usa el muestreo sistemtico para estimar
la cantidad media de llenado en latas de 12 onzas que sale de una lnea de produccin. Los
datos de la tabla adjunta representan una muestra sistemtica 1 en 50 de la produccin de
un da.

162
Cantidad de llenado (en onzas)
12,00 11,97 12,01 12,03 12,01 11,80
11,91 11,98 12,03 11,98 12,00 11,83
11,87 12,01 11,98 11,87 11,90 11,88
12,05 11,87 11,91 11,93 11,94 11,89
11,72 11,93 11,95 11,97 11,93 12,05
11,85 11,98 11,87 12,05 12,02 12,04
a. Estime , y establezca un lmite para el error de estimacin. Suponga que N=1.800.
b. Determinar el tamao de muestra requerido para estimar dentro de 0,01 unidades.
Solucin: (a) sy = 11,94; B = 0,0259 (b) n = 217,1 218

2. Los funcionarios de cierta sociedad profesional desean determinar la proporcin de


miembros que apoyan varias enmiendas propuestas en las prcticas de arbitraje. Los
funcionarios toman una muestra sistemtica de 1 en 10, a partir de una lista en orden
alfabtico de los 650 miembros registrados. Sea y i = 1 si la i-sima persona muestreada
favorece los cambios propuestos e y i = 0 si se opone a los cambios. Use los siguientes
datos de la muestra para estimar la proporcin de miembros en favor de los cambios
propuestos. Establezca un lmite para el error de estimacin.
65
y i = 48
i =1

Solucin: p sy = 0,7385; B = 0,1042

3. La tabla anexa muestra el nmero de nacimientos y la tasa de natalidad por cada 1000
individuos para Estados Unidos durante seis aos seleccionados sistemticamente.
(a) Estime el nmero medio de varones nacidos por ao para el periodo 1955-1980, y
establezca un lmite para el error de estimacin.
(b) Estime la tasa media anual de natalidad para el periodo 1955-1980, y establezca un
lmite para el error de estimacin.
(c) Cree usted que el muestreo sistemtico es mejor que el muestreo aleatorio simple
para los problemas de los apartados (a) y (b)?Por qu?
Ao Nac.Masculinos Nac.Femeninos Total de Nac. Natalidad
1955 2.073.719 1.973.576 4.047.295 26,0
1960 2.179.708 2.078.142 4.257.850 23,7
1965 1.927.054 1.833.304 3.760.358 19,4
1970 1.915.378 1.816.008 3.731.386 18,4
1975 1.613.135 1.531.063 3.144.198 14,6
1980 1.852.616 1.759.642 3.612.258 15,9
Solucin: (a) sy = 1.926.935; B = 139.437,35 ; (b) sy = 19,67; B = 3,17 ;

(c) Si. Observando la tendencia de las muestras se puede decir que las poblaciones en
estudio estn ordenadas de forma decreciente.

163
4. En la tabla anexa se presentan los datos sobre las tasas de divorcio (por cada 1000
personas) en Estados Unidos para una muestra sistemtica de los aos de 1900-1980.
Estime la tasa media anual de divorcios para tal periodo y establezca un lmite para el
error de estimacin. Es en este caso el muestreo sistemtico mejor o peor que el muestreo
aleatorio simple?Por qu?
Ao Tasa Ao Tasa
1900 0,7 1945 3,5
1905 0,8 1950 2,6
1910 0,9 1955 2,3
1915 1,0 1960 2,2
1920 1,6 1965 2,5
1925 1,5 1970 3,5
1930 1,6 1975 4,8
1935 1,7 1980 5,2
1940 2,0
Solucin: sy = 2,26; B = 0,57 . Mejor, se observa, en general, una tendencia creciente en

los datos de la muestra, aunque se rompa ese orden parcial en los aos 1945-1955.

5. Muestreo por Conglomerados.

1. Un fabricante de sierras quiere estimar el coste medio de reparacin mensual para las
sierras que ha vendido a ciertas industrias. El fabricante no puede obtener un coste de
reparacin para cada sierra, pero puede obtener la cantidad total gastada en reparacin y el
nmero de sierras que tiene cada industria. Entonces decide usar muestreo por
conglomerados, con cada industria como un conglomerado. El fabricante selecciona una
muestra aleatoria simple de 20 de 96 industrias a las que da servicio. Los datos sobre coste
total de reparaciones por industria y el nmero de sierras son:
Industria N Costo total de reparacin Industria N Costo total de reparacin
sierras para el mes pasado () sierras para el mes pasado ()
1 3 50 11 8 140
2 7 110 12 6 130
3 11 230 13 3 70
4 9 140 14 2 50
5 2 60 15 1 10
6 12 280 16 4 60
7 14 240 17 12 280
8 3 45 18 6 150
9 5 60 19 5 110
10 9 230 20 8 120

164
a. Estime el costo medio de reparacin por sierra para el mes pasado, y establezca un
lmite para el error de estimacin.
b. Estime la cantidad total gastada por las 96 industrias en la reparacin de sierras.
Establezca un lmite para el error de estimacin.
c. Despus de verificar sus registros de ventas, el fabricante se percata de que ha vendido
un total de 710 sierras a esas industrias. Usando esta informacin adicional, estime la
cantidad total gastada en reparacin de sierras por estas industrias, y establezca un
lmite para el error de estimacin.
Solucin: (a) = 19,73; B = 1,78 (b) = 12.312; B = 3.175,07
(c) = 14.008,85; B = 1.110,78
2. Se disea una encuesta econmica para estimar la cantidad media gastada en servicios
para los hogares en una ciudad. Ya que no se encuentra disponible una lista de hogares, se
usa muestreo por conglomerados, con barrios formando los conglomerados. Se selecciona
una muestra aleatoria de 20 barrios de la ciudad de un total de 60. Los entrevistadores
obtienen el gasto en servicios de cada hogar en los barrios seleccionados; los gastos totales
se muestran en esta tabla:
Barrio N hogares Cantidad total gastada en servicios ()
1 55 2210
2 60 2390
3 63 2430
4 58 2380
5 71 2760
6 78 3110
7 69 2780
8 58 2370
9 52 1990
10 71 2810
11 73 2930
12 64 2470
13 69 2830
14 58 2370
15 63 2390
16 75 2870
17 78 3210
18 51 2430
19 67 2730
20 70 2880
a. Estime la cantidad media de gastos en servicios por hogar en la ciudad y establezca un
lmite para el error de estimacin.

165
b. En la encuesta anterior se desconoce el nmero de hogares en la ciudad. Estime la
cantidad total gastada en servicios por todos los hogares de la ciudad y establezca un
lmite para el error de estimacin.
c. La encuesta econmica se va a llevar a cabo en una ciudad vecina de estructura
similar. El objetivo es estimar la cantidad total gastada en servicios por los hogares de
la ciudad, con un lmite de 5.000 para el error de estimacin. Use los datos anteriores
para encontrar el nmero aproximado de conglomerados que se necesitan para obtener
ese lmite.
Solucin: (a) = 40,17; B = 0,64 (b) = 157.020; B = 6.927,88 (c) n = 29,4 30
3. Un inspector quiere estimar el peso medio de llenado para cajas de cereal empaquetadas
en una fbrica. El cereal est en paquetes que contienen 12 cajas cada uno. El inspector
selecciona aleatoriamente 5 y mide el peso de llenado de cada caja en los paquetes
muestreados, con los resultados (en onzas) que se muestran:
Paquete Onzas de llenado
1 16,1 15,9 16,1 16,2 15,9 15,8 16,1 16,2 16,0 15,9 15,8 16,0
2 15,9 16,2 15,8 16,0 16,3 16,1 15,8 15,9 16,0 16,1 16,1 15,9
3 16,2 16,0 15,7 16,3 15,8 16,0 15,9 16,0 16,1 16,0 15,9 16,1
4 15,9 16,1 16,2 16,1 16,1 16,3 15,9 16,1 15,9 15,9 16,0 16,0
5 16,0 15,8 16,3 15,7 16,1 15,9 16,0 16,1 15,8 16,0 16,1 15,9
Estime el peso medio de llenado para las cajas empaquetadas por esta fbrica, y establezca
un lmite para el error de estimacin. Suponga que el nmero total de cajas empaquetadas
por la fbrica es lo suficientemente grande para que no se tome en cuenta la correccin por
poblacin finita.
Solucin: = 16,0050; B = 0,0215
4. Un peridico quiere estimar la proporcin de votantes que apoyan a cierto candidato A en
una eleccin estatal. La seleccin y entrevista de una muestra aleatoria simple de votantes
registrados es muy costosa por lo que se utiliza muestreo por conglomerados. Se
selecciona una muestra aleatoria de 50 distritos (conglomerados) de un total de 497 que
tiene el estado. El peridico quiere hacer la estimacin el da de la eleccin, pero antes de
que se haya hecho la cuenta final de los votos. Es por eso que los reporteros son enviados
a los lugares de votacin de cada distrito en la muestra, para obtener la informacin
pertinente directamente de los votantes. Los resultados se muestran en esta tabla:

166
N votantes N votantes A N votantes N votantes A N votantes N votantes A
1290 680 1893 1143 843 321
1170 631 1942 1187 1066 487
840 475 971 542 1171 596
1620 935 1143 973 1213 782
1381 472 2041 1541 1741 980
1492 820 2530 1679 983 693
1785 933 1567 982 1865 1033
2010 1171 1493 863 1888 987
974 542 1271 742 1947 872
832 457 1873 1010 2021 1093
1247 983 2142 1092 2001 1461
1896 1462 2380 1242 1493 1301
1943 873 1693 973 1783 1167
798 372 1661 652 1461 932
1020 621 1555 523 1237 481
1141 642 1492 831 1843 999
1820 975 1957 932
a. Estime la proporcin de votantes que apoyan al candidato A, y establezca un lmite
para el error de estimacin.
b. El peridico quiere realizar una encuesta similar durante la siguiente eleccin. Cmo
de grande debe ser la muestra para estimar la proporcin de votantes a favor de un
candidato similar con un lmite del 5% para el error de estimacin?
Solucin: p = 0,5701; B = 0,0307 (b) n = 20,1 21
5. Un empresario quiere estimar el nmero de tubos de dentfrico usados por mes en una
comunidad de 4000 hogares divididos en 400 bloques. Se selecciona una muestra aleatoria
simple de 4 bloques que proporciona los siguientes resultados:
Bloque tubos gastados por hogar
1 1 2 1 3 3 2 1 4
2 1 3 2 2 3 1 4 1 1
3 2 1 1 1 3 2 2
4 1 1 3 2 1 5 1 3
Estime de distintas formas el nmero total de tubos gastados, obtenga el lmite para el
error de estimacin en cada caso y comente los resultados.
Solucin: Muestreo por conglomerados = 8000; B = 562,85 Muestreo aleatorio simple
= 6400; B = 1077,78

6. En un proceso de control del volumen envasado por una fbrica de bebidas se eligen 5 de
los 40 paquetes que tiene la fbrica, cada uno de los cuales contiene 4 envases, y se mide
el volumen que cada envase contiene. Las observaciones se presentan en la tabla adjunta:

167
Paquete n Volumen envasado en cm3
1 33 32,5 31,7 34,2
2 32 32,6 33,8 32,5
3 30,9 33,1 33 33,4
4 34,1 33,1 32,5 33,2
5 32 32,1 32,6 33,6
Estime el volumen medio por envase y dar la cota de error de estimacin.
Solucin: = 32,80; B = 0,22
7. Cierto tipo de tableros posee 12 microcircuitos cada uno. De un pedido de 50 tableros se
seleccionan 10 de ellos para su estudio. El nmero de microcircuitos defectuosos por
tablero fue
2 0 1 3 2 0 0 1 3 4
Estime la proporcin de microcircuitos defectuosos en la poblacin y establezca una cota
para el error de estimacin.

Solucin: p = 0,1333; B = 0,0674

8. En una pequea ciudad se quiere estimar el nmero total de horas diarias que sus residentes
dedican a ver el programa ``Gran Hermano'', emitido las 24 horas del da por un canal
Digital. Dicha ciudad est dividida en 200 manzanas de viviendas. Se extrae una muestra
aleatoria simple de 10 manzanas, y se interroga a cada familia acerca de si estn conectados
a Va Digital y cuntas horas ven el programa. Los datos de la encuesta se encuentran en la
siguiente tabla:
Manzana N hogares con N total horas que
canal Digital ven programa
1 8 13
2 7 13
3 9 14
4 6 13
5 5 0
6 9 10
7 6 6
8 8 14
9 9 16
10 6 4
a. Estimar el nmero total de horas que se ve el programa ``Gran Hermano'' a travs
de Canal Digital.
b. Obtener un intervalo de confianza para el nmero total de horas.
c. Determinar cuntas manzanas se deberan muestrear para estimar el total
poblacional, con un lmite para el error de estimacin de magnitud 20. Considere la
muestra anterior como una muestra previa para estimar los parmetros necesarios.
Solucin: (a) = 2060 ; (b) (1415,30, 2704,70) (c) n = 196,4 197

168
9. En un municipio de 5000 familias se pretende estimar el porcentaje de las que poseen
ordenador. Se consideran 1000 conglomerados de 5 familias cada uno, y se elige una
muestra aleatoria de 10 conglomerados, en los que el nmero de familias con ordenador es:
2 1 5 3 0 1 4 3 5 0
Estimar la proporcin de familias que poseen ordenador y la varianza del estimador usado
para estimar dicha proporcin.

Solucin: p = 0,48; V ( p ) = 0,0143

10. Se desea conocer la proporcin de empleados de una empresa que no estn dispuestos a
trasladarse a una nueva planta de produccin. Realizada una encuesta a los empleados de 5
factoras elegidas al azar entre las 50 que tiene la empresa, los resultados han sido:
Factora N empleados Dispuestos
1 250 225
2 190 175
3 210 190
4 400 350
5 150 120
Estimar la proporcin de empleados que no estn dispuestos a trasladarse a la nueva
factora. Obtenga una estimacin de la varianza del estimador empleado.

Solucin: p = 0,1167; V ( p ) = 0,0002

11. Un gran embarque de mariscos congelados es empaquetado en cajas, conteniendo cada una
24 paquetes de 5 kilos. Hay 100 cajas en el embarque. Un inspector del gobierno determina
el peso total de mariscos daados para cada una de las 5 cajas muestreadas. Los datos son:
9 6 3 10 2
a. Estime el peso total de mariscos daados en el embarque y establezca un lmite
para el error de estimacin.
b. Determine el tamao de la muestra necesario para estimar el peso total de mariscos
daados en el embarque, con un lmite de error de 275.
Solucin: (a) = 600; B = 308, 22 (b) n = 6, 20 7

6. Muestreo con probabilidades desiguales.

1. Una empresa encargada de realizar publicidad para empresas quiere conocer el xito
de sus campaas de publicidad. Durante un determinado periodo la empresa ha
trabajado con 70 empresas de unos 30 empleados (Empresas pequeas),
aproximadamente, en cada una de ellas, y con otras 30 empresas con unos 200

169
empleados (Empresas grandes), aproximadamente, en cada una de estas empresas ms
grandes. La empresa desea realizar un muestreo aleatorio para recabar informacin
sobre los beneficios de las empresas antes y despus de sus respectivas campaas
publicitarias, pero con una representacin mayor de las empresas ms grandes, por lo
que decide aplicar un muestreo con probabilidades proporcionales al nmero de
empleados de las empresas, obtenindose los siguientes resultados medidos en miles
de euros:
Tipo de Beneficios Beneficios Gasto en publicidad
Empresa (Antes de publicidad) (Despus de publicidad)
Pequea 15 19 3
Grande 25 24 6
Grande 30 45 10
Pequea 10 12 5
Grande 40 45 2
Grande 50 60 8
Pequea 12 10 3
Pequea 10 15 3
Grande 25 35 5
Grande 36 40 3
Si la empresa considera que una campaa en publicidad ha tenido xito si las diferencias en
ganancias entre despus y antes de la campaa son superiores a los gastos en publicidad
realizados por dicha empresa, obtenga una estimacin mediante un intervalo de confianza
del porcentaje de xito de la empresa encarga de realizar la publicidad.

7. Estimacin del Tamao de la Poblacin.

1. Un club deportivo se interesa por el nmero de truchas de ro en un arroyo. Durante un


periodo de varios das, sea atrapan 100 truchas, se marcan y se devuelven al arroyo.
Obsrvese que la muestra representa 100 peces diferentes, ya que cualquier pez atrapado
en esos das, que ya haba sido marcado, se devolva inmediatamente. Varias semanas
despus se atrap una muestra de 120 peces y se observ el nmero de peces marcados.
Supongamos que este nmero fue de 27 en la segunda muestra. Estime el tamao total de
la poblacin de truchas y d un lmite de error de estimacin.
Solucin: N = 444,4; B = 150,60
2. Ciertos bilogos de poblaciones salvajes desean estimar el tamao total de la poblacin de
codorniz comn en una seccin del sur de Florida. Se usa una serie de 50 trampas. En la
primera muestra se atrapan 320 codornices. Despus de ser capturadas, cada ave es
retirada de la trampa y marcada con una banda de metal en su pata izquierda. Luego se
170
sueltan todas las aves. Varios meses despus se obtiene una segunda muestra de 515
codornices. Suponga que 91 de estos pjaros estn marcados. Estimar el tamao total de la
poblacin de codornices y dar un lmite de error de estimacin.
Solucin: N = 1810,99; B = 344,51
3. Expertos en pesca estn interesados en estimar el nmero de salmones de una reserva. Se
atrapa una muestra aleatoria de 2876 salmones. Cada uno es marcado y soltado. Un mes
despus se atrapa una segunda muestra de 2562. Supongamos que 678 tienen marcas en la
segunda muestra. Estime el tamao de la poblacin total y establezca un lmite del error de
estimacin.
Solucin: N = 10.867,72; B = 715,82
4. Los regentes de una ciudad estn preocupados por las molestias que causan las palomas
alrededor del ayuntamiento. A fin de cuantificar el problema contratan un equipo de
investigadores para que estime el nmero de palomas que ocupan el edificio. Con varias
trampas se captura una muestra de 60 palomas, se marcan y se sueltan. Un mes despus se
repite el proceso, usando 60 palomas, de las que 18 estn marcadas. Estimar el tamao
total de la poblacin de palomas y dar un lmite de error de estimacin.
Solucin: N = 200; B = 78,88
5. Una zologa desea estimar el tamao de la poblacin de tortugas en determinada rea
geogrfica. Ella cree que el tamao de la poblacin est entre 500 y 1000; por lo que una
muestra inicial de 100 parece ser suficiente. Las 100 tortugas son capturadas, marcadas y
liberadas. Toma una segunda muestra un mes despus y decide continuar muestreando
hasta que se recapturen 15 tortugas marcadas. Atrapa 160 tortugas antes de obtener las 15
marcadas. Estime el tamao total de la poblacin de tortugas y establezca un lmite de
error de estimacin.
Solucin: N = 1.066,67; B = 507,72
6. En una plantacin de pinos de 200 acres, se va a estimar la densidad de rboles que
presentan hongos parsitos. Se toma una muestra de 10 cuadros de 0,5 acres cada uno. Las
diez parcelas muestreadas tuvieron una media de 2,8 rboles infectados por cuadro.
a) Estime la densidad de rboles infectados y establezca un lmite de error de
estimacin.
b) Estime el total de rboles infectados en los 200 acres de la plantacin y
establezca un lmite de error de estimacin.
Solucin: (a) = 5,6; B = 2,1 (b) M = 1.120; B = 423,32

171
7. Se desea estimar el nmero total de personas que diariamente solicitan informacin en una
oficina turstica. Se observa que 114 personas solicitan informacin, durante 12 intervalos
de 5 minutos cada uno, repartidos aleatoriamente entre las 8 horas que permanece abierta
la oficina. Estimar el total de personas que visitan la oficina diariamente y dar la cota de
error de estimacin.
Solucin: M = 912; B = 170,8
8. Un alumno de A.T.C. desea estimar el nmero de alumnos que una determinada maana
han ido a la Facultad. Para ello se basa en que dicho da una conocida marca comercial ha
repartido a primeras horas de la maana en la entrada de la Facultad 500 carpetas. En un
intercambio de clase, sentado en un banco del pasillo, decide contar los alumnos que pasan
hasta observar a 100 que portan la carpeta, para lo que fue necesario contar hasta 382
alumnos.
Estime con un intervalo de confianza el nmero de alumnos que asistieron esa maana a la
Facultad.
Solucin: muestreo inverso (1910 326,58 )
9. El hermano de un alumno de T.A.M. est pensando en abrir una farmacia de 24 horas.
Para saber si los ingresos compensaran los gastos de esta inversin deciden observar un
establecimiento similar para estimar los ingresos diarios. Este asiduo alumno de T.A.M.
conoce perfectamente que es una prdida de tiempo innecesaria observar el flujo de
clientes las 24 horas del da por lo que decide observar de forma sistemtica media hora
cada 3 horas, obteniendo los datos de la siguiente tabla
clientes
10:00-10:30 35
13:00-13:30 20
16:00-16:30 19
19:00-19:30 30
22:00-22:30 25
01:00-01:30 9
04:00-04:30 12
07:00-07:30 18
Sabiendo que el gasto medio por cliente es de 20, estime los ingresos diarios de la
farmacia observada y el correspondiente lmite para el error de estimacin utilizando
diferentes mtodos.
Solucin: Muestreo por cuadros Ingresos = 20.160; B = 3.110,76 ; Muestreo aleatorio
simple Ingresos = 20.160; B = 5.402,22
10. Se desea estimar el nmero total de palomas en la glorieta de una ciudad. Se capturan 80
palomas, se marcan y se devuelven a la poblacin. Se realiza una segunda muestra hasta

172
encontrar 30 palomas marcadas, se han tenido que capturar para ello 300 aves. Estimar el
tamao total y el lmite del error de estimacin.
Solucin: N = 800; B = 272,62

11. Se desea estimar el nmero total de pinginos en una determinada zona. Se obtiene una
muestra de tamao 60, se marcan y se devuelven a la poblacin. Al da siguiente se elige
otra muestra de tamao 400 y en ella se encuentran 12 marcados. Estimar el nmero total
de pinginos y dar la cota de error de estimacin.
Solucin: N = 2.000; B = 1.137,25

12. Se desea estimar el nmero de vehculos de un modelo determinado que el mes prximo
utilizarn el aparcamiento de Puerta Real. Durante las 720 horas del mes se van a
establecer 5 controles aleatorios de 1 hora de duracin cada uno. Transcurrido el mes, se
ha observado en los 5 controles los siguientes resultados:
Control Nmero de vehculos de ese
modelo que usan el aparcamiento
1 1
2 1
3 2
4 1
5 3
Estimar el nmero total de vehculos del modelo en estudio que utilizaron el aparcamiento.
Solucin: M = 1152; B = 814,59
13. El ayuntamiento de Madrid est interesado en conocer el nmero de aficionados que
acudieron al aeropuerto a vitorear al equipo campen de la Champion League. Para ello,
dividieron la sala de espera, de dimensiones 100 metros de largo por 35 metros de ancho,
en 100 cuadros de igual tamao y seleccionaron 40, observando que el nmero de
personas era 2100.
a. Estime la densidad de asistentes por metro cuadrado mediante un intervalo de
confianza del 95%.
b. Estime el nmero total de asistentes, y fije un lmite para el error de
estimacin.
Solucin: (a) (1,4, 1,6) (b) M = 5.250; B = 229,13 229

14. Se toman peridicamente muestras del aire en un rea industrial de la ciudad. La densidad
de cierto tipo de partculas dainas es el parmetro de inters para el sector industrial. A
partir de 15 muestras de 1 cm 3 , se obtuvo un promedio de 210 partculas/ cm 3 . Estimar la

173
densidad de las partculas dainas en dicha zona, as como dar una estimacin del error de
dicha estimacin.
Solucin: = 210 part / cm 3 ; B = 7,48

15. Se desea conocer cuntas personas asistieron a la inauguracin del pabelln de Portugal en
la Expo de Lisboa. Se sabe que el pabelln tiene forma cuadrada de 35 metros de lado y se
traza una malla que divide el rea total en 100 cuadros de igual tamao. Se selecciona una
muestra aleatoria de 40 cuadros, observando que el nmero de personas es de 750.
a. Estime la densidad de asistentes por metro cuadrado y obtenga su intervalo de
confianza.
b. Estime el nmero total de asistentes a la inauguracin y fije un lmite para el error
de estimacin.
Solucin: (a) = 1,5306; (1'4188, 1'6424) (b) M = 1875; B = 136,9

16. Un equipo de eclogos quiere medir la efectividad de un frmaco para controlar el


crecimiento de la poblacin de palomas. Se quiere conocer el tamao de la poblacin de
este ao para compararlo con el del ao pasado. Se atrapa una muestra inicial de 600
palomas y se les da el frmaco, a la vez que se aprovecha para marcarlas en una pata. En
fechas posteriores se atrapa otra muestra de 100 palomas de las cuales 48 tienen marca.
a. Estime el tamao de la poblacin con un intervalo del 95% de confianza.
b. Para reducir el lmite de error de estimacin a la mitad, en qu proporcin deben
ser mayores las cantidades 100 y 48 observadas en la segunda muestra?, se
deberan observar el doble de las cantidades anteriores, es decir, 200 y 96?, el
triple?, el cudruplo?,...
Solucin: (a) ( 989 '79, 1510 '21) (b) el cudruplo.

8. Decisin en ambiente de incertidumbre.

1. Se considera la siguiente tabla de beneficios:


e1 e2 e3
a1 50 30 20
a2 40 20 40
Elige la alternativa ptima segn los criterios de Laplace, Wald, Hurwicz (=1/2) y
Savage.
Solucin: Laplace=(a1, a2), Wald=(a1, a2), Hurwicz= a1, Savage= a2.

2. Disponemos de la siguiente tabla de decisin (con beneficios):


174
e1 e2 e3 e4
a1 65 110 70 90
a2 60 125 50 105
Tome la decisin ptima utilizando todos los criterios de decisin en ambiente de
incertidumbre (Para el criterio de Hurwicz use =2/3).
Solucin: Laplace= a2, Wald= a1, Hurwicz= a2, Savage= a1.

3. Disponemos de la siguiente tabla de decisin (con gastos):


e1 e2 e3 e4
a1 65 110 70 90
a2 60 125 50 105
Tome la decisin ptima utilizando todos los criterios de decisin en ambiente de
incertidumbre (Para el criterio de Hurwicz use =2/3).
Solucin: Laplace= a1, Wald= a1, Hurwicz= a2, Savage= a2.

4. Un inversor est ansioso por iniciar un nuevo negocio. Actualmente tiene tres posibilidades
y el beneficio que obtendr de cada una de ellas depende de su aceptacin por los
consumidores. Este inversor ha considerado para las condiciones del mercado tres posibles
estados y el beneficio que espera de cada posible alternativa es:
e1 e2 e3
a1 15 0 39
a2 18 21 21
a3 6 12 27
Qu decisin tomara utilizando los criterios de Wald, de Hurwicz (=2/3), de Savage y
de Laplace?
Solucin: Laplace= a2, Wald= a2, Hurwicz= a1, Savage= a3.

5. Un decisor con un ndice de optimismo de 0,4 dispone de tres alternativas entre las que
elegir, y que en funcin de la incertidumbre del entorno, le pueden proporcionar en una
situacin buena 150, 67 y 123 euros respectivamente, y en una situacin mala, 57, 93 y 76
euros respectivamente, cul de las alternativas debera elegir segn su ndice de
optimismo?
Solucin: a3 (94,8).

6. Una empresa est analizando tres posibles estrategias de futuro, las cuales a su vez
dependeran de la situacin econmica del pas. Las ganancias estimadas por la empresa
para cada estrategia son las siguientes:
Crecimiento Fuerte
Ralentizacin sostenido crecimiento
Estrategia 1 160 160 173
Estrategia 2 150 150 210
Estrategia 3 42 81 248

175
Establezca la estrategia que seguira la empresa segn adoptase los criterios de decisin de
Wald, Hurwicz (=0,8) o Savage.
Solucin: Wald=Estrategia 1(160), Hurwicz (=0,8)= Estrategia 3 (206,8), Savage=
Estrategia 2 (38, prdida de oportunidad).

7. Una empresa pretende comercializar un nuevo producto. La demanda que espera recibir
depende del precio de otro producto anlogo lanzado por una empresa competidora. La
empresa desea fijar su propio precio para lo que efecta una estimacin de la demanda que
conseguira captar en cada supuesto, conforme sean su precio y el de la competencia:
Precio competencia
n de unidades Alto Medio Bajo
demandadas
Propio precio

Alto 2100 1800 900


Medio 3700 3400 2500
Bajo 4500 3600 3000
Suponiendo que el coste unitario del producto es de 20, y que los precios se fijan en:
Alto: 40 Medio:30 Bajo: 24
Determine la decisin ptima y los beneficios que se podran conseguir utilizando los
distintos mtodos de decisin con incertidumbre (=0,6).
Solucin: Laplace: propio precio alto medio (beneficio=32000), Wald: propio precio
medio (beneficio=25000), Hurwicz(=0,6): propio precio alto (beneficio=32400),
Savage: propio precio medio (prdida de oportunidad=5000).

8. Una sociedad financiera quiere realizar una inversin de medio milln de euros
adquiriendo valores en bolsa para el prximo ejercicio econmico. Puede adquirir tres tipos
diferentes de valores: X, Y y Z. El precio para todos en el momento de realizar la inversin
es de 100 por ttulo. La sociedad financiera estima que al finalizar el ejercicio, los precios
de cotizacin de dichos ttulos pueden haber alcanzado diferentes valores segn haya sido
el comportamiento de la bolsa:
Subida moderada Subida selectiva Recesin Fuerte subida
Valor X 120 150 40 120
Valor Y 100 120 80 120
Valor Z 80 20 80 160
Estudie la decisin que adoptara segn el criterio de Hurwicz.
Solucin: Valor Y si <0,571428572, valor X si 0,571428572<<0,666666666 y valor Z
si 0,666666666<

9. La decisin de una empresa de lanzar un nuevo producto ha planteado la necesidad de


construir unas nuevas instalaciones que pueden ser de 600m2 o de 900m2. La decisin
sobre el tamao de la nueva planta depende de cmo vaya a reaccionar el mercado al nuevo

176
producto. La empresa considera que se pueden dar tres posibilidades en cuanto a la
demanda que derivaran en los siguientes rendimientos:
Demanda baja Demanda media Demanda alta
2
Planta con 600m 30 40 40
Planta con 900m2 10 40 100
Qu decisin tomara la empresa, si considera como criterio de decisin la prdida de
oportunidad que asume en su decisin?
Solucin: Planta con 900m2 (prdida de oportunidad: 20).

10. Una empresa agrcola considera la decisin de plantar soja, trigo o centeno. Los resultados
de la cosecha dependern del clima: seco, hmedo o lluvioso. Se estima que los
rendimientos netos en miles de euros para cada cultivo son los siguientes:
Seco Hmedo Lluvioso
Soja 96 56 -20
Trigo 40 60 30
Centeno 50 40 30
Indique cul sera el cultivo ms adecuado a los intereses de la empresa agrcola.
Solucin: Laplace: soja(44) , Wald: trigo(30) centeno(30), Hurwicz (=0,5): trigo(45) ,
Savage: centeno(46, prdida de oportunidad).

9. Decisin en ambiente de riesgo.

1. Considere la tabla de decisin con beneficios:


Probabilidades de los
0,25 0,25 0,25 0,25
estados de la naturaleza
e1 e2 e3 e4
a1 X 3 4 6
a2 2 2 2 4
a3 3 2 1 9
a4 6 6 1 3
donde X es un nmero real. Encuentre qu decisin debe ser tomada en funcin de X.
Solucin: Si X>3, elegira a1 (VME=4+(X-3)/4). Si X<3, elegira a4 (VME=4). Si X=3,
elegira a1 a4 (VME=4).

2. Una empresa estudia la posibilidad de lanzar un nuevo producto al mercado. Considera que
las probabilidades de que el producto tenga xito o no son del 70% y 30%,
respectivamente.
a) Obtenga la decisin ptima segn el VME y el POE, e indique ambos valores.
b) Cunto estara dispuesto a pagar por conocer el verdadero estado de la
naturaleza?
177
c) Cul es el beneficio esperado si se conoce el verdadero estado de la
naturaleza?
Beneficios xito Fracaso
Lanzar el producto A 4000 -1000
Lanzar el producto B 7000 -5000
Lanzar ambos 5000 -3000
No lanzar 0 0
Solucin: a) Lanzar B. VME=3400, POE=1500. b) 1500. c) 4900.

3. La siguiente tabla representa las prdidas de una operacin de adquisicin y posterior venta
de cuatro automviles:
Probabilidad 0,7 0,2 0,1
Mercado baja Mercado se mantiene Mercado aumenta
Automvil 1 20000 10000 5000
Automvil 2 85000 7000 0
Automvil 3 50000 15000 1000
Automvil 4 15000 15000 15000
a) Cul es la decisin ptima segn el VME y el POE? cuales son dichos
valores?
b) Cunto estara dispuesto a pagar por conocer el verdadero estado de la
naturaleza?
c) Cul es la prdida de oportunidad esperada si conoce el verdadero estado de la
naturaleza?
Solucin: a) Automvil 4. VME=15000, POE=3100. b) 3100. c) 0.

4. Una empresa est confeccionando su plan estratgico para la prxima dcada y dispone de
cuatro posibles estrategias de desarrollo comercial: autnomo, franquicias, red de agentes o
apertura de sucursales. Los beneficios previstos de estas cuatro estrategias en millones de
euros dependen de cuatro posibles situaciones econmicas y son los siguientes:
e1 e2 e3 e4
Autnomo 70 70 0 35
Franquicias 35 35 35 35
Red de agentes 0 140 0 0
Apertura de sucursales 35 105 0 0
Si las probabilidades de que se d cada una de las situaciones econmicas son
respectivamente: 0,30, 0,15, 0,35 y 0,20
a) Determine cul sera la estrategia adecuada para la empresa y el beneficio esperado.
b) Indique si resultara conveniente para la empresa tratar de mejorar su informacin
sobre la incertidumbre generada por el entorno, supuesto que el coste del equipo que
hara la investigacin de mercado durante seis meses fuera de veinte millones de euros.
Solucin: a) Autnomo, VME=38,5. b) Si, VIP=22,75>20.

178
5. Una distribuidora europea de un fabricante chino tiene que firmar un contrato de suministro
sobre la base de que el producto adquirido debe ser pagado a 130 la unidad, se venda o no
por la distribuidora, y la distribuidora lo vende a 225 la unidad. La demanda pude ser de
500, 600 o 700 unidades diarias (esas mismas cantidades son las que podran aparecer en el
contrato de suministro diario).
En los ltimos 50 das la distribuidora ha tenido las siguientes ventas que considera fiables
para la decisin a tomar:
Nmero de unidades vendidas 500 600 700
Nmero de das 15 30 5
a) A la vista de esta informacin, qu decisin debe tomar la empresa respecto del
nmero de unidades diarias a adquirir en la renovacin del contrato con el fabricante
chino? cul sera el valor monetario esperado?
b) Cul ser el lmite del coste correspondiente a la informacin adicional que
hipotticamente facilitara el nmero exacto de unidades diarias que demandara la
clientela a la distribuidora europea?
Solucin: a) 600 unidades/da, VME=50250. b) VIP=4850.

6. Un juego consiste en lanzar dos monedas simultneamente y apostar sobre el resultado. La


apuesta se realiza sobre la suma de cruces resultante del lanzamiento de ambas monedas. Si
el resultado del lanzamiento coincide con la apuesta del sujeto, este gana 10. Si el nmero
de cruces del lanzamiento supera al nmero de cruces de la apuesta, gana 5. En cualquier
otro caso, pierde 10.
a) Qu apuesta aconsejara al jugador? cul sera el valor monetario esperado?
b) Si el jugador tuviera dudas acerca de que las monedas estn cargadas, segn el criterio
de Savage, cmo debera apostar?
c) Si el camarero del casino donde se est apostando le filtra al jugador la informacin de
que las monedas estn trucadas para que salga cruz en un 75% de las ocasiones, qu
apuesta debera hacer? cul sera el valor monetario esperado?
Solucin: a) 0 cruces, VME=6,25. b) 0 cruces. c) 1 cruz, VME=5,9375.

7. Un agricultor compra semillas en paquetes por un valor de 5. Cada paquete sirve para
plantar una hectrea que produce 500kg de hortalizas. Cada kilo de hortalizas puede ser
vendido a 85 cntimos de euro en el mercado mayorista. El agricultor tiene arrendadas 20
hectreas por un total de 1000. Los salarios que tiene que abonar a temporeros para la
plantacin y recogida son de 165 por hectrea cultivada.
El agricultor tiene que decidir cuntas hectreas debe plantar, debido a que no tiene claro
que el mercado vaya a asumir toda su produccin. Las alternativas que se plantea son:

179
plantar de 15 a 20 hectreas. En el mercado mayorista le pueden hacer pedidos de 7, 8 , 9 o
10 toneladas.
a) Cuntas hectreas debera plantar, si el agricultor es una persona pesimista? qu
beneficios obtendra como mnimo?
b) Cuntas hectreas debera plantar, si el agricultor es una persona optimista? qu
beneficios obtendra como mximo?
c) Despus de recapacitar sobre los resultados anteriores, el agricultor piensa que el valor
ms probable de demanda del mercado ser de 8000kg, existiendo slo un 20% de
posibilidades de que alcance cada uno de los otros valores. Cuntas hectreas
entonces debera plantar? cul ser el valor monetario esperado?
d) Cunto podra ganar el agricultor si, manteniendo la anterior distribucin de
probabilidad, tuviera informacin que le permitiera conocer lo que le va a demandar el
mercado?
Solucin: a) 15ha, 2400. b) 20ha, 4100. c) 16ha, 17ha 18ha, 2910. d) VIP=340.

10. Decisin bayesiana.

1. Un ahorrador ha de decidir en qu tipo de fondo de inversin va a depositar su dinero.


Puede optar por un fondo de inversin muy agresivo, un fondo mixto que entraa un riesgo
moderado o decidirse por ttulos de renta fija. En funcin de la evolucin de los mercados
(buena, regular o mala) las ganancias que puede obtener con cada uno de los fondos son:
Evolucin buena Evolucin regular Evolucin mala
Fondo agresivo 140 56 -140
Fondo mixto 84 42 -28
Ttulos renta fija 56 35 7
La probabilidad estimada de que la evolucin de los mercados sea buena, regular o mala es,
respectivamente, de un 0,5, 0,3 y 0,2.
a) Cunto estara dispuesto a pagar, como mximo, por conocer la evolucin de los
mercados?
b) Suponga que el inversor puede recurrir a una consultora que pronostica bastante
acertadamente cul va a ser la marcha del mercado. Las probabilidades de si el
mercado sigue una determinada evolucin, este hecho haya sido pronosticado por la
consultora, estn recogidas en la siguiente tabla:

180
La consultora pronostica una evolucin
buena regular mala
Evolucin buena 0,7 0,2 0,1
Evolucin regular 0,2 0,8 0
Evolucin mala 0,1 0,3 0,6
Cul es el valor mximo de esta informacin?
Solucin: a) VIP=29,4. b) VII=13,44.

2. Una empresa desea lanzar un nuevo producto. Realiza estudios de mercado, obteniendo los
siguientes datos:
Proporcin de personas dispuestas a Probabilidad Resultados esperados en
adquirir el nuevo producto millones de euros
e1: 30% 0,1 15
e2: 20% 0,4 3,5
e3: 10% 0,3 -2,5
e4: 5% 0,2 -15
a) Segn los anteriores datos, decidira la empresa lanzar el producto?
Para reducir la incertidumbre, la empresa puede recibir informacin complementaria por
dos procedimientos:
I. Realizar un estudio de mercado con un coste de medio milln de euros, cuyos posibles
resultados seran:
c1: la proporcin de clientes estar comprendida entre el 20% y el 35%.
c2: la proporcin de clientes estar comprendida entre el 10% y el 20%.
c3: la proporcin de clientes ser inferior al 10%.
Con datos de productos anlogos se han valorado las correspondientes verosimilitudes:
Estudio de mercado
P 1 P 2 P
c c c3
Estados ei ei ei
e1: 30% 0,7 0,3 0
e2: 20% 0,45 0,45 0,1
e3: 10% 0 0,5 0.5
e4: 5% 0 0,1 0,9

II. Utilizar un panel de consumidores, con coste 275000, que ofrece los siguientes
resultados:
c1* : la proporcin de clientes ser superior al 30%.

c2* : la proporcin de clientes estar comprendida entre el 20% y el 30%.

c3* : la proporcin de clientes estar comprendida entre el 10% y el 20%.

c4* : la proporcin de clientes ser inferior al 10%.

181
Panel de consumidores
c
*
c2* c3* c4*
P 1
P e P e P e
Estados ei i i i
e1: 30% 0,5 0,4 0,1 0
e2: 20% 0,2 0,5 0,2 0,1
e3: 10% 0,1 0,2 0,45 0,25
e4: 5% 0 0,1 0,25 0,65
b) Si lo lanzara, cmo lo hara, con un estudio de mercado o con el panel de
consumidores? cul sera el beneficio esperado?
Solucin: a) No lanzara el nuevo producto. b) Con un estudio de mercado, 1585000.

3. Una empresa de consultora desea incorporar un nuevo consultor a su departamento de


ingeniera. Despus de realizar los primeros filtros, llega a la seleccin final de dos
candidatos, los cuales tienen diferente perfil. Segn se desarrollen uno de los tres proyectos
industriales cuya aprobacin est pendiente en estos momentos, pueden ser ms o menos
necesarios.
El coste para la empresa de consultora depender de si se concretan o no estos proyectos y
de lo que tendra que pagarles para retenerles y que no se fueran a otra empresa de la
competencia. Los costes en euros seran:
Proyecto S Proyecto T Proyecto U
Candidato X 160000 225000 80000
Candidato Y 70000 250000 170000
a) Si el Director de Recursos Humanos tuviese un grado de optimismo del 80% en
relacin al desarrollo de los proyectos, cul sera el candidato ms adecuado y el
coste asociado?
b) Cul sera el candidato adecuado si se utiliza el criterio de Savage? cul sera la
prdida de oportunidad?
c) Suponga que el Director de Recursos Humanos estima que las probabilidades de que
se den cada uno de los proyectos anteriores (S, T o U) son respectivamente 0,25, 0,60 y
0,15. Cul sera en este caso el candidato idneo y el coste monetario esperado?
d) El Director Financiero puede aportar un informe econmico en relacin a la situacin
econmica que va a vivir el pas. Se sabe que si se aprobara la realizacin del
proyecto S, la situacin del pas sera buena con una probabilidad del 85%; si se
aprobara el proyecto T, la situacin del pas sera buena con una probabilidad de 65%
y si se aprobara el proyecto U, la situacin del pas sera mala con una probabilidad del
80%. Segn el informe econmico que presente el Director Financiero, cul sera el
candidato que se debera contratar y el coste monetario esperado en cada caso?

182
e) Qu valor, como mximo, se le puede otorgar a la informacin contenida en el
informe econmico?
Solucin: a) Y, 106000. b) X o Y, 90000. c) X, 187000. d) Si se prev una situacin
econmica buena: Y, 185731,23. Si se prev una situacin econmica mala: X,
171020,41. d) VII=6675.

4. Un empresario est plantendose el futuro de su negocio, y ha considerado la posibilidad


de ampliarlo, acometer una reforma modesta, dejarlo como est o venderlo. La evolucin
de la demanda del sector podra ser alta, media o baja. En funcin de la evolucin de la
demanda, las ganancias que piensa que puede obtener con cada una de las alternativas
descritas son las siguientes:
Ampliar negocio Reformar negocio No modificarlo Venderlo
Demanda alta 210 140 105 140
Demanda media 84 154 126 140
Demanda baja 35 70 168 140
La probabilidad estimada de que la demanda sea alta, media o baja es, respectivamente,
0,2, 0,3 y 0,5.
a) Cunto estara dispuesto a pagar el empresario, como mximo, por conocer la
evolucin de la demanda?
b) Supongamos que el empresario puede recurrir a un estudio de mercado que le informe
acerca de la evolucin futura de la demanda. La probabilidad de que si la demanda va
a ser alta o media, este hecho haya sido pronosticado por el estudio de mercado , es de
0,8, repartindose por igual la probabilidad de error en las otras dos posibilidades. Si la
demanda va a ser baja, es seguro que lo habr pronosticado as. Cul ser , como
mximo, el valor de la anterior informacin? qu accin tomara el empresario en
funcin del informe?
Solucin: a) VIP=29,4. b) VII=22,96. Si el informe es demanda alta, ampliara el negocio.
Si el informe es demanda media, lo reformara. Si el informe es demanda baja, lo dejara
como est. En ningn caso lo vendera.

5. Antes de que se inicie la final de la Champions League, Real Madrid-Barcelona FC, un


grupo de hinchas del Real Madrid que estn en un bar tienen que decidir si participan o no
en una apuesta organizada por el dueo del local. El juego propuesto consiste en una
apuesta de 50, con un premio de 150 si aciertan quin ganar. Los expertos estn
divididos y piensan que los dos equipos tienen las mismas posibilidades de ganar.
a) Les interesara apostar a su equipo en el juego que les propone el dueo del bar?

183
Antes de tomar la decisin, deciden consultar a unos muy buenos aficionados al futbol,
quienes a cambio de ser invitados a una ronda de cerveza (10) estaran dispuestos a
decirles su opinin sobre el resultado del partido. Otro cliente del bar les avisa que los
citados aficionados son muy proclives a que ganar el Real Madrid y que cuando gana el
Barcelona FC slo aciertan en un 70% de las ocasiones, mientras que cuando gana el Real
Madrid suelen acertar en un 90% de las veces.
b) Les interesara pagar la ronda de cerveza para conocer la opinin de los aficionados?
Solucin: a) S. VME=25>0. b) S. VII=12,5>10.

6. Una empresa de servicios de una zona montaosa est considerando la posibilidad de


invertir en una mquina quitanieves para el prximo invierno. La empresa ha analizado la
situacin cuidadosamente y cree que si nieva mucho el prximo invierno se tratara de una
inversin rentable, considera que podra obtener una pequea rentabilidad si la nieve es
moderada, pero perdera dinero si las nevadas son dbiles. Concretamente, la empresa
prev un beneficio de 42000 si las nevadas son fuertes, 12000 si son moderadas y una
prdida de 50000 si las nevadas son dbiles.
Segn el pronstico del instituto de meteorologa, las probabilidades de que se produzcan
nevadas fuertes, moderadas o dbiles son 0,5, 0,3 y 0,2, respectivamente.
a) Cul es la mejor decisin que podra adoptar la empresa? cules seran los beneficios
esperados?
b) Supongamos que la empresa decide esperar para poder conocer las temperaturas
vividas a mediados de diciembre, antes de tomar la decisin final. La probabilidad de
que el mes de diciembre sea fro cuando van a haber fuertes nevadas es de 0,8,
mientras que cuando las nevadas van a ser moderadas es de 0,5 y cuando sern dbiles
es de 0,4. Si la empresa se encuentra con que diciembre no es fro, cul sera la
decisin recomendada? qu beneficios esperara?
Solucin: a) Comprar el quitanieves, VME=14600. b) Indiferente comprar o no el
quitanieves. VME=0.

7. El ayuntamiento de una ciudad est considerando la posibilidad de reemplazar la flota de


autobuses municipales por una red de tranvas. El concejal que defiende la idea, indica que
la ciudad se ahorrar 7 millones de euros anuales en gasleo, contra un gasto de un milln
en electricidad. No obstante, si la idea se pone en marcha y los ciudadanos no usan
suficientemente los tranvas, habra que volver a usar los autobuses con un coste por las
obras de seis millones de euros.

184
Segn experiencias ocurridas en otras ciudades hay una probabilidad 0,50 de que los
ciudadanos sigan usando los tranvas igual que usaban los autobuses, una probabilidad
0,30 de que disminuya en un 20% la utilizacin del nuevo transporte, en cuyo caso el
ahorro de energa es igual a la prdida en la recaudacin por viajeros y una probabilidad
0,20 de que disminuya ms del 20%, en cuyo caso habra que poner en marcha de nuevo
los autobuses y habran unas prdidas iguales al coste de las obras realizadas.
El Ayuntamiento finalmente acuerda incorporar al estudio la posibilidad de realizar un
programa piloto que consiste en poner en marcha un tranva durante seis meses. El coste de
este programa piloto sera de 350000. Basndose en la experiencia de otras ciudades que
han realizado programas piloto similares, se ha efectuado una estimacin emprica del
resultado de dicho programa. En la siguiente tabla se recogen las probabilidades de cada
resultado del programa piloto condicionadas a cada resultado obtenido con los nuevos
tranvas:
Resultados segn el programa piloto
Igual utilizacin Disminuye un Disminuye ms del
20% la utilizacin 20% la utilizacin
Igual utilizacin
0,65 0,25 0,10
Resultados reales que se
obtendran con los Disminuye un 20%
la utilizacin
0,35 0,35 0,30
nuevos tranvas
Disminuye ms del
20% la utilizacin
0,15 0,45 0,40
Qu decisin debera tomar el Ayuntamiento si desea maximizar el ahorro? Cul sera el
ahorro esperado?
a) Si no se hace el programa piloto.
b) Si segn el programa piloto habr un 20% menos de utilizacin del transporte.
Solucin: a) Cambiar los autobuses por tranvas. VME=1,8 millones de euros. b) Cambiar
los autobuses por tranvas. VME= 656250-350000.

185
FORMULARIO de MUESTREO
(95% de confianza, zc = 1,96 2 )
(90% de confianza, zc = 1,645 )
(99% de confianza, zc = 2,576 )
MUESTREO ALEATORIO SIMPLE EN POBLACIONES INFINITAS.

MEDIA PROPORCION

1 n 1 n
ESTIMADOR y= yi
n i =1
p= yi ,
n i =1
yi = 0, 1

VARIANZA
1 n
( ) 1 n 2 1 n
( )
2 2
yi y yi y
2
MUESTRAL s2 = = yi y s2 = = pq
(apenas se utiliza en muestreo) n i =1 n i =1 n i =1

2
n
n yi
yi2 i =1
CUASIVARIANZA n pq
1 n
( ) n 1 n
( )
2
yi y
2
MUESTRAL S2 = yi y
n 1 i =1
= i =1
n 1
S2 =
n 1 i =1
=
n 1

VARIANZA DEL S2 pq
V ( y) = V ( p) =
ESTIMADOR n n 1

B
S pq
LIMITE DEL ERROR zc V ( y ) = zc zc V ( p ) = z c
DE ESTIMACIN n n 1

INTERVALO DE S S pq pq
CONFIANZA y zc , y + zc p zc , p + zc
n n n 1 n 1

2 2 B2 pq pq B2
TAMAO MUESTRAL n= = D= 2 n= 2 = D= 2
B2 D zc B D zc
zc2 2
zc

186
MUESTREO ALEATORIO SIMPLE EN POBLACIONES FINITAS.

MEDIA PROPORCION
TOTAL TOTAL

1 n 1 n
y= yi
n i =1
p= yi
n i =1
yi = 0, 1
ESTIMADOR

= N p
n
N
= N y =
n
y
i =1
i

S2 N n pq N n
V ( y) = V ( p) =
n N n 1 N
VARIANZA DEL
ESTIMADOR
pq
2
S
V ( ) = N 2 V ( y ) = N ( N n) V ( ) = N 2 V ( p ) = N ( N n)
n n 1

B zc V ( y ) zc V ( p )
LIMITE DEL ERROR
DE ESTIMACIN
zc V ( ) = Nzc V ( y ) zc V ( ) = Nzc V ( p )

(y z c V ( y ) , y + zc V ( y ) ) (p z c V ( p ) , p + zc V ( p ) )
INTERVALO DE
CONFIANZA ( z V ( ) , + z V ( ) ) =
c c ( z c )
V ( ) , + zc V ( ) =

= ( N ( y z V ( y ) ) , N ( y + z V ( y ) ))= ( N ( p z
c c c ) (
V ( p ) , N p + zc V ( p ) ))

N 2 n=
Npq
n=
( N 1) D + 2 ( N 1) D + pq

B2 B2
TAMAO D= 2 (media ) D= ( proporcion)
MUESTRAL zc zc2
B2 B2
D= 2 2 (total ) D= (total )
zc N zc2 N 2

187
MUESTREO ALEATORIO ESTRATIFICADO: ESTIMACIN.

MEDIA PROPORCION
TOTAL TOTAL

L L L L
1 Ni 1 Ni
y st =
N
N y = N
i =1
i i
i =1
yi p st =
N
N
i =1
i pi =
i =1 N
pi
ESTIMADOR
L L
st = N y st = N i y i st = N p st = Ni pi
i =1 i =1

L L
1 1
V ( y st ) =
N2
Ni2 V ( y i ) =
i =1
V ( p st ) =
N2
N
i =1
i
2
V ( pi ) =

1 L
Si2 N i ni L
p i q i N i ni
=
N2
Ni2
i =1 ni N i
= =
1
N2
Ni2ni 1 N i
=
i =1
VARIANZA DEL
N S N n
2
N i p i q i N i ni
L 2 L 2
ESTIMADOR = i i i i =
i =1 N ni Ni i =1 N ni Ni
N i ni N i ni
1 en poblaciones infinitas 1 en poblaciones infinitas
Ni Ni

L
S2 N n
V ( st ) = N 2 V ( y st ) = Ni2 i i i L
p q N n
i =1 ni Ni V ( st ) = N 2 V ( p st ) = N i2 i i i i
i =1 ni 1 N i

188
MUESTREO ALEATORIO ESTRATIFICADO: ASIGNACIN MUESTRAL.
POBLACIONES FINITAS.
MEDIA PROPORCION
TOTAL TOTAL
(error fijo B) (error fijo B)
L L
Ni i L L
pi qi
Ni i ci
i =1
i =1 ci
Ni pi qi ci N i
ci
i =1 i =1
n= L
n= L
N 2 D + N i i2 N 2 D + N i pi qi
i =1 i =1

(coste fijo C) (coste fijo C)


L
N i i L
pi qi
ASIGNACIN C C Ni
PTIMA i =1 ci i =1 ci
n= L
n= L

N
i =1
i i ci N
i =1
i pi qi ci

N j j pjq j
Nj
cj cj
j = j =
L
N i i L
ci N i
pi qi
i =1 i =1 ci

( N )L

i i
2
( N L

i pi qi ) 2

n= i =1
L
n= i =1
L
N 2 D + N i i2 N 2 D + N i pi qi
ASIGNACIN DE i =1 i =1

NEYMAN
N j j N j p jqj
(error fijo B) j = L j = L
N
i =1
i i N i pi qi
i =1

L L

Ni i2 N pq i i i
n= i =1
L
n= i =1
L
ASIGNACIN 1 1
PROPORCIONAL
ND +
N
Ni i2
i =1
ND +
N
N pq
i =1
i i i

(error fijo B)
Nj Nj
j = j =
N N
B2 B2
D= 2 (media ) D= 2 ( proporcion)
zc zc
D B2 B2
D= 2 2 (total ) D= 2 2 (total )
zc N zc N

189
MUESTREO ALEATORIO ESTRATIFICADO: ASIGNACIN MUESTRAL.
POBLACIONES INFINITAS. Pesos de los estratos conocidos: Wi ( Ni / N )
MEDIA PROPORCION
(error fijo B) (error fijo B)
L L
i L L
pi qi
Wi i ci
i =1
W i =1
i
ci
W i pi qi ci W i
ci
i =1 i =1
n= n=
D D

(coste fijo C) (coste fijo C)


L
i L
pi qi
C Wi C Wi
i =1 ci i =1 ci
ASIGNACIN n= L
n= L
PTIMA W
i =1
i i ci W
i =1
i pi qi ci

j p jqj
Wj Wj
cj cj
j = j =
L
i L
W
i =1
i
ci W i
pi qi
ci
i =1

(W )
L

i i
2
(W L

i pi qi )
2

n= i =1
n= i =1

D D
ASIGNACIN DE
NEYMAN
Wj j Wj pjq j
(error fijo B) j = L j = L
W
i =1
i i W i pi qi
i =1

L L

W i i
2
W i pi qi
n= i =1
n= i =1

ASIGNACIN D D
PROPORCIONAL
(error fijo B)
j = Wj j = Wj

B2 B2
D D= (media ) D= ( proporcion)
zc2 zc2

190
ESTIMACIN DE RAZN.

MEDIA
RAZN
TOTAL

y = rx
n

y i
y
ESTIMADOR r= i =1
n
=
x
x i
i =1 y = r x

1 n
S r2 = ( yi rxi )
2
VARIANZA
RESIDUAL n 1 i =1

N n S r2
V ( y ) = x2 V (r ) =
N n
VARIANZA DEL 1 N n Sr2 1 N n Sr2
ESTIMADOR V (r ) =
x2 N n x 2 N n
2 N n Sr
2
x2 Sr2
V ( y ) = x V (r ) = N
2

N n x2 n

N r2 2
n= r = Sr2 de una muestra previa
ND + r2
r2
n= en poblaciones infinitas
TAMAO D
MUESTRAL
B 2 x2
D= ( para estimar R)
zc2
B2
D= ( para estimar y )
zc2
B2
D= 2 2 ( para estimar y )
zc N

191
ESTIMACIN DE REGRESIN.

MEDIA
TOTAL

1 n
( ) 1 n 2
2
xi x
2
sx2 = = xi x (anlogamente para la variable Y)
n i =1 n i =1
VARIANZA, COVARIANZA Y
COEF. DE CORRELACIN
MUESTRALES
1 n
sxy = xi x
n i =1
( )( yi y = ) 1 n
xi yi x y
n i =1

sxy2
r =
2
xy
sx2 s y2

( x x )( y )
n

i i
y
sxy
yL = y + b( x x) b= = i =1

( x x)
n
ESTIMADOR sx2 2

i
i =1

yL = N yL

n 2 s xy
( ( ))
2

s y (1 rxy2 )
1 n 2 n 2
VARIANZA RESIDUAL S =
2
yi y + b( xi x)
n 2 i =1
= sy 2
n 2
=
n2
L
sx

ERROR TPICO DE S L = S L2
ESTIMACIN

N n S L2
V ( yL ) =
VARIANZA DEL N n
ESTIMADOR
V ( yL ) = N 2 V ( yL )

N L2 2
n= L = S L2 de una muestra previa
ND + L2
TAMAO MUESTRAL
L2
n= en poblaciones infinitas
D

B2 B2
D= ( para estimar y ) D= ( para estimar y )
zc2 zc2 N 2

192
ESTIMACIN DE DIFERENCIA.

MEDIA
TOTAL

yD = y + ( x x) = x + d d = yx
ESTIMADOR
yD = N yD

1 n
( ) 1 n
( )
2 2
VARIANZA RESIDUAL S D2 = yi ( xi + d )
n 1 i =1
= di d
n 1 i =1
di = yi xi

N n S D2
V ( yD ) =
VARIANZA DEL N n
ESTIMADOR
V ( yD ) = N 2 V ( yD )

N D2 2
n= D = S D2 de una muestra previa
ND + D2
TAMAO MUESTRAL D2
n= en poblaciones infinitas
D

B2 B2
D= ( para estimar y ) D= ( para estimar y )
zc2 zc2 N 2

193
MUESTREO POR CONGLOMERADOS.

MEDIA o PROPORCIN
TOTAL
TOTAL (M conocido)
n

y i
=y= i =1
n

ESTIMADOR m i t = N y t t
y =
1 n
yi
i =1 n i =1

= M y

1 N n Sc2
V ( y) = 2
M N n S 2

VARIANZA V ( t ) = N 2 V ( y t ) = N ( N n) t
n
DEL S 2

ESTIMADOR V ( ) = M 2 V ( y ) = N ( N n) c
n

( ) (y )
n n
1 2 1 2
Sc2 = yi ymi St2 = yt
n 1 n 1
i
i =1 i =1

N c2 2 N t2 2
n= c = Sc2 de una muestra previa n= t = St2 de una muestra previa
ND + c2 ND + t2
TAMAO c2 t2
MUESTRAL n= en poblaciones infinitas n= en poblaciones infinitas
D D

2
B2 M
D= (media) B2
zc2 D= (total )
2
zc2 N 2
B
D= (total )
z N2
2
c

NOTACIN:
N = conglomerados en la poblacin (habitualmente conocido) n = conglomerados en la muestra
mi = elementos en el conglomerado i yi = suma de las observaciones del conglomerado i
N
M = mi = elementos en la poblacin (habitualmente desconocido)
i =1
n
m = mi = elementos en la muestra
i =1

1 N M
M=
N i =1
mi =
N
= tamao medio de los conglomerados de la poblacin (habitualmente desconocido)

1 n m
m = mi = = tamao medio de los conglomerados de la muestra . Este valor m se usa para estimar el anterior, M .
n i =1 n

194
MUESTREO CON PROBABILIDADES DESIGUALES.
MEDIA, PROPORCIN y TOTAL
PROBABILIDADES DE i = p( s) ij = p ( s )
INCLUSIN s i s i & j

1
di =
PESOS MUESTRALES i
PROBABILIDADES DE
xi
INCLUSIN EN UN i = n
DISEO PPT x
PROBABILIDADES DE
n n n 1
INCLUSIN EN M. A. i = ij =
SIMPLE N N N 1

nh
i = si el individuo i pertenece al estrato h.
Nh
PROBABILIDADES DE
nh nh 1
INCLUSIN EN M. A. N si ambos individuos i y j pertenecen al estrato h.
ESTRATIFICADO Nh 1
ij = h
nh nk
si el individuo i pertenece al estrato h, y el individuo j al estrato k
N h Nk
n
1 yi
y HT =
N

i =1 i
n
1 yi
ESTIMADOR DE TIPO
HORVITZ-THOMPSON
p HT =
N

i =1
yi = 0 o yi = 1
i
n
yi
HT = N yHT = N p HT =
i i =1

1 n y 2 n n ij i j yi y j
2
VHT ( yHT ) = 2 (1 i ) + 2 i

N i =1 N i =1 j >i ij i j
i
2

2
1 n n i j ij yi y j
VSYG ( yHT ) = 2
N i =1 j >i ij i j
VARIANZA DEL
ESTIMADOR DE
HORVITZ-THOMPSON n
n
yi2 n
i j yi y j
VHT (HT ) = N VHT ( yHT ) = (1 i ) 2 + 2
2 ij

i =1 i i =1 j > i ij i j
2
n
n
y yj
VSYG (HT ) = N 2VSYG ( yHT ) = i
i j ij

i =1 j >i ij i j

n n
1 yi 1
yH =
N
i =1
N =
i =1 i
i
n
1 yi
ESTIMADOR DE TIPO
HJEK
pH =
N
i =1
yi = 0 o yi = 1
i
n
N yi
H = N yH =
N
i =1 i

195
N n n 1 n
VJ ( yH ) = ( yH (i ) yH )
2

N n i =1
1 yj 1
VARIANZA DEL
yH ( i ) =
N js , j i j
, N (i ) =
js , j i j
(i )
ESTIMADOR DE
HJEK
N n n 1 n
VJ (H ) = N 2VJ ( yH ) = ( H (i ) H )
2

N n i =1
N yj 1
H (i ) =
N js , j i j

, N (i ) =
js , j i j
(i )

VARIANZA DE UN
() 1 B
( ) 1 B
2
ESTIMADOR VB = (b ) B
B 1 b =1
; B = (b )
B b =1
USANDO BOOTSTRAP

196
ESTIMACIN DEL TAMAO DE LA POBLACIN

MUESTREO DIRECTO MUESTREO INVERSO

t = elementos marcados
NOTACIN n = total de elementos en la muestra de recaptura
s = elementos marcados en la muestra de recaptura

t nt t nt
N= = N= =
ESTIMADOR p s p s

( )
E N =N+
N (N t)
nt
( )
E N =N
PROPIEDADES DEL
ESTIMADOR
( )
V N =
t 2 n( n s ) ( )
V N =
t 2 n( n s )
s 2 ( s + 1)
s3

197
ESTIMACIN DEL TAMAO DE LA POBLACIN

MUESTREO POR CUADROS

DENSIDAD TOTAL

A = rea total
a = rea de cada cuadro
NOTACIN n = nmero de cuadros en la muestra
m = nmero medio de elementos por cuadro en la muestra

m M = A
ESTIMADOR =
a

A2
() ( ) ( )
VARIANZA DEL
ESTIMADOR V =
V M =AV =
2

an an

CUADROS CARGADOS

DENSIDAD TOTAL

A = rea total
a = rea de cada cuadro
NOTACIN n = nmero de cuadros en la muestra
y = nmero total de cuadros no cargados

1 y A y
ESTIMADOR = ln M = A = ln
a n a n

VARIANZA DEL
ESTIMADOR ( ) 1 n y
V = 2
a ny ( ) ( )
A2 n y
V M = A2 V = 2
a ny

198