You are on page 1of 12

% Copyright 2004 by Till Tantau <tantau@users.sourceforge.net>.

%
% In principle, this file can be redistributed and/or modified under
% the terms of the GNU Public License, version 2.
%
% However, this file is supposed to be a template to be modified
% for your own needs. For this reason, if you use this file as a
% template and not specifically distribute it as part of a another
% package/program, I grant the extra permission to freely copy and
% modify this file as you see fit and even to delete this copyright
% notice.

\documentclass{beamer}

% There are many different themes available for Beamer. A comprehensive


% list with examples is given here:
% http://deic.uab.es/~iblanes/beamer_gallery/index_by_theme.html
% You can uncomment the themes below if you would like to use a different
% one:
%\usetheme{AnnArbor}
%\usetheme{Antibes}
%\usetheme{Bergen}
%\usetheme{Berkeley}
%\usetheme{Berlin}
%\usetheme{Boadilla}
%\usetheme{boxes}
%\usetheme{CambridgeUS}
%\usetheme{Copenhagen}
%\usetheme{Darmstadt}
%\usetheme{default}
%\usetheme{Frankfurt}
%\usetheme{Goettingen}
%\usetheme{Hannover}
%\usetheme{Ilmenau}
%\usetheme{JuanLesPins}
%\usetheme{Luebeck}
\usetheme{Madrid}
%\usetheme{Malmoe}
%\usetheme{Marburg}
%\usetheme{Montpellier}
%\usetheme{PaloAlto}
%\usetheme{Pittsburgh}
%\usetheme{Rochester}
%\usetheme{Singapore}
%\usetheme{Szeged}
%\usetheme{Warsaw}

\title{Muestreo estratificado adaptativo por conglomerados}

% A subtitle is optional and this may be deleted


\subtitle{}

\author{Jose Luis Duarte Pastrana}


% - Give the names in the same order as the appear in the paper.
% - Use the \inst{?} command only if the authors have different
% affiliation.

\institute[] % (optional, but mostly needed)


{
Universidad de C�rdoba\\
Ciencias B�sicas \\
Estad�stica

\vspace{0.2cm}

21 de Abril de 2020

\vspace{0.4cm}
\includegraphics[width=2cm]{logo-universidad-de-cordoba.png}

\date{}

\subject{Theoretical Computer Science}


% This is only inserted into the PDF information catalog. Can be left
% out.

% If you have a file called "university-logo-filename.xxx", where xxx


% is a graphic format that can be processed by latex or pdflatex,
% resp., then you can add a logo as follows:

% \pgfdeclareimage[height=0.5cm]{university-logo}{university-logo-filename}
% \logo{\pgfuseimage{university-logo}}

% Delete this, if you do not want the table of contents to pop up at


% the beginning of each subsection:
\AtBeginSubsection[]
{
\begin{frame}<beamer>{Contenido}
\tableofcontents[currentsection,currentsubsection]
\end{frame}
}

% Let's get started


\begin{document}

\begin{frame}
\titlepage
\end{frame}

\begin{frame}{Contenido}
\tableofcontents
% You might wish to add the option [pausesections]
\end{frame}

% Section and subsections will appear in the presentation overview


% and table of contents.
\section{Definici�n}

\begin{frame}{Definici�n}

\begin{block}
En el muestreo estratificado de conglomerados adaptativos, se selecciona una
muestra estratificada inicial de una poblaci�n, y cada vez que se observa que el
valor de la variable de inter�s para cualquier unidad satisface una condici�n
espec�fica, se agregan unidades adicionales del vecindario de esa unidad a la
muestra. Se pueden agregar a�n m�s unidades a la muestra si a su vez alguna de las
unidades agregadas cumple posteriormente la condici�n.
\end{block}
\end{frame}

\begin{frame}{Definici�n}
\begin{flushleft}

\begin{block}

Los dise�os de muestreo de conglomerados adaptativos estratificados son importantes


desde un punto de vista pr�ctico porque para muchas poblaciones existe informaci�n
previa sobre la cual se puede basar una estratificaci�n inicial y, sin embargo, no
se puede predecir la distribuci�n exacta o los patrones de concentraci�n de la
poblaci�n.
\end{block}
\end{flushleft}
\end{frame}

\section{Dise�os}

\begin{frame}{Dise�os}
\begin{block}

\begin{flushleft}

la poblaci�n se divide en estratos $L$, de los cuales el estrato $h$ est� compuesto
de unidades $N_{h}$, y el n�mero total de unidades en la poblaci�n se denota $N$.
Asociado con la unidad $u_{hi}$, la unidad $i$-�sima de estrato $h$, es una
variable de inter�s $y_{hi}$. Para cualquier unidad $u_{hi}$ de la poblaci�n, el
vecindario de la unidad $u_{hi}$ se define como una colecci�n de unidades que
incluye $u_{hi}$ y con la propiedad de que si la unidad $u_{h'i'}$ est� en el
vecindario de la unidad $u_{hi}$, entonces la unidad $u_{hi}$ est� en el vecindario
de la unidad $u_{h'i'}$. El vecindario de una unidad puede incluir unidades de m�s
de un estrato. Se dice que una unidad $u_{hi}$ satisface la condici�n de inter�s si
el valor $y$ asociado con esa unidad est� en un conjunto espec�fico $C$.

\end{flushleft}
\end{block}

\end{frame}

\begin{frame}{Dise�os}

\begin{flushleft}
\begin{block}

En los dise�os considerados en este cap�tulo, se selecciona una muestra inicial de


unidades de una poblaci�n mediante muestreo aleatorio estratificado; es decir,
dentro del estrato $h$, se selecciona una muestra aleatoria simple de unidades
$n_{h}$ sin reemplazo, las selecciones para estratos separados se hacen de forma
independiente. Cada vez que una unidad seleccionada cumple la condici�n, todas las
unidades en su vecindario que no est�n en la muestra se agregan a la muestra. Se
pueden agregar a�n m�s unidades a la muestra siempre que cualquiera de las unidades
agregadas adicionalmente satisfaga la condici�n, de modo que la muestra final
contenga todas las unidades cercanas a cualquier unidad de muestra que satisfaga la
condici�n.
\end{block}
\end{flushleft}

\end{frame}

\begin{frame}{Dise�os}

\begin{flushleft}
\begin{block}

Un ejemplo se ilustra en la figura 1, en la cual el objeto es estimar la abundancia


de una poblaci�n agrupada, es decir, las unidades totales de �rea cruzada de los
n�meros y de objetos puntuales dentro de cada unidad. El objeto puntual podr�a, por
ejemplo, representar la ubicaci�n de una planta o animal. Una unidad cumple la
condici�n aqu� si contiene uno o m�s objetos puntuales, es decir, $y \geq 1$. La
poblaci�n se divide en dos estratos y una muestra aleatoria simple de cinco
unidades seleccionadas de cada estrato.
\end{block}
\end{flushleft}

\end{frame}

\begin{frame}{Figura 1}
\begin{center}
\includegraphics[width=10cm]{Figura1.png}
\end{center}

\end{frame}

\begin{frame}{Descripci�n de la figura 1}

\begin{block}

\begin{itemize}
\item Se muestra en la figura 1 el vecindario de una unidad consiste en esa unidad
junta.

\vspace{0.5cm}

\item Muestra aleatoria estratificada inicial de cinco unidades en cada uno de los
dos estratos. Cada vez que una unidad en la muestra contiene uno o m�s de los
objetos puntuales, las unidades adyacentes se agregan a la muestra.

\end{itemize}
\end{block}
\end{frame}

\begin{frame}{Dise�o}

\begin{block}

La poblaci�n puede dividirse en $K$ conjuntos de unidades, denominadas redes, de


modo que la selecci�n en la muestra inicial de cualquier unidad en una red dar�
como resultado la inclusi�n en la muestra final de todas las unidades en esa red.
Una unidad que no cumple la condici�n pertenece a una red que consiste solo de s�
misma. La selecci�n inicial de una unidad que satisfaga la condici�n t�picamente
resultar� en la adici�n a la muestra no solo de todas las otras unidades en su red,
sino tambi�n de unidades que no est�n en su red, es decir, unidades que no
satisfacen la condici�n pero est�n cerca de uno o m�s miembros de la red.
\end{block}

\end{frame}

\begin{frame}{Dise�o}

\begin{block}

En la figura 2, las redes interceptadas por la muestra inicial se resumen en l�neas


gruesas. Las otras unidades en la muestra, las unidades de borde, no satisfacen la
condici�n y no estaban en la muestra inicial, pero est�n cada una cerca de una o
m�s unidades que satisfacen la condici�n en las redes que se cruzan con la muestra
inicial.

\end{block}
\end{frame}

\begin{frame}{Dise�o}

\begin{block}

El n�mero de veces que se selecciona una unidad es igual al n�mero de unidades de


su red o de una red que intercepta su vecindario que se seleccionan en la muestra
inicial. Deje que $r_{hi}$ represente el n�mero de veces que se selecciona esa
unidad $u_{hi}$. Deje que $m_{khi}$ denote el n�mero de unidades en la intersecci�n
del estrato $k$ con la red que contiene la unidad $u_{hi}$. Para una unidad $u_{hi}
$ que no cumple la condici�n, dejemos que $a_{khi}$ sea el n�mero total de unidades
en la intersecci�n del estrato $k$ con la colecci�n de distintas redes, exclusivas
de $u_{hi}$, que se cruzan con el vecindario de la unidad $u_{hi}$. La selecci�n
inicial de cualquiera de estas unidades $a_{khi}$ dar� como resultado la adici�n de
la unidad $u_{hi}$ a la muestra. Defina $a_{khi}$ como cero para cualquier unidad
$u_{hi}$ que satisfaga la condici�n.

\end{block}
\end{frame}

\begin{frame}{Figura 2}
\begin{center}
\includegraphics[width=7cm]{Figura2.png}
\end{center}

\begin{itemize}
\item La figura 2 muestra final resultante de la muestra inicial de la figura 1.
Tenga en cuenta que algunas unidades en el estrato 2 (derecha) se incluy� en la
muestra como resultado de una selecci�n inicial en el estrato 1.
\end{itemize}
\end{frame}

\begin{frame}{Figura 3}

\begin{center}
\includegraphics[width=7cm]{Figura3.png}
\end{center}

\begin{itemize}
\item Las distintas redes interceptadas por la muestra inicial se delinean con
l�neas en negrita.
\end{itemize}

\end{frame}

\begin{frame}{Dise�os}

\begin{block}

\begin{flushleft}
El n�mero esperado de veces que se selecciona la unidad $u_{hi}$ es
\end{flushleft}

\begin{center}

\[
E(r_{hi}) = \sum_{k=1}^{L} n_{k}\frac{m_{khi} \hspace{0.1cm} + \hspace{0.1cm}
a_{khi}}{N_{k}}
\]
\end{center}

\begin{flushleft}
La unidad $u_{hi}$ se incluir� en la muestra si una o m�s unidades de la red a la
que pertenece $u_{hi}$ se incluye en la selecci�n inicial o, para una unidad
$u_{hi}$ que no cumple la condici�n, si una o m�s unidades de cualquier red que
cruza el vecindario de la unidad $u_{hi}$ se incluye en la muestra inicial. Debido
al muestreo aleatorio estratificado inicial, la probabilidad de inclusi�n $\pi_{hi}
$ para la unidad $u_{hi}$ es
\end{flushleft}
\end{block}
\end{frame}

\begin{frame}{Dise�o}

\begin{block}

\begin{center}
$\pi_{hi} = 1 - \frac{\displaystyle\prod_{k=1}^L \displaystyle{N_{k} - m_{khi} -
a_{khi} \choose n_{k}}} {\displaystyle{N_{k} \choose n_{k}}} $

\end{center}

\begin{flushleft}
El tama�o de muestra esperado $v$, es decir, el n�mero esperado de unidades
distintas en la muestra final, es la suma de las probabilidades de inclusi�n de $N$
en la poblaci�n.
\end{flushleft}

\end{block}
\end{frame}

\section{Estimadores}

\begin{frame}{Estimadores}

\begin{block}

\begin{flushleft}
Los estimadores convencionales como la media de la muestra estratificada, aunque no
sesgados para la media de la poblaci�n con el muestreo aleatorio estratificado
cl�sico, no son imparciales con los dise�os adaptativos (v�ase el ejemplo 1 a
continuaci�n). Sin embargo, se puede obtener un estimador imparcial, si ineficiente
$\widehat{\mu}_{0}$ de la media de la poblaci�n, simplemente usando el m�todo
convencional estimador estratificado de la media basado en la muestra inicial,
ignorando todas las observaciones posteriores.
\end{flushleft}
\end{block}

\end{frame}

\subsection{Estimadores que usan n�meros esperados de intersecciones iniciales}

\begin{frame}{Estimadores que usan n�meros esperados de intersecciones iniciales}

\begin{block}

Para el muestreo con reemplazo con probabilidades de selecci�n conocidas, el


estimador de Hansen-Hurwitz logra imparcialidad dividiendo el valor y de cada
unidad por la probabilidad de selecci�n de sorteo por sorteo de esa unidad. M�s
precisamente, cada observaci�n se divide por el n�mero esperado de veces que se
selecciona en la muestra y se multiplica por el n�mero de veces que se selecciona.
Con el muestreo estratificado de conglomerados adaptativos, las probabilidades de
selecci�n y, por lo tanto, las expectativas el n�mero de veces seleccionado no se
conoce para cada unidad de la muestra, por lo que un estimador imparcial debe
basarse solo en los aspectos de los n�meros de selecci�n esperados que pueden
determinarse a partir de los datos.
\end{block}

\end{frame}

\begin{frame}{Estimadores que usan n�meros esperados de intersecciones iniciales}

\begin{block}

Para la unidad $u_{hi}$, defina la nueva variable $w_{hi}$ como el total de los
valores y de la red a la que pertenece $u_{hi}$, ponderada por la fracci�n de
muestreo del estrato y dividida por una suma ponderada de los tama�os de
intersecci�n red-estrato de la siguiente manera:

\begin{flushleft}
\Large
\[
w_{hi} = \frac{n_{h}}{N_{h}} \frac{\sum_{k=1}^{L} \xi_{khi}}{\sum_{k=1}^{L}
\frac{n_{h}}{N_{h}} m_{khi}}
\]
\end{flushleft}

\begin{flushleft}
donde $\xi_{khi}$ es el total de los valores y en la intersecci�n del estrato $k$
con la red que incluye la unidad $u_{hi}$ y $m_{khi}$ es el n�mero de unidades en
esta intersecci�n.
\end{flushleft}

\end{block}

\end{frame}

\begin{frame}{Estimadores que usan n�meros esperados de intersecciones iniciales}

\begin{block}

\begin{flushleft}
El estimador de la media poblacional es
\end{flushleft}

\begin{center}
\large
$\widehat{\mu}_{1} = \frac{1}{N} \sum_{h=1}^{L} \frac{N_{h}}{n_{h}}
\sum_{i=1}^{n_{h}}w_{hi}$ \hspace{2cm}(1)
\end{center}

Dejar que la variable aleatoria $r_{khi}$ represente el n�mero de unidades en la


muestra inicial que est�n en la intersecci�n del estrato $k$ con la red a la que
pertenece la unidad $u_{hi}$, el estimador se puede escribir en la forma
alternativa

\begin{center}
\large
$\widehat{\mu}_{1} = \frac{1}{N}
\sum_{h=1}^{L}\sum_{h=1}^{N_{h}}\left(\frac{y_{hi}\sum_{k=1}^{L}r_{khi}}
{\sum_{k=1}^{L}\frac{N_{k}}{n_{k}}m_{khi}}\right) $
\end{center}
Como $E(r_{khi}) = n_{k}m_{khi}/N_{k}$, se deduce que $\widehat{\mu}_{1}$ es un
estimador imparcial de la media de la poblaci�n.
\end{block}
\end{frame}

\begin{frame}{Estimadores que usan n�meros esperados de intersecciones iniciales}


\begin{block}

Con $w_{hi}$ como la variable de inter�s para la unidad $u_{hi}$ para cada unidad
en la poblaci�n, $\widehat{\mu}_{1}$ es la media de muestra estratificada de una
muestra aleatoria estratificada y, por lo tanto, tiene varianza

\begin{center}
\large
\hspace{1cm} var$(\widehat{\mu}_{1}) = \frac{1}{N^{2}}\sum_{h=1}^{L}N_{h}(N_{h} -
n_{h})\frac{\sigma^{2}_{h}}{n_{h}}$ \hspace{1cm} (2)
\end{center}
en el que el t�rmino de varianza de la poblaci�n del estrato es
\begin{center}
\large
\hspace{1cm} $\sigma^{2}_{h} =\frac{1}{N_{h} - 1}\sum_{i = 1}^{N_{h}}(w_{hi} -
\overline{W}_{h})^{2}$ \hspace{2cm} (3)

\end{center}

y la media de la poblaci�n del estrato es


\begin{center}
\large
$\overline{W}_{h} = (1/n_{h})\sum w_{hi}$
\end{center}

\end{block}
\end{frame}

\begin{frame}{Estimadores que usan n�meros esperados de intersecciones iniciales}


\begin{block}

Se obtiene un estimador imparcial v($\widehat{\mu}_{1}$) de la varianza


$\widehat{\mu}_{1}$ reemplazando $\sigma^{2}_{h}$ en la f�rmula (3) con la varianza
muestral
\begin{center}
\large
$s^{2}_{h} = \frac{1}{n_{h} - 1}\sum_{i=1}^{n_{h}}(w_{hi} -
\overline{w}_{h})^{2} \hspace{2cm} (4)$
\end{center}

utilizando la muestra media

\begin{center}
$\overline{w}_{h} = (1/n_{h})\sum w_{hi}$
\end{center}
\end{block}
\end{frame}

\begin{frame}{Estimadores que usan n�meros esperados de intersecciones iniciales}


\begin{block}

Se puede construir una variaci�n $\widehat{\mu}_{1}^{'}$ en el estimador


$\widehat{\mu}_{1}$ que est� relacionada con el estimador estratificado de
"multiplicidad" del muestreo en red (Birnbaum y Sirken 1965; Levy 1977; Sirken
1972a), en el que el peso que recibe una observaci�n depende del estrato en el que
la muestra inicial se cruza con la red de esa unidad. Para la unidad $u_{hi}$,
defina la nueva variable $w_{hi}^{'}$ como el total de los valores y en toda red a
la que pertenece la unidad $u_{hi}$, dividida por el n�mero total de unidades en
esa red; es decir,

\[ w'_{hi} = \sum_{k=1}^{L} \xi_{khi} \bigg/ \sum_{k=1}^{L}m_{khi} \hspace{2cm}


(5)
\]

\end{block}
\end{frame}

\begin{frame}{Estimadores que usan n�meros esperados de intersecciones iniciales}


\begin{block}
El estimador de multiplicidad estratificado modificado est� dado por la ecuaci�n
(1) con $w$ reemplazando $w$.
Por cada vez que se selecciona cualquier unidad de una red en la muestra inicial,
el estimador incluye un t�rmino con el total de los valores de y para esa red,
dividido por el tama�o de la red y ponderado por $N_{k}$/$n_{k}$ para el estrato
desde el cual la unidad fue seleccionado. Por lo tanto, cada valor y individual
ocurre en el estimador cada vez que se selecciona cualquier unidad de la red a la
que pertenece en la muestra inicial, pero con ponderaciones que dependen de los
estratos de los que provienen las selecciones iniciales. As�, el estimador
$\widehat{\mu}_{1}^{'}$ puede escribirse en forma alternativa

\end{block}
\end{frame}

\begin{frame}{Estimadores que usan n�meros esperados de intersecciones iniciales}


\begin{block}

\begin{center}
\large

\[ \widehat{\mu}_{1}^{'} = \frac{1}{N}\sum_{h=1}^{L}\sum_{i=1}^{N_{h}}
\left( y_{hi}\sum_{k=1}^{L}\frac{N_{k}}{n_{k}}r_{khi} \bigg/ \sum_{i=1}^{L} m_{khi}
\right)
\]
\end{center}

La imparcialidad de $\widehat{\mu}_{1}$ para la media de la poblaci�n se deduce del


hecho de que $E(r_{khi}) = n_{k}m_{khi}$/$N_{k}$.

\end{block}
\end{frame}

\subsection{Estimador utilizando probabilidades de intersecci�n inicial}

\begin{frame}{Estimador utilizando probabilidades de intersecci�n inicial}


\begin{block}

Para cualquier dise�o en el que se conozcan las probabilidades de inclusi�n, el


estimador Horvitz-Thompson logra la imparcialidad dividiendo el valor de $y$ para
cada unidad en la muestra por la probabilidad de que la unidad se incluya en la
muestra. Con el muestreo de conglomerados adaptativo, estas probabilidades de
inclusi�n no pueden determinarse a partir de los datos para cada unidad de la
muestra. Sin embargo, se puede formar un estimador utilizando para cada unidad la
probabilidad de que la muestra inicial se cruce con la red a la que pertenece esa
unidad, y dando un peso cero a cualquier observaci�n que no satisfaga la condici�n
que no se incluy� en la muestra inicial. Deje que las distintas redes K de la
poblaci�n se etiqueten como 1, 2, ..., $K$, sin tener en cuenta los l�mites del
estrato. Deje $y_{i}$ denotar el total de los valores de y en la red $i$-�sima de
la poblaci�n. Sea $x_{hi}$ el n�mero de unidades en el estrato $h$ que interceptan
la red $i$. La probabilidad $\alpha_{i}$ de que la muestra inicial se cruce con la
red i es

\end{block}

\end{frame}
\begin{frame}{Estimador utilizando probabilidades de intersecci�n inicial}
\begin{block}

\[ \alpha_{i} = 1 - \prod_{k=1}^{L} {N_{k}-x_{ki} \choose n_{k}} \bigg/ {N_{k}


\choose n_{k}} \hspace{1cm} (7)
\]

Dejando $q_{}i = 1 - \alpha_{i}$, la probabilidad $\alpha_{ij}$ de que la muestra


inicial intercepte ambas redes $i$ y $j$ es

\[ \alpha_{ij} = 1 - q_{i} - q_{j} +\prod_{k=1}^{L} {N_{k}-x_{ki}-x_{kj} \choose


n_{k}} \bigg/ {N_{k} \choose n_{k}}
\]

Deje que la variable indicadora $z_{i}$ sea $1$ si la muestra inicial intercepta la
red $i$ y cero en caso contrario. El estimador estratificado del tipo modificado de
Horvitz-Thompson es

\[\widehat{\mu}_{2} = \frac{1}{N} \sum_{i=1}^{k}\frac{y_{i}z_{i}}{\alpha_{i}}


\]

\end{block}
\end{frame}

\begin{frame}{Estimador utilizando probabilidades de intersecci�n inicial}


\begin{block}

Para $i = 1, ..., K$, $z_{i}$ es una variable aleatoria de Bernoulli con E($z_{i}$)
= $\alpha_{i}$, var($z_{i}$) = $\alpha_{i}$(1 - $\alpha_{i}$) y cov($z_{i}$, $z_{j}
$) = $\alpha_{ij} - \alpha_{i}\alpha_{j}$, para $i \neq j$. Se deduce que
$\widehat{\mu}_{2}$ es un estimador imparcial de la media de la poblaci�n, y con la
convenci�n de que $\alpha_{ii}$ = $\alpha_{i}$,

\[ Var(\widehat{\mu}_{2}) = \frac{1}{N^{2}} \sum_{i=1}^{k}\sum_{j=1}^{k}


y_{i}y_{j}\left( \frac{\alpha_{ij}}{\alpha_{i}\alpha_{j}} - 1\right)
\]

es un estimador imparcial de esta varianza, ya que E($z_{i}z_{j}$) = $\alpha_{ij}


$, es

\[ \widehat{Var}(\widehat{\mu}_{2}) = \frac{1}{N^{2}}
\sum_{i=1}^{k}\sum_{j=1}^{k} \frac{y_{i}y_{j}z_{i}z_{j}}{\alpha_{ij}} \left(
\frac{\alpha_{ij}}{\alpha_{i}\alpha_{j}} - 1\right)
\]

siempre que la probabilidad de intersecci�n conjunta $\alpha_{ij}$ no sea cero para


ning�n par de redes.

\end{block}
\end{frame}
\section{Referencias}

\begin{frame}{Referencias}

\begin{block}

Steven K. Thompson (2012). Sampling, Simon Fraser University


\end{block}

\end{frame}

\end{document}

You might also like