You are on page 1of 114

UNIVERSIDADE DE VORA

Curso de Matemtica Aplicada

Estimadores de mxima verosimilhana


para a combinao captura - recaptura e
trajectos lineares e as suas propriedades

Trabalho de Fim de Curso


realizado por
Joo Filipe Gonalves Monteiro

VORA
Julho de 2001

Este Trabalho no inclui as observaes e crticas feitas pelo jri


ii

Agradecimentos
Agradeo ao Professor Russel Alpizar-Jara, meu orientador, pelos sbios conhecimentos, entusiasmo, ateno que sempre me dedicou.
Aos meus queridos pais, cunhada Alcinda, irmos e Nene em particular pelo
amor e ternura ilimitada que foram decisivos no meu empenho durante todos esses
anos de estudos.
Cludia pelo amor, carinho e amizade.
Com apreo e infinita estima agradeo Ana, Andr, Evaldo, Hermes e Njalo
pela amizade e incansvel ajuda na lida do dia-a-dia e muito especialmente na
elaborao do presente trabalho.
Pude compartilhar momentos indelves em companhia de colegas, amigos, docentes e todos vs um muito obrigado pela fora e encorajamento que sempre me
deram. A maravilhasa cidade de vora e sua simptica gente pela hospitalidade.
Tambm, no posso deixar de agradecer Cabo Verde, terra me.

iii

ndice
Lista das Quadros . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Lista das Figuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

vi

Notao e abreviaturas . . . . . . . . . . . . . . . . . . . . . . . . . . .

viii

1 Introduo

2 Conceitos estatsticos

2.1 Amostragem aleatria . . . . . . . . . . . . . . . . . . . . . . . .

2.2 Estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.3 Mtodo de estimao . . . . . . . . . . . . . . . . . . . . . . . . .

12

2.4 Propriedades de um estimador de mxima verosimilhana . . . . .

19

3 Estimao do tamanho duma populao e parmetros relacionados

26

3.1 Modelo de Lincoln-Petersen . . . . . . . . . . . . . . . . . . . . .

26

3.1.1

Estimao de Lincoln-Petersen . . . . . . . . . . . . . . . .

26

3.1.2

Funo da mxima verosimilhana . . . . . . . . . . . . .

28

iv

3.1.3

Varincia (uma aproximao utilizando a srie de Taylor) .

32

3.2 Modelo de Trajectos Lineares . . . . . . . . . . . . . . . . . . . .

40

3.2.1

Trajectos Lineares . . . . . . . . . . . . . . . . . . . . . .

40

3.2.2

Funo de deteco . . . . . . . . . . . . . . . . . . . . . .

43

3.2.3

Estimao da densidade populacional

. . . . . . . . . . .

47

3.2.4

Funo da mxima verosimilhana . . . . . . . . . . . . .

50

3.3 Combinao dos modelos de Lincoln-Petersen e Trajectos Lineares

56

3.3.1

A combinao . . . . . . . . . . . . . . . . . . . . . . . . .

56

3.3.2

Funo da mxima verosimilhana . . . . . . . . . . . . .

57

3.3.3

Estimao de N e g0 . . . . . . . . . . . . . . . . . . . . .

59

3.4 Exemplo prtico . . . . . . . . . . . . . . . . . . . . . . . . . . . .

66

4 Simulao

73

5 Concluso

87

Apdices

89

Apndice A (Teoremas) . . . . . . . . . . . . . . . . . . . . . . . . . .

89

Apndice B (Clculos auxiliares) . . . . . . . . . . . . . . . . . . . . .

91

Apndice C (Simulaes) . . . . . . . . . . . . . . . . . . . . . . . . . .

92

List of Tables
3.1 Densidade populacional em funo de g0 . . . . . . . . . . . . . . . . .

49

3.2 Nova organizao dos dados de Otto . . . . . . . . . . . . . . . . . . .

67

3.3 Critrio de Informacco de Akaike . . . . . . . . . . . . . . . . . . . .

68

3.4 Estimadores de Trajecto Linear-Metade da Normal sem ajustamento de termos 69


3.5 Estimao de Lincoln-Petersen ( PopSize) . . . . . . . . . . . . . . . .

70

3.6 Comparao entre o estimador de Lincoln - Petersen e o de Chapman. . . .

70

3.7 Estimao de g0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

71

4.1 Mtodo de Monte Carlo . . . . . . . . . . . . . . . . . . . . . . . . .

75

4.2 Comparao entre os estimadores de CH, LP e TL com o estimador de MC,


. . . . . . . . . . . . . . .

83

4.3 Comparao de estimativas de teta para o caso em que g0 livre e g0=1 . .

86

quando a funo deteco a normal truncada

5.1 Rotina binomial para o calculo de n1 . . . . . . . . . . . . . . . . . . . 100


5.2 Rotina binomial para o calculo de n11 . . . . . . . . . . . . . . . . . . . 100

vi

List of Figures
2.1 Inferncia estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2 N o tamanho da populao e p a probabilidade de captura (constante).


Para um conjunto de dados, o mtodo de mxima verosimilhana estima os
parmetros

N e p, que so os valores que maximizam a funo de verosimil-

hana. White et al., 1982, pag. 31.

2.3

14

A derivada no se anula para qualquer valor finito de ,no entanto a estimativa


da mxima verosimilhana deve ser
II, pag. 186.

2.4

. . . . . . . . . . . . . . . . . . . .

= max xi . Bento Murteira, 1996, vol.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

O mximo absoluto de L() atingido em


derivao conduz ao mximo relativo

15

enquanto que o emprego da

0 6= . Bento Murteira, 1996, vol. II,

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

2.5 Estimador enviesado. Rui Guimares, 1997, pag. 265. . . . . . . . . . . .

20

2.6 Estimador no enviesado. Rui Guimares, 1997, pag. 265. . . . . . . . . .

21

pag. 186.

2.7 Estimador pouco preciso, quando comparado com o da Figura 2.8. Rui Guimares,
1997, pag. 267.

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

vii

22

2.8 Estimador preciso, quando comparado com o da Figura 2.7. Rui Guimares,
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

3.1 Diagrama captura -recaptura. . . . . . . . . . . . . . . . . . . . . . . .

27

1997, pag. 267.

3.2 Distribuio dos indivduos sobre a rea A. representa os indivduos (animais)


na rea de estudo A. Apesar dos animais terem tendncia a agruparem-se, as
vezes parte-se do principio que estes seguem um processo de Poisson.

. . . .

41

3.3 a) Trajectos lineares. b) Os objectos em cima da linha so observados e


presupes-se que os mais distantes da linha tem menor probabilidade de serem

. . . . . . . . . . .

42

3.4 Trajecto linear ao longo da faixa de largura 2w. . . . . . . . . . . . . . .

43

3.5 Clculo da distncia xi . . . . . . . . . . . . . . . . . . . . . . . . . .

43

observados, tanto menor quanto maior for a distncia.

3.6 Vrias tentativas para a funo de deteco : A - Normal truncada , B Uniforme, C - Exponencial Negativa, D - Hazard-Rate, que depois de escolhida
em funo da performance de cada uma faz-se uma ajuste da funo deteco.

44

3.7 Funo densidade truncada, g(x). . . . . . . . . . . . . . . . . . . . .

46

3.8 Dados das distncias de latas de cervejas castanhas obtidas atraves da exper. . . . . . . . . . . . . . . . . . . . . . . . . . .

69

4.1 Gerar uma multinomial pelo sistema de urnas . . . . . . . . . . . . . . .

78

incia de Otto,1982.

4.2 Determinao de n2 . A = p1 (1 p2 ), B = p1 (1 p2 ) + (1 p1 )p2 ,


C = p1 (1 p2 ) + (1 p1 )p2 + p1 p2 . . . . . . . . . . . . . . . . . .
viii

79

x2

4.3 Grfico da funo deteco da Normal truncada em [0, 20]. g (x) = e ,


= 9.04296162. . . . . . . . . . . . . . . . . . . . . . . . . . .

80

4.4 Transformao de x = G1 (y) . . . . . . . . . . . . . . . . . . . . .

81

com

4.5 O grfico da esquerda diz respeito ao parmetro e o da direita a p1 para 500


= 0.4 e p2 = 0.2. . . . . . . . . . . . . . . .

84

4.6 Distribuio de g0 , para 500 simulaes com N=150, p1 = 0.4 e p2 = 0.2. .

85

simulaes com N=150, p1

4.7 Ilustrao do grfico do parmetro g0 caso a funo de verosimilhana seja


restringida a g0 <1.

. . . . . . . . . . . . . . . . . . . . . . . . . . .

86

4.8 Grfico da funo de verosimilhana do modelo combinado com p1 =0.4, p2 =0.2,


=20.37, N=150 e a funo de deteco a normal truncada em [0, 20] . . .

ix

86

Notaco e abreviaturas
Notaes tais como

P
, , etc. no sero descritas por razes obvias.

N - nmero de animais na rea A;


n1 - quantidade de indivduos da primeira captura;
n10 (= n1 n11 ) - nmero de indivduos que foram marcados apenas na primeira
captura;
n2 - nmero de indivduos da segunda captura;
n01 (= n2 n11 ) nmero indivduos marcados s na segunda captura;
n11 - total de indivduos que foram marcados na primeira e na segunda captura;
n00 - nmero os indivduos que no chegaram a ser marcados;
n - total de indivduos capturados ;
p1 - probabilidade de um indivduo ter a marca da primeira captura;
p2 - probabilidade de um indivduo ter a marca da segunda captura;
p (= p1 + p2 p1 p2 ) - probabilidade de um indivduo ser capturado;
LP - estimador de Lincoln-Petersen;
N
x

T L - estimador do mtodo de trajecto Linear;


N
MC - estimador do mtodo Combinado;
N
- vector parmetro;
w - metade da distncia da largura da rea de trajecto linear de comprimento
L;
g (x) = g (x|) - funo de deteco;
g0 - probabilidade de um individuo ser detectado em cima da linha L de trajecto linear;
g (x|) = g0 g (x| ), com = (g0 , ). o vector parmetro que descreve
g;
=

Rw
0

g (x) dx - efectivo da metade do trajecto;

Abreviaturas
cv - coeficiente de variao.
i.i.d - independente e identicamente distribudos;
se - desvio padro ( standar error);
v.a.c - varivel aleatria contnua;
v.a.d - varivel aleatria discreta;

xi

1. Introduo
As estimativas do tamanho das populaes so necessrias seja qual for o estudo
ecolgico e (ou) evolutivo. Um conjunto de indivduos da mesma espcie coexistindo num mesmo espao designa-se por populao, N. Uma populao pode
designar a um conjunto de indivduos que vivem, por exemplo, num parque, numa
cidade ou mesmo numa determinada regio dum pas.
Os modelos matemticos tm sido usados para perceber fenmenos ecolgicos.
O desenvolvimento das tecnologias, juntamente com o crescimento da populao
mundial, bem como a caa descontrolada e catstrofes naturais, tm provocado,
a nvel global, vrias alteraes nos ecossistemas, que podem pr em risco as
populaes, reduzindo o seu efectivo ou mesmo, em caso extremo, levar sua
extino. O conhecimento destas alteraes advm principalmente das concluses
inferidas a partir dos modelos matemticos.
Consequentemente formulam-se modelos matemticos que tentam estimar, por
exemplo, o tamanho e a densidade da populao: mtodo Fisher - Ford, mtodo
estocstico de Jolly, mtodo de Jackson, mtodo de Lincoln - Petersen, mtodo
trajectos lineares, entre outros, Beger (1989) e Krebs (1994).
Todavia, existem outros mtodos cuja finalidade o estudo da evoluo da
populao, destes deduzem-se as taxas de natalidade, mortalidade, etc., entre

outras variveis de ndole biolgica, vitais para evitar ou minimizar desastres


ecolgicos.
No captulo 2, aps uma breve introduo sobre alguns conceitos estatsticos que permitem uma melhor percepo dos modelos que neste trabalho sero
abordados, dando particular realce ao mtodo de mxima verosimilhana e s
propriedades dos seus estimadores.
O modelo combinado desenvolvido por Alpizar-Jara e Pollock (1999) permite
estimar populaes animais. Este a combinao dos dois modelos: LincolnPetersen e Trajecto Linear, sendo mais eficiente e com estimadores robostos e
pouco enviesados. A origem do enviesamento nos dois modelos deve-se ao facto
de nem todos os indivduos serem detectados devido a dificuldades de viso do
observador, em obstculos como pedras, rvores, etc. Lincoln (1930) e Petersen
(1896) foram os pioneiros em usar conceitos de captura-recaptura para estimar
populaes animais. Entretanto, no mtodo de trajecto linear supe -se que todos
os animais em cima da linha L so vistos com probalidade 1, g0 .

O mtodo de trajecto Linear foi desenvolvido sobretudo para estimar densidade


populacional, e a partir da densidade, obtm-se o tamanho da populao.
A ltima parte do trabalho dedica-se a uma aplicao prtica do modelo combinado com base nas simulaes feitas no programa Maple utilizando o mtodo
de Monte Carlo.

2. Conceitos estatsticos

2.1. Amostragem aleatria


A inferncia estatstica consiste em estudar a populao 1 analisando apenas parte
desta, que se designa por amostra - processo indutivo. Com base nos conhecimentos da populao e fundamentos da teoria das probalidade tem-se uma ideia
do comportamento da amostra - processo dedutivo, Figura 2.1.

Figura 2.1: Inferncia estatstica


Para o estudo de um fenmeno aleatrio formula-se um modelo, que no se pretenda exacto, de tal maneira que este seja o mais adequado situao em questo,
1

a totalidade dos dados.

ou seja, pretende-se encontrar um modelo que faa com que a amostra seja representativa2 da populao. A questo que se pe muitas vezes, de como extrair
esta amostra da populao. Vrias tcnicas tm sido desenvolvidas nesse sentido, entre as quais se destaca a tcnica de amostragem aleatria,Bento Murteira
(1996).
Para obter uma amostra aleatria utiliza-se o processo de lotaria ou ento um
programa de computador para gerar nmeros aleatrios.
No processo de lotaria, constri-se uma rplica da populao numa urna com
vrias bolas, de tal maneira que cada bola represente um indivduo da populao.
Retira-se ao acaso tantas bolas quanto se queira, at obter-se a dimenso desejada
para a amostra. Esta tcnica prtica quando se trata de populaes pequenas,
mas inconveniente no caso de populaes grandes j que se torna um processo
cansativo.
O processo de nmero aleatrio idntico, mas a urna substituda por
nmeros aleatrios gerados por computador. A cada indivduo atribui-se um
nmero, e a partir do computador gera-se uma quantidade de nmeros aleatrios
correspondente ao tamanho da amostra.
A tcnica de amostragem aleatria garante que dada uma amostra com n observaes, seja (x1 , x2 , ..., xn ), tal amostra a realizao de n variveis aleatrias 3
(X1 , X2 , ..., Xn ) sobre as mesmas condies que se traduzem por:
2

Uma amostra diz-se reprensentativa se for construda de modo que qualquer que seja o
elemento, tenha a mesma probabilidade de pertencer a esta.
3
Define-se como varivel aleatria real X uma representao
simblica de um espao mensurvel (<, B) e de medida de probabilidade P sobre (<, B) onde
< o conjunto dos nmeros reais e B a famlia dos borelianos lineares e onde para todo o
conjunto A <, A B, P (A) a probabilidade do acontecimento X A. Especificar uma
varivel aleatria introduzir um espao de probabilidade (<, B,P ).

uma lei de probabilidade comum , i.e, as variveis tm a mesma probabilidade de serem observadas

x : PX1 (x) = PX2 (x) = = PXn (x) = PX (x)


(varivel aletria discreta)
x : fX1 (x) = fX2 (x) = = fXn (x) = fX (x)
(varivel aletria contnua)

e independncia entre as variveis


x1 , x2 , , xn

PX1 ,X2 , ,Xn (x1 , x2 , , xn ) = PX (x1 ) PX (x2 ) PX (xn ) (v.a.d)


fX1 ,X2 , ,Xn (x1 , x2 , , xn ) = fX (x1 ) fX (x2 ) fX (xn )

(v.a.c)

Numa primeira fase do processo a natureza dos dados , muitas das vezes,
desconhecida. Para tal, os dados so agrupados em categorias para facilitar a
construo de histogramas e grficos de barras. Com estas representaes grficas
pretende-se ajustar os dados a uma funo de distribuio. Nem sempre a funo
de distribuio caracteriza o comportamento dos dados, j que o acesso aos dados
por vezes limitado. Os dados so caracterizados pela funo de distribuio,
que pode depender (F (x|) , )4 ou no (F (x)) de um parmetro (, ou
vector parmetro = (1 , 2 , ..., k )). No caso paramtrico, contrariamente ao
4

A designa-se por espao parmetrico.

no paramtrico, que deixa escapar diversos pormenores da natureza dos dados, o


fenmeno aleatrio melhor expresso. Apenas o caso paramtrico ser analisado,
e mais a frente, abordar-se- os estimadores de mxima verosimilhana.
Para o modelo em estudo- modelo de Lincoln-Petersen, utilizou-se uma amostragem
casual simples, pois h reposio dos dados. Embora no faa sentido marcar um
animal duas vezes, a reposio dos dados apresenta vantagens de mbito terico
sobre no reposio. A grande vantagem da reposio que em vez de trabalhar com a distribuio Hipergeomtrica, utiliza-se a distribuio Binomial, que
muito menos trabalhosa em termos de clculos. Para populaes grandes, a
dependncia entre as variveis X1 , X2 , , Xn tende a desaparecer, o que torna
irrelevante a reposio ou no dos dados.

2.2. Estatsticas
Definio 1. Dada uma populao com uma funo distribuio paramtrica

F (x|) , )
define-se por uma estatstica T = (X1 , X2 , , Xn ) a todo o processo que se rege
no resumo de toda a informao contida na amostra aleatria X1 , X2 , , Xn
sobre o parmetro desconhecido .

Informao
difcil definir o conceito de informao acima mencionado j que, muitas das
definies propostas tm sido alvo de srias contestaes. Contudo, a definio de
Fisher a que tem maior aceitao.
Sobre a condio de que qualquer funo de densidade (probabilidade) da
famlia F = {f (x|) , } com parmetro escalar satisfaa as condies de
regularidade:
[1 ] intervalo aberto da recta real, podendo mesmo coincidir com toda a
recta real;
[2 ] Os conjuntos {x : f (x|) > 0} so independentes de ;
[3 ]

f (x|)

existe e finita, x e ;

[4 ]
0 < E

ln f (x|)

2 )

<

(Bento Murteira, 1996, vol.II, p.138-139)

, Fisher traduz o conceito de informao no seguinte teorema :


Teorema 2. Dada uma amostra aleatria (X1 , X2 , , Xn ) de dimenso n, toda
a informao presumvel expressa por

=X1 ,X2 , ,Xn () = n=X ()


2
+
ln f (x|)
e =X () =
f (x|) dx

(2.1)

Para certas funes de densidade por vezes complicado chegar a uma expresso para o segundo membro da equao 2.1. O teorema seguinte mostra que,
sob determinadas condies, nomeadamente condies de regularidade j enunciadas atrs, possvel simplificar 2.1.
Teorema 3. Uma vez que se verifiquem as condies de regularidade, 1-4, e se
R +
a segunda derivada de f (x|) dx se pode obter derivando duas vezes sob a

operao de integrao ento:

=X () = E

2
ln f (x|)
2

(2.2)

Dem.: Derivando uma vez em ordem a , temos que

0=

f (x|)
dx =

ln f (x|)
f (x|) dx

derivando um segunda vez em ordem a , vem,


Z +
2 ln f (x|)
ln f (x|) f (x|)
dx
f (x|) dx +
0=
2

2
Z + 2
Z +
ln f (x|)
ln f (x|)
=
f (x|) dx +
f (x|) dx

e tendo em conta 2.1 fica demonstrado o que se pretendia.

Exemplo 4. No caso da distribuio Binomial sente-se o quo cmodo pode ser


a expresso 2.2:
8

Seja a funo probabilidades



n x
f (x|) =
(1 )nx
x
aplicando 2.2 tem-se que:


x nx
n x

nx
=
ln
(1 )
, 0<<1

1
donde se conclui que

=X () = E

x nx

2 )

n
(1 )

Verosimilhana

Como j foi referido atrs, para uma dada amostra aleatria (X1 , X2 , , Xn )
definindo uma lei de probabilidade f (x|), com o parmetro fixo e fazendo
variar X na amostra, temos diferentes resultados de acordo com essa lei de probabilidades. Fixando agora X e fazendo variar obtem-se a funo de verosimilhana:

L (|X) = L (|x1 , x2 , , xn )
= f (x1 , x2 , , xn |) = f (X|)

(2.3)

(As variveis so independentes entre si e identicamente distribudas)

= f (x1 |) f (x2 |) f (xn |)


n
Y
=
f (xi |)
i=1

de frisar que a funo de verosimilhana tal como definida em 2.3, no


condiciona a distino entre variveis aleatrias discretas ou contnuas. A definio
2.3 til para fins prticos, desde que se tenha em conta a natureza da varivel
aleatria X.
A funo de verosimilhana pode ser interpretada como uma quantificao da
verosimilhana associada a cada , para uma amostra particular (X1 , , Xn ).
Para uma melhor percepo do conceito de verosimilhana, comum trabalhar
primeiro com variveis discretas (quase sempre de fcil manuseamento).
Consideremos X uma varivel aleatria discreta e dois parmetros 1 e 2 .
Sem perda de generalidade, suponhamos que:

L (1 |x) > L (2 |x)

(2.4)

ento, de 2.4 pode-se afirmar-se que mais plausvel ter = 1 do que ser igual
a 2 .
Exemplo 5. Para uma amostra de dimenso 5 (n = 5), de uma populao
Binomial(n,)
seja (X1 = 1, X2 = 2, X3 = 3, X4 = 4, X5 = 5)

10

para X fixo, seja X = 1

f (x = 1|
f (x = 1|
f (x = 1|
f (x = 1|


5
= 0.01) =
(1 )4
x

5
= 0.05) =
(1 )4
x

5
= 0.10) =
(1 )4
x

5
= 0.25) =
(1 )4
x

= 0.0480
= 0.2036
= 0.3280
= 0.3955

donde se conclui que = 0.25 mais verosmil do que os outros casos.


Quando a varivel aleatria X contnua, a definio da funo de verosimilhana ser mais delicada. As aproximaes assumem uma maior utilidade.
Se a funo densidade de probabilidade, f (x), da varivel aleatria X, for
contnua em x, para , suficientemente pequeno, temos que:

P (x < X < x + )

= P (X < x + ) P (X < x )
=

F (x + ) F (x )

2 (F (x + ) F (x ))
(x + ) (x )
dF (x)
2
= 2f (x)
dx
=

Assim, tendo em conta que P (x < X < x + ) 2f (x|) = 2L (|x),


uma boa aproximao para comparao da funo de verosimilhana de dois val-

11

ores para um parmetro ser:


L (1 |x)
P1 (x < X < x + )

P2 (x < X < x + )
L (2 |x)
Tanto para o caso discreto como para o contnuo, a funo de verosimilhana
pode ser definida a menos de um factor constante positivo, que expresso pelo
seguinte principio:
Princpio de verosimilhana
Se x e y so duas amostras da mesma populao tal que L (|x) seja proporcional a L (|y), existir uma constante C (x, y) tal que :

L (|x) = C (x, y) L (|y) , para todo o

o que nos leva a concluir que que x e y so idnticas.


A constante proporcional C (x, y) toma diferentes valores para diferentes pares
de (x, y), mas no depende jamais de . Para o caso particular C (x, y) = 1 tem-se
L (|x) = L (|y), i.e, se para duas amostras diferentes temos a mesma funo de
verosimilhana sobre o parmetro , ento estas nos d a mesma informao de
.

2.3. Mtodo de estimao


At aqui analisaram-se os primeiros passos para se construir um modelo. Depois
de conhecido o comportamento da amostra, tem-se ento uma lei de probabilidade

12

que depende de um parmetro. O problema que se pe agora de como estimar


.
No h um nico mtodo para estimar , mas sim vrios mtodos que podem
ser mais adequados ou menos, para cada caso. De entre os mtodos5 que podemos
utilizar, apenas o mtodo de mxima verosimilhana ser analisado.
Antes de expr o mtodo de mxima verosimilhana, convm referir a distino
entre conceitos de estimador e estimativas.
Definio 6. designa-se por estimador de um parmetro , e uma realizao
particular (x1 , x2 , , xn ) do estimador constitui uma estimativa do parmetro
em causa.

Mtodo de Mxima Verosimilhana

Definio 7. Seja Xi uma varivel aleatria com uma lei de probabilidade definida
por:

f (x|)

onde um vector de dimenso p. E com funo verosimilhana dada por:

L (|x1 , x2 , , xn ) =
5

n
Y
i=1

f (xi |)

(2.5)

Alguns mtodos alternativos: mtodo dos mnimos quadrados, mtodo de estimao com
varincia mnima e mtodo dos momentos.

13

No mtodo mxima verosimilhana assume que as estimativas 1 , 2 , ..., p

dos parmetros 1 , 2 , ..., p so os valores destes que maximizam a funo de


verosimilhana, i.e.:

Max L (1 , 2 , ..., p ) = Max

1 ,2 ,...,p

1 ,2 ,..., p

n
Y
i=1

f (xi |)

Portanto = (x1 , x2 , , xn ) diz-se uma estimativa se

L |x1 , x2 , , xn > L (|x1 , x2 , , xn ) , p

Figura 2.2: N o tamanho da populao e p a probabilidade de captura (constante). Para


um conjunto de dados, o mtodo de mxima verosimilhana estima os parmetros N e p, que
so os valores que maximizam a funo de verosimilhana. White et al., 1982, pag. 31.

Sobre as condies de que as funes de verosimilhana so diferenciveis e


satisfaam as condies de regularidade, logo, as estimativas podem ser obtidas
resolvendo o seguinte sistema de equaes :

14


L (|x) = 0, j = 1, 2, , p
j

(2.6)

desde que

2 L (|x)
j

=x

2
<0e
L (|x)
< 0 para todo k 6= l
k l
=x

(2.7)

Normalmente as solues obtidas de 2.6 e 2.7 so mximos, Figura 2.3. Mas


nem sempre o mximo obtido por derivao constitui um mximo global, Figura
2.4. Muitas vezes, tal s possvel atraves de mtodos numricos. No entanto,
mesmo a nvel de clculos numricos importante analisar a funo de verosimilhana tanto quanto possvel no que toca existncia de extremos locais.

Figura 2.3: A derivada no se anula para qualquer valor finito de ,no entanto a estimativa
da mxima verosimilhana deve ser
= max xi . Bento Murteira, 1996, vol. II, pag. 186.

15

Figura 2.4: O mximo absoluto de L() atingido em enquanto que o emprego da derivao
0
conduz ao mximo relativo 6=
. Bento Murteira, 1996, vol. II, pag. 186.

Para fins prticos, em vez de se utilizar a expresso 2.5, comum usar-se


a transformada logartmica da funo de verosimilhana, substituindo assim o
produtrio pelo somatrio, nos clculos:

ln L () = ln

n
Y
i=1

n
X
i=1

f (xi |)

(2.8)

ln f (xi |)

Tendo em conta que a funo logartmica montona crescente, 2.5 e 2.6 tm


pontos estacionrios comuns e 2.6 pode escrever-se:
n
X

ln f (xi |) , j = 1, 2, p
j
i=1

Exemplo 8. Seja Xi uma varivel aleatria com distribuio Normal, a funo


16

densidade dada por :


1
1
e 2
f (xi |) =
22

xi 1
2

, onde =(1 ,2 )=(, 2 )

A transformada logartmica da funo de verosimilhana :


n
n
ln L (1 , 2 |xi ) = ln (2) ln 2
2
2

Pn

i=1

(xi )2
2 2

e tem-se

=0
=0

Pn

2
i=1 (xi )
2

n2
2

Pn

i=1

=0
(2.9)

(xi X )
2 4

=0

Resolvendo a equao 2.9, tem-se que os estimadores de mxima verosimilhana


Pn
2
i=1 (xi X )
2
so:
=X e
=
.
n
Mtodo de Mxima Verosimilhana Restringida

O mtodo de mxima verosimilhana restringida surge para resolver problemas


de estimao de parmetros sempre que estes estejam restringidos a determinadas
condies.
Um problema de mxima verosimilhana restringida pode expressar-se como:

L (|x1 , x2 , , xn ) =

17

n
Y
i=1

f (xi |)

onde f (xi |) uma lei de probabilidade e um vector de dimenso p sujeito s


restrines

A = B

C D

G () = 0
e ainda limitada a i s .

H () 0

De um modo geral, as restries podem ser divididas em dois tipos: restries


lineares e restries no lineares, . No entanto, para fins computacionais e por
uma questo de convenincia, utilizamos 5 classificaes diferentes para restries:
- Restries Lineares
1 A = B, onde A uma matriz m1 p de constantes conhecidas e B uma
matriz m1 1 tambm de constantes conhecidas;
2 C D, onde C uma matriz m2 p de constantes conhecidas e D uma
matriz m2 1 tambm de constantes conhecidas.
- Restries No Lineares
3 G () = 0, com G () uma funo arbitrria do parmetro ;
4 H () 0 e H () uma funo arbitrria de .
5 Apesar de i s poderem ser enquadradas nas restries lineares,
estas so convenientemente separadas para fins computacionais.
18

O metdo de mxima verosimilhanca restringida processa-se de forma idntica


ao mtodo de mxima verosimilhana. Para estimar parmetros utilizando este
mtodo, basta resolver um sistema tendo em conta 2.6 , 2.7 e as restrines acima
mencionadas.

2.4. Propriedades de um estimador de mxima verosimilhana


Um estimador da mxima verosimilhana usufrui de uma srie de propriedades.
De entre elas, salienta-se, que o estimador mxima verosimilhana consistente,
eficiente, assimptoticamente no enviesado, as suas distribuies so assimptoticamente normais e a ainda possui a propriedade da invarincia .

Estimadores suficientes

Definio 9. Uma estatstica T (X1 , X2 , , Xn ) que consiga resumir toda a informao de uma amostra X1 , X2 , , Xn sobre o parmetro ( ) de uma forma
concisa e sem redundncia designa-se por estatstica suficiente.
Uma estatstica diz-se suficiente se e s se a funo distribuio da amostra
(X1 , X2 , , Xn ) aleatria em funo de T = t no depende de ( ), para todo
o t Dt , onde Dt o domnio de T .

19

Estimadores no enviesados
Definio 10. Dado um parmetro ( ) e seja um estimador do mesmo,
define-se como enviesamento :

Enviesamento =
onde valor esperado de .
Um estimador diz-se no enviesado se o valor do enviesamento for nulo,
Figuras 2.5 e 2.6. O estimador no enviesado permite, para amostras diferentes,
obter um estimador que fornece, em mdia, estimativas iguais ao verdadeiro valor
do parmetro.

Figura 2.5: Estimador enviesado. Rui Guimares, 1997, pag. 265.

20

Figura 2.6: Estimador no enviesado. Rui Guimares, 1997, pag. 265.


Estimadores consistentes
Definio 11. Um estimador do parmetro sob as condies de consistncia e que satisfaa a condio:

> 0, lim P < = 1


n+

diz-se consistente, onde n a dimenso da amostra.


Demonstra-se que se o enviesamento e a varincia de um estimador tendem
para zero quando a dimenso da amostra tender para infinito (n +):

lim ( ) = 0
n+

lim 2
n+

=0

(condies de regularidade)

ento o estimador consistente.


21

Estimadores Precisos
Definio 12. Um estimatidor 1 diz-se menos preciso que outro 2 , se a disperso dos erros de estimao que podem ser cometidos for maior quando se recorre
ao estimador 1 , Figuras 2.7 e 2.8. Geralmente, a preciso de um estimador
expressa pelo erro quadrtico mdio:

Erro Quadr
atico m
edio

= EQM = E
= 2 (Enviesamento )2

Figura 2.7: Estimador pouco preciso, quando comparado com o da Figura 2.8. Rui Guimares,
1997, pag. 267.

Propriedade de invarincia

A propriedade de invarincia talvez a mais importante de todas as propriedades


do mtodo da mxima verosimilhana.
Teorema 13 (Propriedade de invarincia). Se um estimador de mxima
22

Figura 2.8: Estimador preciso, quando comparado com o da Figura 2.7. Rui Guimares, 1997,
pag. 267.



verosimilhana e se uma funo biunvoca, ento estimador de

mxima verosimilhana de ().

Por exemplo, se a mdia de uma varivel aleatria com funo distribuio



F, ento, o estimador de mxima verosimilhana de uma funo z () z X .
Assimptoticamente normais
Para solues da equao 2.6 (ou 2.8) sobre as condies

= 0

I () = E

2L
2

=E

2 !

ento diz-se assimptoticamente normal com vector mdia 0 e a matriz varincia, onde 0 o real valor de . A matriz I0 conhecida por
covarincia, I1
0
,
matriz informao de Fisher, Efron (1978). A matriz varincia-covarincia, I1
0
P
denotada por .
23

A partir da varincia sabe-se qual a preciso de um estimador e da covarincia, a relao que existe entre dois estimadores particulares, isto , se so ou
no independentes6 , j que foram obtidos a partir dos mesmo conjunto de dados.

X
d
=

var 1
cov 1 , 2
cov 1 , 3 . . . cov 1 , n

cov 2 , 1
var 2
cov 2 , 3 . . . cov 2 , n

cov 3 , 1
cov 3 , 2
var 3
. . . cov 3 , n
..
.

..
.

..
.

..

cov n , 1 cov n , 2 cov n , 3 . . .

..
.


var n

P
, as varincias aparecem na diagonal principal da

mesma e as covarincias so simtricas em relao diagonal, isto , cov i , j =

cov j , i para todo i e j. Para obter uma estimativa da matriz-covarincia,


Na matriz covarincia,

necessrio estimar os parmetros e subtitu-los na funo de mxima verosimilhana.


Se a funo de verosimilhana tem vrios parmetros, ento as respectivas
varincias e covarincias obtm-se da matriz informao, I (), e:
X
d

h i1
= I

Para o caso em que a funo de verosimilhana tem um nico parmetro e


assumindo ainda que os estimadores de mxima merosimilhana sejam assimp6

Duas variveis aleatrias X e Y , dizem-se linearmente independentes se e s se cov(X, Y ) =

0.

24

toticamente eficientes e usando a aproximao de Cramr-Rao para a varincia


de estimadores de mxima verosimilhana, a varincia aproximada de uma dada

funo h :

var h |
=

h i2

h

=
2

E 2 ln L (|X) =
h i2

h

=
2

2 ln L (|X)=

(Casella e Berger, 1990, pag. 325-328)

25

(2.10)

3. Estimao do tamanho duma


populao e parmetros relacionados

3.1. Modelo de Lincoln-Petersen


3.1.1. Estimao de Lincoln-Petersen
Quanto aos modelos de captura - recaptura, talvez o mais simples de todos seja o
modelo Lincoln-Petersen. Utilizado por C. G. J. Petersen6 em 1896 e aperfeicoado
em 1930 por F. C. Lincoln7 , para estimar o tamanho de populaes de patos.
Tal como outros modelos de estimao do tamanho de populaes, este constituido no seu essencial pela captura, marcao e recaptura dos indivduos.
Este mtodo tem como pressupostos:
A1 Na populao no hja nascimentos nem imigrao, mortes ou emigrao.
Portanto, a diferena entre o tempo da recolha de duas amostras tem de ser
pequena - populao fechada;
6

Carl George Johannes Petersen nasceu na Dinamarca em 1860. O metodo que hoje tem o
seu nome foi publicado em 1896.
7
Frederick C. Lincoln nasceu em 1892, no Colorado. Passou a maior parte da vida a estudar
passros.

26

A2 Os animais tm igual probabilidade de serem capturados dentro de cada


amostra;
A3 As etiquetas no se perdem no ensaio e no so ignoradas pelo observador.
Tendo em conta os pressupostos do mtodo, e considerando N o universo, isto
, o nmero total dos indivduos que se pretende estimar, numa primeira fase
captura-se um certo nmero de indivduos (n1 ), tendo todos a mesma probabilidade de serem capturados - captura. Depois de serem marcados so posteriormente libertados para o seu habitat natural, juntando-se aos restantes indivduos
no marcados - marcao. Num segundo passo do mtodo capturam-se novos
indivduos (n2 ) - recaptura, podendo estes j terem sido capturados ou no
aquando da captura, Figura 3.1.

Figura 3.1: Diagrama captura -recaptura.


Como no h nascimentos nem mortes, a populao mantm-se constante,
em tamanho, tanto na primeira como na recaptura e, por isso, evidente que
a proporo de animais marcados na recaptura seja aproximadamente
igual proporo de animais marcados no total da populao:
27

n11
n11
LP = n1 n2
N

n2
N
n11

(3.1)

LP o estimador de Lincoln-Petersen.
onde N
Apesar do mtodo ser simples e prtico, pode surgir um pequeno problema;
no caso, de n11 ser zero, isto , no existem indivduos marcados nem na primeira
e nem na segunda fase. Para resolver tal situao, em 1951 Chapman introduziu
pequenas modificaes na formula 3.1:

(n1 + 1) (n2 + 1)

LP
1
=
N
n11 + 1

(3.2)

O estimador de Chapman menos enviesado que o de Lincoln-Petersen. O


enviesamento do estimador de Lincoln-Petersen mais evidente para populaes
de pequenas dimenses, j que para esses casos a populao sobreestimada. Entretanto, para populaes grandes indiferente a utilizao da frmula padro de
Lincoln-Petersen ou a corrigida de Chapman para o estimar, pois o enviesamento
similar.

3.1.2. Funo da mxima verosimilhana


Uma das vrias maneiras de se chegar funo de mxima verosimilhana considerar que n10 , n01 e n11 so variveis aleatrias que tm distribuio multinomial.
Seja a partio do universo, de tamanho N, {n10 , n01 , n11 , n00 } em que:
28

n11 so aqueles indivduos que foram marcados duas vezes;


n10 representa o nmero de indivduos que foram marcados apenas na primeira
captura;
n01 (= n2 n11 ) refere-se ao nmero indivduos marcados s na segunda
captura;
n00 descreve os indivduos que no foram marcados;
p1 a probabilidade de um indivduo ter a marca da primeira captura, p1
[0, 1] ;
p2 a probabilidade de um indivduo ter a marca da recaptura, p2
e portanto:
P10 = P
=P

um indivduo ter a marca da primeira


captura e no ter a marca da recaptura

um indivduo ter a marca da primeira captura

= p1 (1 p2 );
P01 = P
=P

um indivduo no ter a marca da recaptura

um indivduo no ter a marca da primeira


captura e ter a marca da recaptura

um indivduo no ter a marca da primeira captura

= (1 p1 ) p2 ;
P11 = P

um indivduo ter a marca da recaptura

um indivduo ter a marca da primeira


captura e ter a marca da recaptura

29

[0, 1] ;

=P

um indivduo ter a marca da primeira captura

= p1 p2 ;
P00 = P
=P

um indivduo ter a marca da recaptura

um indivduo no ter a marca da primeira

captura e no ter a marca da recaptura

um indivduo no ter a marca da primeira captura

= (1 p1 ) (1 p2 );

um indivduo no ter a marca da recaptura

Considerando n10 , n01 e n11 como variveis aleatrias, que seguem uma distribuio multinomial e tendo em conta os pressupostos do mtodo, a funo da
mxima verosimilhana toma o seguinte aspecto:

LLP () = (N, p1 , p2 |n10 , n01 , n11 ) =

n10

N
[p1 (1 p2 )]n10 [(1 p1 ) p2 ]n01 [p1 p2 ]n11 [(1 p1 ) (1 p2 )]n00
n01 n11
(3.3)

(e pondo n00 = N n10 n01 n11 = N n, temos)

N
[p1 (1 p2 )]n10 [(1 p1 ) p2 ]n01 [p1 p2 ]n11
n10 n01 n11
[(1 p1 ) (1 p2 )]Nn
30

Utilizando a propriedade invariante dos estimadores do mtodo da mxima


verosimilhana e o lema 15 (Chapman), consultar Apndice A, temos que:

= L1LP (N, p|n) L2LP (p1 , p2 |n10 , n01 , n11 )

(3.4)

(consultar Apndice A)


N n
Nn

=
p (1 p)
n

n
n
n
n
p1 (1 p2 ) 10 (1 p1 ) p2 01 p1 p2 11

(3.5)
n10 n01 n11
p
p
p
onde n = n10 + n01 + n11 e portanto
Pn = P11 + P10 + P01
= p1 (1 p2 ) + (1 p1 ) p2 + p1 p2
= p1 + p2 p1 p2 = p
Estimao de N
Uma das possveis maneiras de estimar N resolvendo o seguinte sistema:

LLP () = 0

L1LP ()
N

=0

L1LP ()
p

=0

L1LP ()
N

=0

n
p (1 p)Nn = 0

N
p n


N n
p (1 p)Nn = 0

p n

N n1
Nn1

p
(n (1 p) p (N n)) = 0
(1 p)
n
n (1 p) p (N n) = 0
31

n Np = 0
p=
Donde sai que p =

n
,
N

n
N

ou seja:

=n
N
p

(3.6)

Tambm se pode estimar p1 e p2 por meio algbrico (consultar Apndice B),


Maple neste caso, donde se conclui que:

p1 =

n11
n2

(3.7)

e
p2 =

n11
n1

(3.8)

3.1.3. Varincia (uma aproximao utilizando a srie de Taylor)


Para se obter uma aproximao da varincia recorre-se srie de Taylor1 e as
propriedades da varincia e do somatrio. Vejamos, ento como chegar a uma
r

d
Definio: Se uma funo (x) tem derivada de ordem r tal que (r) (x) = dx
r (x), ento
para uma constante a, o polinmio de Taylor de ordem r em torno de a dado por Tr (x) =
Pr (r)
i
i=0 i! (x a) .
1

32

expresso para a varincia.


Sejam X1 ,X1 ,...,Xk variveis aleatrias com mdia 1 ,1 ,...,k , tais que X =
(X1 , X1 , ..., Xk ) e = (1 , 1 , ..., k ). Suponhamos que exista uma funo (X)
diferencivel (um estimador de alguns parmetros) para o qual queremos uma
aproximao da varincia estimada. Seja

i () =

(X)
|X1 =1 ,X1 =2 ,...,Xk =k
Xi

A expanso da serie de Taylor de primeira ordem de (X) em de torno


dada por:

(X) () +

r
X
i=0

i () (Xi i )

(3.9)

e aplicando a esperana matemtica a ambos os membros da equao 3.9 sai que:

E (X) () +

r
X
i=0

i () E (Xi i ) = ()

(3.10)

Assim, uma aproximao da varincia de (X) sai como consequncia de 3.9


e de 3.10:

33

r
r
2
X
X
0
0
0
i () var (Xi ) + 2
var (X)
i () j () cov (Xi , Xj )
i=0

(3.11)

i>j

LP pode ser calculada de diversas formas, dos quais abordarei


A varincia de N
dois casos: hipergeomtrico e o multinomial. A varincia est inteiramente ligada
ao modo como o problema abordado.

Caso Hipergeomtrico
No caso hipergeomtrico a varincia calculada condicionando n1 e n2 , ou seja,
parte-se do princpio que n1 e n2 so conhecidos. A nica grandeza no fixa
ser n11 , varivel que tem distribuio hipergeomtrica. Assim, temos a seguinte
funo de verosimilhana:

L (N|n1 , n2 , n11 ) = f (n11 |N, n1 , n2 , ) =

n1 Nn1
n11

N2

n2

e com as seguintes condies para funo de probabilidade:


0 n11 n1 ;
0 p 1;
p+q =1

34

n11

(3.12)

Utilizando o mtodo dos momentos 2 , sabemos que :

E (n11 ) =

n1 n2
= n1 n2
N
N
n11

Seja (z) = z1 , onde a mdia de z z e tendo em conta a expresso 3.11 a


varincia de (z) dada por:

d
vd
ar (z)
dz

.d
var (z) =

z=z

1
var (z)
4z

LP obtm-se tendo em conta a aproximao srie


A varincia estimada de N
de Taylor e uma transformao de varivel. Ou seja:

n1 n2

ar
vd
ar NLP = vd
n11

ar
n21 n22 vd

1
n11

ao conhecidas)
(P ropriedade da variancia assmindo que n1 e n2 s

O mtodo dos momentos foi desenvolvido no prncipio deste sculo por Karl Pearson para
produzir estimadores de parmetros.

35

n21 n22
vd
ar (n11 )
n411

(Transformao de varivel e aproximao serie de Taylor)

Como a varivel n11 aleatria segue uma distribuio hipergeomtrica, i.e:

n11 y H (N, k, p)

tal que:
O parmetro N tem como estimador a estimao de Lincoln-Petersen, i.e,
LP =
N

n1 n2
;
n11

A proporo n1 indivduos marcados p =

n1
.
N

um indivduo no ser marcado q = 1 p =

p =

n11
n2

e a probabilidade de

n2 n11
;
n2

Retiram-se n2 (= k) indivduos do total, sem reposio;


e tendo em conta a varincia de uma varivel com distribuio hipergeomtrica 3
temos que:

vd
ar (n11 ) n2

n11 n2 n11
n2
n2

n1 n2
n2
n11
n1 n2
1
n11

n11 (n1 n11 ) (n2 n11 )


n1 n2

(a aproximao considerada boa desde que a populao em conta seja grande)


3

Dado uma varivel X,tal que X y H (N, k, p) ento a varincia de X 2 = kpq Nk


N 1

36

:
e por conseguinte a varincia estimada de N

n1 n2 (n1 n11 ) (n2 n11 )


LP
vd
ar N
=
n311

(3.13)

(Seber, 1982)

Para o estimador corrigido 3.2, Chapman desenvolveu a seguinte expresso


para a varincia:

(n + 1) (n + 1) (n n ) (n n )

1
2
1
11
2
11

LP
=
vd
ar N
2
(n11 + 1) (n11 + 2)

(3.14)

Caso Multinomial
Atendendo que n1 e n2 podem ser expressos respectivamente por n10 + n11 e
n01 + n11 , tambm possvel obter uma estimativa para a varincia traduzindo
o problema numa multinomial, onde n10 , n01 e n11 so variveis aleatrias. A
funo de mxima verosimilhana para o caso multinomial a expresso 3.5 atrs
apresentada.
Seja (z10 , z01 , z11 ) =

(z10 +z11 )(z01 +z11 )


,
z11

onde a mdia de z10 , z01 e z11 so re-

spectivamente Z10 e Z01 e Z11 .Utilizando a expresso 3.11 vem que:

(n
n
n
+
n
)
(n
+
n
)
1
2
10
11
01
11
LP
= vd
ar
= vd
ar
vd
ar N
n11
n11

2
2

d
d

.var (n10 ) +
.var (n01 )
dz10 z10 =z
dz01 z01 =z
10

01

37

2
d
+
.var (n11 ) +
dz11 z11 =z
11

d
d
.cov (n10 , n01 ) +
+2
dz10 z10 =z
dz01 z01 =z
01

10

d
d
.cov (n10 , n11 ) +
+
dz10 z10 =z
dz11 z11 =z
10
11
!

d
d
.cov (n11 , n01 )
dz11 z11 =z
dz01 z01 =z

11

01

(n10 + n11 )2
(n01 + n11 )
.var
(n
)
+
.var (n01 ) +
10
n211
n211
((n01 + n10 + 2n11 ) n11 (n10 + n11 ) (n01 + n11 ))2
+
.var (n11 ) +
n411

(n10 + n11 ) (n01 + n11 )


+2
.cov (n10 , n01 ) +
n211
((n01 + n10 + 2n11 ) n11 (n10 + n11 ) (n01 + n11 ))

+
n311
(n01 + n11 ) cov (n10 , n11 ) +
+

((n01 + n10 + 2n11 ) n11 (n10 + n11 ) (n01 + n11 ))

n311

(n10 + n11 ) cov (n11 , n01 ))

n21 n22 V ar (n10 ) V ar (n01 )


+
+
=
n211
n21
n22
((n1 + n2 ) n11 n1 n2 )2
+
.var (n11 ) +
n411
n21 n22 cov (n10 , n01 )
+2 2 .
+
n11
n1 n2
n2 ((n1 + n2 ) n11 n1 n2 )
.cov (n10 , n11 ) +
+2
n311
n1 ((n1 + n2 ) n11 n1 n2 )
.cov (n01 , n11 )
+2
n311

38

Uma vez que as variveis aleatrias n01 , n10 e n11 seguem uma distibuio
multinomial4 Mult (n, 10 , 01 , 11 ), onde n = n01 + n10 + n11 e 10 =
01 =

(1p1 )p2
p

e 11 =

p1 p2
p

p1 (1p2 )
,
p

, p = p1 + p2 p1 p2 , com temos que:

var (n01 ) = n 10 (1 10 );
var (n01 ) = n 01 (1 01 );
var (n01 ) = n 11 (1 11 );
e as seguintes covarincias:
cov (n10 , n01 ) = n 10 01 ;
cov (n10 , n11 ) = n 10 11 ;
cov (n11 , n01 ) = n 11 01 ;
e portanto,

2 2
n
(1

)
(1

)
n
n
n
10
10
01
01
1
2
LP
vd
ar N
+
+
=
n211
n21
n22

((n1 + n2 ) n11 n1 n2 )2
.n 11 (1 11 )
n411
2n2 n2 n 10 01 2n2 ((n1 + n2 ) n11 n1 n2 ) n 10 11
+
+
1 22
n11 n1 n2
n311
2n1 ((n1 + n2 ) n11 n1 n2 ) n 11 01
(3.15)
+
n311

Dado uma varivel aleatria Xi

(i = 1, ..., k), tal que X y M ult (n, p1 , ..., pk ) com


Pk
pi = P (Ai ), onde
i=1 pi = 1, ento V ar (Xi ) = npi (1 pi ) para todo i = 1, ..., k e
Cov (Xi , Xj ) = npi pj , i 6= j.

39

A varincia tanto para p1 como para p2 obtm-se considerando as distribuies


binomiais condicionadas das variveis, isto :
- n11 |n2 y Bin (n2, p1)

vd
ar (
p1 |n2 ) = vd
ar

n11
|n2
n2

vd
ar (n11 |n2 )
n2 p1 (1 p1 )
p1 (1 p1 )
=
=
2
2
n2
n2
n2

(3.16)

- n11 |n2 y Bin (n2, p1)

ar
vd
ar (
p2 |n1 ) = vd

n11
|n1
n1

vd
ar (n11 |n1 )
n1 p1 (1 p1 )
p1 (1 p1 )
=
=
2
2
n1
n1
n1

(3.17)

3.2. Modelo de Trajectos Lineares

3.2.1. Trajectos Lineares


semelhana do modelo de Lincoln - Petersen, o modelo de trajecto linear tambm permite estimar o tamanho de uma determinada populao, embora o modelo seja geralmente utilizado para estimar a densidade populacional 5 , que um
parmetro fundamental nos estudos biolgicos de uma populao.
5

Entende-se por densidade populacional ao nmero de indivduo por unidade de rea.

40

No modelo, parte-se de princpio que a rea representada por A, da qual se


pretende estimar a densidade populacional conhecida, Figura 3.2.

Figura 3.2: Distribuio dos indivduos sobre a rea A. representa os indivduos (animais)

na rea de estudo A. Apesar dos animais terem tendncia a agruparem-se, as vezes parte-se do
principio que estes seguem um processo de Poisson.

De uma forma aleatria, traam-se linhas rectas ao longo da rea (lj , tal que
P

lj = L). Cada uma dessas linhas, lj , ento percorrida de uma ponta outra,

a medida que se vo detectando os objectos. Aos indivduos detectados, mede-se


a distncia (xi ) perpendicular linha do trajecto - Trajecto linear, Figura 3.3.
Por vezes, os indivduos so detectados ao longo de uma faixa de largura 2w
(predefinida pelo experimentador) - Trajecto ao longo da faixa, Figura 3.4.
Quando as distncias perpendiculares (xi ) no esto disponveis, estas podem
ser obtidas a partir de duas grandezas, Figura 3.5, conhecidas : ri e i , isto :

xi = ri cos (i ) , (e Zi = ri cos (i ))

41

a)

b)

Figura 3.3: a) Trajectos lineares. b) Os objectos em cima da linha so observados e presupesse que os mais distantes da linha tem menor probabilidade de serem observados, tanto menor
quanto maior for a distncia.

Pressupostos do mtodo

B1 Os N objectos esto distribudos ao longo da rea A segundo um processo


estocstico 13 ;
B2 A linha recta L , que atravessa a rea, traada ao acaso;
Entre os pressupostos h que contar com os mais crticos, nomeadamente:
B3 Os indivduos sobre a recta nunca so esquecidos, i.e., so detectados com
probabilidade 1;
B4 Os animais nunca se movem de um lugar antes de serem detectados, e alm
disso so contados uma nica vez tendo em conta que a deteco de um
independente do outro. No existem erros de medio;
13

Dado um espao de probabilidade (, A, P ) e um conjunto arbitrrio T , um processo estocstico uma funo real e finita X (t, ), definida no produto cartesiano T que para cada
fixo T , funo mensurvel ( no sentido de Borel) de . Neste caso o processo estocstico
representa um fenmeno aleatrio que evolui no espao, onde t (t (0, +)) representa o espao.

42

Figura 3.4: Trajecto linear ao longo da faixa de largura 2w.

Figura 3.5: Clculo da distncia xi .


.

3.2.2. Funo de deteco

Aps o clculo das distncia perpendiculares, xi , constri-se ento, um histograma


de frequncias e a partir deste um polgono de frequncias que ajustado funo
de deteco pelo mtodo da mxima verosimilhana, pois entre vrias h uma
que melhor se ajusta a funo, Figura 3.6. medida que a distncia xi tende a
aumentar os indivduos detectados tornam-se cada vez mais escassos.
43

Figura 3.6: Vrias tentativas para a funo de deteco : A - Normal truncada , B - Uniforme,
C - Exponencial Negativa, D - Hazard-Rate, que depois de escolhida em funo da performance
de cada uma faz-se uma ajuste da funo deteco.

A funo de deteco dada por:

g (x) = P [observar um indivduo|x]


Voltando aos pressupostos, nota-se que quando um indivduo estiver em cima
da linha recta L, isto quando xi = 0, vem que:

g (0) = P [observar um indivduo|0] = 1


traduzindo naquele que talvez o pressuposto mais crtico, uma vez que, sobre
44

a linha L, o animal pode no ser detectado por diversas razes. Por exemplo,
pode-se encontar sobre a copa de uma rvore, debaixo de um tufo de ervas ou
num lago, fazendo com que tal pressuposto seja constantemente violado.
Normalmente, no mtodo de trajecto linear, para simplificar e tornar mais
cmodo o estudo, o experimentador estipula uma certa distncia mxima denominada por w, para a deteco dos animais. Aqueles que se encontrem para alm
da distncia estabelecida so simplesmente ignorados.
Uma outra possibilidade para a seleco dos dados , depois de observados
os indivduos, ignorar uma parte das distncias com menos frequncia. Certos
autores (Alldredge e Gates, 1985) aconselham uma reduo de 5 a 10% dos indivduos mais distantes do observador.
Uma funo truncada num dado intervalo (a, b) em que b > a, onde se exclui todos os valores que no pertencem ao intervalo tem a seguinte funo de
distribuio:

F (x) =
x (a,b]

0xa
F (x)F (a)
F(b)F(a)

a<xb

1x>b

Se existir a funo densidade temos que:

F (x) =
x (a,b]

Rx
Rab
a

0xa
f (u)du
f (x)dx

x (a, b]

1x>b
45

e por derivao obtemos a funo densidade:

f (x) =
x (a,b)

f (x)
a f (x)dx

Rb

x (a, b)

1xaexb

Assim, a funo deteco g (x) truncada no intervalo [0, w], que no uma
densidade de probabilidade, substituda por outra, f (), tal que:

xi (i = 1, 2, , n2 )

Um objecto ser detectado pelo observador no


f (xi |n2 ) = f
rectngulo de rea 2wL, a uma distncia xi da linha L
g (xi )
g (xi )
= Rw
=

g (x) dx
0

com f (0) =

Rw
0

R wg(xi )
0 g(x)dx

= 1 como se pretendia, Figura 3.7.

Figura 3.7: Funo densidade truncada, g(x).

46

3.2.3. Estimao da densidade populacional

Paralelamente linha recta L traam-se duas outras rectas, que distam da primeira
w unidades. Partindo do princpio que os pressupostos so respeitados, B1 -B5 ,
ao longo da rea de largura 2w os indivduos so detectados com o objectivo de
estimar a densidade populacional.
Assim, a densidade populacional estimada por:

= NT L
D
A

(3.18)

T L a estimao da populao na rea A = 2wL.


onde N
Depois de estimada a proporo da populao ao longo da rea A, designada
por p2 , 3.18 toma o seguinte aspecto:

=
D

n2
2wL
p2

(3.19)

p2 razo entre o nmero de indivduos detectados na rea (n2 ) e a populao


total estimada (NT L ) ou ento:

p2 =

Rw
0

g (x) dx

=
w
w

onde g (x) a funo de deteco acima referida.

47

(3.20)

Da expresso 3.19 e 3.20 obtm-se


= n2
D
2L

(3.21)

e como se verifica w desaparece, no interferindo, assim, na densidade o que faz


com que este mtodo seja basicamente utilizado para estimar a densidade e no
o tamanho da populao.
No entanto, o parmetro w constitui um marco importante para estimar o
T L =
tamanho da populao, pois este depende inteiramente do valor de w, N

n2 w
.

Entretanto, o modelo trajecto linear quando combinado com o Lincoln-Petersen


constituem um modelo eficaz para estimar o tamanho da populao, com estimadores robustos, pois o pressuposto g0 = 1 j no ser necessrio.
Tendo em conta que a rea A uma constante e que o tamanho da populao
depende de determinados parmetros, a varincia da densidade da populao
expressa por:

= V ar
V ar D

T L
N
A

= 2 V ar NT L
A

Para melhor compreender a importncia de g0 , considera-se a seguinte notao


para a funo de deteco:

g (x) = g (0) g (x) = g0 g (x)

48

de tal maneira que p2 passa a definir-se por:



p2 =

Rw
g x| dx
0
g0

Rw
0

w
g x| dx
w

Rw


g0 g x| dx

g0
w

e por conseguinte temos que :


= n2 = n2
D
2L
2g0
L
Como se pode constatar no Quadro 3.1 quando g0 toma valores inferiores a
1, o enviesamento tanto maior quanto menor for g0 . O mesmo se aplica para o
tamanho da populao. Quanto menor for a probabilidade de um indivduo que
encontra sobre a linha L ser observado maior ser o enviesamento e o tamanho
da populao sobestimada.

Quadro 3.1: Densidade populacional em funo de g0


g0 Di
1
D1 = D
1
D2 = 2D
2
1
D3 = 3D
3

49

3.2.4. Funo da mxima verosimilhana


Caso condicionada (Buckland, 1993)

Buckland traduz o modelo por uma equao mais simples, mas tambm menos
realista, na qual a funo de verosimilhana condicionada a n2 :

L () = f (x1 , x2 , , xn2 |n2 )

= f (x1 |n2 ) f (x2 |n2 ) f (xn2 |n2 )


(Os acontecimentos so independentes entre si)

n2
Y
i=1

g (xi )
Rw
g (x) dx
0

L (x1 , x2 , , xn2 |n2 ) =

n2
Y
g (xi )
i=1

(3.22)

Caso Binomial (Seber, 1982)

Ao longo dos tempos a funo para o mtodo de trajecto linear foi abordada de
diversas maneiras. Seber6 apresentou a funo de verosimilhana tendo em conta
que as distncias e o total de indivduos observados so variveis aleatrias.
6

Grande parte das pesquisas George A. F. Seber so sobre populaes abertas. O seu trabalho foi desenvolvido em conjunto com J. N. Darroch. Hoje uma dos altos dirigentes do
departamento de matemtica na universidade de Auckland.

50

Eis ento, a funo de verosimilhana desenvolvida por Seber:

L () = f (x1 , x2 , , xn2 , n2 )
= f (x1 , x2 , , xn2 |n2 ) f (n2 )
(Propriedade condicionada da funo densidade)

= f (x1 |n2 ) f (x2 |n2 ) f (xn2 |n2 ) f (n2 )


(Os acontecimentos so independentes entre si)

NT L n2
p2 (1 p2 )NT L n2
= f (x1 |n2 ) f (x2 |n2 ) f (xn2 |n2 )
n2
(Os n2 objectos tem funo de distribuio Binomial7 )

=
=
=

NT L n2
p2 (1 p2 )NT L n2
f (x1 |n2 ) f (x2 |n2 ) f (xn2 |n2 )
n2

g (x1 )
NT L n2
g (x1 )
g (xn2 )
Rw
Rw
p2 (1 p2 )NT L n2
Rw
g (x) dx 0 g (x) dx
g (x) dx n2
0
0

n
2
Y g (xi )
NT L n2
Rw
p2 (1 p2 )NT L n2
g (x) dx n2
i=1 0

n2
Y
g (xi ) NT L n2
p2 (1 p2 )NT L n2
L (x1 , x2 , , xn2 , n2 ) =
(3.23)

n
2
i=1

Utilizando a funo de mxima verosimilhana desenvolvida por Seber estima7

Os n2 objectos tm funo de distribuio Binomial. Num universo de NT L , cada um dos


n2 objectos pode ou no ser visto pelo observador com probabilidade p2 - o que traduz numa
binomial.

51

se o vector parmetro donde se obtm



p2 =

Rw
g x| dx
0
w

e aplicando o lema de Chapman temos que :

T L =
N

n2

p2

Sabe-se que uma constante dada por


interpretar como:

x, =

(3.24)

Rw
g x| dx e que tambm pode-se
0

1
g (x)
=
f (x)
f (x)

e em particular quando x nulo. No esquecendo o pressuposto g (0) = 1, e


fazendo x = 0 temos que:

1
g (0)
=
f (0)
f (0)

portanto

T L = n2 f (0) w
N

52

De 3.18 e 3.19:

=
D

n2 f (0)
n2
n2
=
=
2wL
p2
2L

2L

logo o tamanho da populao dado pela seguinte expresso:

= n2 f (0) 2Lw
T L = DA
/ = n2 f (0) w
N
2L
/
Da equao 3.24 consideram-se n2 e p2 como sendo variveis aleatrias e aplicando a tcnica do clculo da varincia utilizando uma aproximao da srie de
Taylor, temos que a varincia estimada da populao :

n2
T L = Vd
T L Vd
ar N
ar
Vd
ar N
p2

2
2

=
.Vd
ar (n2 ) +
.Vd
ar (
p2 )
Z1 z=Z
Z2 z=Z
1

Vd
ar (n2 ) n22 Vd
ar (
p2 )
=
+
2
4
p2
p2

!
Vd
ar (n2 ) Vd
ar (
p2 )
+
n22
p22

T2 L (CV (n2 ))2 + (CV (


T L = N
p2 ))2
Vd
ar N

n2
= 22
p2

(3.25)

Sabe-se que a p2 (proporo de indivduos capturados) definido condicionado

53

a n2 , mas se admitirmos que so independetes uma do outra temos que:

p2 ]
E [
p2 |n2 ] = E [
e a covarincia entre n2 e p2 nula, ento:

p2 |n2 ) , n2 )
cov (
p2 , n2 ) = cov ((
= E ((
p2 |n2 ) n2 ) E (
p2 |n2 ) E (n2 )
(definio da covarincia)
p2 |n2 ) n2 |n2 )) E [
p2 ] E (n2 )
= En2 (E ((
(propriedade da esperana condicionada)
p2 |n2 )) E [
p2 ] E (n2 )
= En2 (n2 E (
p2 ] E [
p2 ] E (n2 )
= E (n2 ) E [
= 0

A varincia de n2 pode ser estimada por diversas formas. Na altura da realizao da experincia, ao invs de se retirar uma nica amostra, tiram-se vrias e
ar (n2 ).
com base nisso obtm-se uma estimativa para a varincia emprica de n2 , Vd

Tambm com base nos conhecimentos duma experincia pode-se estimar a varincia de n2 atravs de mtodos computacionais utilizando, por exemplo, o mtodo
de Monte Carlo, Dias (1979).
Tendo em conta que os estimadores de mxima verosimilhana so assimptot
icamente normais, uma aproximao para a varincia p2 pode ser obtida pela
expresso 2.10.

54

Vejamos ento o caso em que a funo deteco a exponencial negativa e a


funo de verosimilhana a de Buckland (1993):
Seja a funo deteco

g (x|) = ex , 0 < x w
ento temos que


p2 =

Rw
g x| dx
0

1
=
w
e

ew

Z
1 w x
1 x
1
=
e
e dx =

w 0
w
0
!

1
1

1 ew
+
=

h i2
h i2
0
0
p2
p2
|=
|=
2

2
E 2 ln L (|X) |=
2 ln L (|X) |=

2
2

we(w) 1 + ew
1 + ew

=
2
2
w2 n2 e2w + w2 ew + 2ew 1


V ar p2 |

(A dimenso da amostra n2 )

O modelo de trajecto linear acima abordado conduzido por um nico observador. Um modelo mais geral, que considera a deteco dos animais por vrios
observadores, foi proposto por Alpizar e Pollock (1996). Este modelo considerado mais realista (pois na realidade o observador ptimo no existe) e toma em
conta que as probabilidades de deteco so diferentes entre os observadores.

55

3.3. Combinao dos modelos de Lincoln-Petersen e Trajectos Lineares


3.3.1. A combinao
O modelo de captura - recaptura do Lincoln-Petersen (com dois tempos de amostragem)
considera que as variveis aleatrias n10 , n01 e n11 tm distribuio multinomial.
Para estimar a populaco usando informao das distncias em que se encontram os animais marcados da linha L, recorre-se ao modelo de trajecto linear no
segundo tempo de amostragem.
Ao combinar os dois modelos, obtm-se maior informao sobre a populao
e permitido a violao do pressuposto crtico B3 , ou seja, um animal em cima
da linha L pode no ser detectado pelo observador.
S se considera o caso em que g0 < 1, pois g0 > 1 no tem significado biolgico e possvel estimar g0 . Toda esta informao traduz-se num modelo com
estimadores mais eficientes que os outros dois.
J que este modelo combina informaes dos outros dois natural que tenha
como pressupostos :
C1 Os pressupostos do modelo de Lincoln-Petersen e os do trajecto linear (A1 A3 e B1 , B2 , B4 e B5 );
e um outro cujo pressuposto lhe peculiar
C2 independncia entre os animais marcados e avistados no trajecto linear.

56

Tendo em conta os pressupostos do mtodo e com o mesmo objectivo (estimar


o tamanho da populao), capturam-se os indivduos, que so posteriormente
soltos aps terem sido marcados tal e como no mtodo de Lincoln - Petersen (n1 ).
De seguida, baseando no mtodo de trajectos lineares e de uma forma aleatria,
os objectos so de novo avistados (n2 ) e separados em:
- marcados e avistados segundo o mtodo de trajectos lineares (n11 );
- avistados segundo o mtodo de trajectos lineares, mas sem terem sido marcados, (n01 )
- marcados, mas no avistados segundo o mtodo de trajectos lineares (n10 );
e ao total dos indivduos (marcados e avistados) designa-se por n (= n11 + n10 + n01 ).

3.3.2. Funo da mxima verosimilhana


Da combinao dos dois modelos e dados os pressupostos acima referidos obtm-se
a seguinte funo de mxima verosimilhana completa:

L () = LLP () LT L ()

(3.26)

em que:
- LLP (N, p1, p2 () |n11 , n10 , n01 ) a funo da mxima verosimilhana multinomial do modelo captura-recaptura;
- LT L (| (x1 , x2 , , xn2 ) , n2 ) a funo da mxima verosimilhana do modelo de trajectos lineares.
57

No modelo combinado p1 (p2 ) a probabilidade de um indivduo ser marcado


(avistado) na primeira (segunda) captura e p (= p1 + p2 p1 p2 ) a probabilidade
de um objecto ser detectado no processo todo.
Alpizar - Jara e Pollock (1999) definiram 3.26 da seguinte maneira :

L (N, p1, g0 , | (x1 , x2 , , xn2 ) , n11 , n10 , n01 ) = LLP () LT L ()

= fLP (n11 , n10 , n01 |N, p1 , p2 ()) fT L (x1 , x2 , , xn2 |n2 , )

onde p2 () =

Rw
0

(3.27)

g (x|) dx

=
w
w

H que ter em conta que o parmetro que define a funo deteco.

LLP (N, p1, p2 () |n11 , n10 , n01 ) =

n10

n01 n11

[p1 (1 p2 ())]n10 [(1 p1 ) p2 ()]n01 [p1 p2 ()]n11 [(1 p1 ) (1 p2 ())]Nn


(3.28)

58

LT L (| (x1 , x2 , , xn2 ) , n2 ) =

n2
Y
i=1

Rw
0

g (xi )
g (x|) dx

(3.29)

A informao do trajecto linear expressa pela funo de verosimelhana


desenvolvida por Seber (1982, ver 3.23) e no a de Buckland (1993, ver 3.22)
pelo facto de 3.28 conter tal informao, pois a distribuio binomial um caso
particular da distribuio multinomial.
A partir das expresses 3.27, 3.28 e 3.29 estimam-se os parmetros. Aos estimadores do tamanho da populao obtidos a partir da expresso 3.27 designam-se
MC ), aqueles que forem
por estimadores da mxima verosimilhana completa (N
obtidos exclusivamente a apartir de 3.28 ( sem tomar em conta a informao
proporcionada pelas distncias) denominam-se por estimadores Lincoln-Petersen
T L .
LP ); e os que forem meramente estimados por 3.29, entendem-se como N
(N

3.3.3. Estimao de N e g0
Sem perda de generalidade, seja a seguinte notao para a funo deteco definida
a menos da constante de proporcional g0 :

g (x|) = g0 g (x|)

(3.30)

No possvel estimar g0 com apenas um dos modelos. O modelo de trajecto


linear no permite estimar g0 j que, por hiptese, supe que este vale 1. Por
59

outro lado, no modelo de captura-recaptura, podemos escrever p2 em funo de


g0 :

p2 = g0

= g0 p2
w

(3.31)

porm, um estimador para p2 estima o segundo membro da equao 3.31 como


sendo um produto e no separadamente. Posto isto, s possvel estimar g0 , se
for utilizada toda a informao existente.
A questo que se pe agora decidir qual o modelo a utilizar para estimar N.
A deciso reside no facto do pressuposto B3 ser ou no violado, vejamos ento o
que acontece nos dois casos:
1 Se admitirmos que um animal em cima da linha do trajecto linear nem
sempre avistado pelo observador, ou seja g0 < 1, estamos no caso do
modelo de Lincoln -Petersen, o pressuposto mais importante do modelo de
trajecto linear violado. No faria sentido estimar a populao pelo mtodo
de trajecto linear j que a populao subestimada, logo o estimador para
N seria enviesado.
Como g0 < 1, ento de 3.31 vem que

p2 < p2

e utilizando a funo de verosimilhana completa condicionada a informao do


MC coincide
modelo de captura-recaptura e as distncias, temos que o estimador N
LP .
com o estimador de mxima verosimilhana de Lincoln-Petersen, N
60

LP um estimador de mxima verosimilhana de N e tendo em conta


Assim, N
3.8, p2 =

n11
,
n1

e 3.1 temos que

LP = n1 n2 = n2
N
n11
p2

(3.32)

sendo a respectiva varincia dada pela expresso 3.13 ou 3.15.


2 Quando um indivduo que se encontra sobre da linha L detectado com
LP deixa de ser
probabilidade certa, g0 = 1, e sob as condies C1 e C2 N
um estimador de mxima verosimilhana de N, pois de 3.31 temos que

p2 = p2

isto , p2 e p2 confudem-se, e temos trs candidatos para o estimador da


T L e N
MC . Dos trs, N
MC sem dvida o estimador
N
LP , N
populao, N:
mais preciso e por isso mais eficiente.
Para estimar a populao necessrio combinar toda a informao existente.
Para tal utiliza-se a funo de verosimilhana completa, 3.27.
A propriedade de invarincia garante que escrevendo 3.26 como:

L () = L1LP () L2LP () LT L ()
e tendo em conta o lema de Chapman, ver Apndice A, obtem-se o seguinte

61

estimador para N:

MC =
N

n
p ()

onde p dado em funo de p1 e p2 (), mas com a particularidade de p2 depender


de parmetro . Consequentemente, o prprio p expressa-se em prol de :

p () = p1 + p2 p1 p2
semelhana dos outros casos, 3.15 e 3.25, uma estimativa para varincia do
MC , da populao pelo mtodo combinado obtm-se tendo em conta
estimador, N
3.11.
Seja (z1 , z2 ) =

z1
z2

n
,
p(
)

onde a mdia de z1 e z2 so respectivamente Z1 e

Z2 , temos que:

n
MC
Vd
ar
Vd
ar N
p

2
2

d
=
.V ar (n) +
.Vd
ar p
Z1 z=Z
Z2 z=Z
1
2

2d

Vd
ar (n) n V ar p
+
=
p2
p4

d
2
V
ar
p
n Vd
ar (n)


= 2
+
p ()
n2
2

p
62

2
2
2

V ar NMC = NMC (CV (n)) + CV p

(3.33)

A varincia impirca pode ser uma boa estimativa para V ar (n). Utilizando o
mtodo de Monte Carlo obtm-se Vd
ar (n) e recorrendo as propriedades da varincia e a aproximaes da srie de Taylor tem-se:


Vd
ar (
p) = Vd
ar (
p1 ) + Vd
ar p2 Vd
ar p1 p2

2

d
d
d
= V ar (
p1 ) + V ar p2 V ar (
p1 ) p2

p1 )2
Vd
ar p2 (
Para o clculo de Vd
ar (
p1 ) utiliza-se 3.16 e 2.10:
2

(1

)
p2
1
1
p1 (1 p1 ) d
+ V ar p2
Vd
ar (
p) =
n2
n2
2

d
V ar p2 (
p1 )


Uma estimativa para a varincia de p2 depende obviamente da funo de

deteco utilizada no modelo e para uma expresso para Vd
ar p2 , complexa
P
na maioria das vezes, recorre-se matriz varincia-covarincia .
Para estimar g0 integra-se ambos membros da equao 3.30:

63

g x| dx =


g0 g x| dx

(3.34)

donde vem que um estimador para g0 :


w

p2
p2 n2
= =

p2
n2 p2

g0 =

T L ,
e tendo em conta 3.32, lembre-se que o estimador de 3.29 para N dado por N
g0 expressa por:

g0 =

T L
N
LP
N

LP e de N
T L , g0 aproximadamente 1.
Quando h pouca diferena entre N
LP , pois
T L maior do que N
Para fins prcticos no interessa os casos em que N
,
e
tem-se g0 > 1. A varincia de g0 expressa em funo das varincias de
dela prpria:

d
d
V ar (
g0 ) = V ar

))2
))2 + (CV (
= g02 (CV (

(3.35)

Atendendo que
(
) pode ser interpretado como
= wp2 (
= wp2 ) e
64

portanto:
p2 (1 p2 )
Vd
ar (
) = w2 Vd
ar (
p2 ) = w2
n1

Tendo em conta 2.10 temos que:

ar (
p2 ) = w2
Vd
ar (
) = w2 Vd


e neste caso temos que h =

Rw
0

h i2
0
|=
h
2


2 ln L (|X) |=

g (x|
)dx
.
w

Vejamos agora que nem sempre facil obter uma expresso para uma estima-

tiva de g0 . Recorde-se que p2 =

n11
n1

(ver Apndice B) e seja a funo deteco

dada por:

x2

g (x|) = e

,temos que


p2 =

Rw


g x| dx

Rw

x2

e dx
0
=
=
w
w p
p
w
w

erf
erf

=
' 0.88625
2w
w
0

65

onde

erf (x) =

R x t2
e dt
0

e portanto

g0 =

p2
n11
=

p2
n1

w
p .
w

0.88625 erf

3.4. Exemplo prtico


O exemplo ter como base uma os resultados duma experincia feita por Otto
em 1982 com latas castanhas de cervejas. Foram utilizadas latas distribudas em
quatro grupos de tamanhos diferentes: 1, 2, 4 e 8 respectivamente. As latas
foram distribudas aleatoriamente ao longo de um trajecto linear com 200 metros
de comprimento e 20 metros de largura. Foram usados nove observadores, que
nunca saram da linha da L.
Otto considerou um total de 495 latas de cervejas; 33 do primeiro grupo, 66
do segundo, 132 do terceiro e 264 do ltimo grupo, cujo tamanho era 8.
Por meio deste mtodo, Otto foi capaz de registar a distncia exacta perpendicular e o grupo de tamanhos de cada objecto visto por cada observador.
Como Otto possuia um mapa com a distribuio dos objecto, foi possvel estimar
a probabilidade de avistar cada objecto baseado nos nove observadores.
Por simplicidade nas anlise dos dados em vez de vrios grupos e nove observadores, vou considerar as latas como unidades individuais vistas por apenas um

66

observador.
O Quadro 3.2 apresenta os dados que aqui sero analisados e correspondem
s distncias das latas que foram detectadas pelo observador, num total de 202
observaes.
Quadro 3.2: Nova organizao dos dados de Otto
0.11 2.18 2.19 3.51 3.75 4.05 4.09 4.1 5.16 8.42 0.93 0.93 1.11 1.11 1.33 1.33 1.69 1.69 2.31
2.31 4.15 4.15 4.26 4.26 4.35 4.35 5.24 5.24 5.28 5.28 5.48 5.48 7.20 7.20 7.31 7.31 17.01
17.01 0.88 0.88 0.88 0.88 1.77 1.77 1.77 1.77 3.35 3.35 3.35 3.35 4.35 4.35 4.35 4.35 8.97
8.97 8.97 8.97 9.58 9.58 9.58 9.58 9.61 9.61 9.61 9.61 0.14 0.14 0.14 0.14 0.14 0.14 0.14 0.14
0.26 0.26 0.26 0.26 0.26 0.26 0.26 0.26 0.30 0.30 0.30 0.30 0.30 0.30 0.30 0.30 0.74 0.74 0.74
0.74 0.74 0.74 0.74 0.74 1.12 1.12 1.12 1.12 1.12 1.12 1.12 1.12 2.68 2.68 2.68 2.68 2.68 2.68
2.68 2.68 2.91 2.91 2.91 2.91 2.91 2.91 2.91 2.91 4.13 4.13 4.13 4.13 4.13 4.13 4.13 4.13 5.58
5.58 5.58 5.58 5.58 5.58 5.58 5.58 6.03 6.03 6.03 6.03 6.03 6.03 6.03 6.03 7.27 7.27 7.27 7.27
7.27 7.27 7.27 7.27 7.63 7.63 7.63 7.63 7.63 7.63 7.63 7.63 7.9 7.9 7.9 7.9 7.9 7.9 7.9 7.9 8.35
8.35 8.35 8.35 8.35 8.35 8.35 8.35 8.51 8.518.51 8.51 8.51 8.51 8.51 8.51 9.69 9.69 9.69 9.69
9.69 9.69 9.69 9.69 11.79 11.79 11.79 11.79 11.79 11.79 11.79 11.79

Depois de escolhida a funo, funo chave, que melhor se ajuste aos dados em
questo. altura de definir o nmero de termos de ajustamento da expanso de
srie que ajuste a funo chave s distncias. No programa Distance8 , a funo
de deteco definida pela seguinte frmula geral:

g (y) = f unao chave (y) [1 + s


erie (y)]
(Buckland,1993)

onde s
erie corresponde respectiva expanso de srie:
8

Distance 3.5, Realise 5, www.ruwpa.st-and.ac.uk/distance.

67

Funo chave
Metade da normal,

Expanso de srie

1
w

Coseno,
y2

Exponencial Negativa, e 22

Coseno,

Uniforme, e

Coseno,

onde m o total de termos da srie e

aj

Pm

j=1

Pm

j=1

aj cos
aj cos

Pm

j=1 aj cos

jwy
w

jwy
w

jwy
w

= 0 se o termo j de cos jwy n


ao e usado no modelo ou
w

e estimado pela f unao de maxima verosimilhana

De acordo com o critrio de informao de Akaike, AIC 9 , possvel constatar


que a funo metade da normal 10 a que melhor se ajusta aos dados acima
apresentados, Quadro 3.3.

Quadro 3.3: Critrio de Informacco de Akaike


Funo de deteco AIC Funo chave
Metade da Normal
Exponencial Negativa
Uniforme

y2

k (y) = e 2A(1)2
y
772.60 k (y) = e A(1)
1
930.24 k (y) = W
744.83

Utilizando a funo metade da normal como funo de deteco sem ajustaRw


mento de termos e tendo que Distance define
= 0 g x| dx, no Quadro 3.4

T L , p2 e
.
esto apresentados : N
9

AIC = 2lnL + 2p. L a funo de mxima verosimilhana e p o nmero de parmetros


existentes.
10

y2

A funo metade da normal dada por g (y) = e 22 onde o parmetro que a define.

68

Quadro 3.4: Estimadores de Trajecto Linear-Metade da Normal sem ajustamento de termos


Parmetro Estimao SE
CV
IC 95%

7.6410
0.3934 0.0515 [6.9038; 8.4570]
p2
0.3820
0.0197 0.0515 [0.3452; 0.4228]
T L
529.00
46.122 0.0872 [445.00; 628.00]
N
Apesar da funo metade da normal ser a que melhor se ajusta aos dados
apresentados no Quadro 3.2, a populao subreestimada com um enviesamento
relativo de 6.87%. A Figura 3.8 mostra que medida que afastamos da linha
L h cada vez menos latas observadas e as latas que se encontram sobre a linha
so observadas com probabilidade 1, como j era de se esperar. H uma grande
concentrao de latas na faixa compreendidade entre 4 a 10 metros da linha L.

Figura 3.8: Dados das distncias de latas de cervejas castanhas obtidas atraves da experincia
de Otto,1982.

Para exemplificar o modelo de captura-recaptura, vou utilizar parte da informao dos dados de Otto apresentado no Quadro 3.2.
A dimenso da populao das latas de cervejas 495. Do programa Distance
sei que p2 0.38, por parece razoavel considerar que p2 = 0.4 e sem perda de
generalidade, vou supor que p1 = 0.3. Atraves do programa Maple foi possvel
69

gerar uma binomial, Bin (N, p1 ), para o clculo de n1 (Apndice C- Quadro 5.1).
O Quadro 3.5 apresenta os resultados obtidos do programa PopSize para 149
indivduos marcados na primeira captura e 202 na recaptura. Para o clculo das
varincias de p1 e p2 , utilizei respectivamente as expresses 3.16 e 3.17.
Quadro 3.5: Estimao de Lincoln-Petersen ( PopSize)
p1
0.2970
se(
p1 ) 0.0321
p2
0.4027
se(
p2 ) 0.0401

se(NLP ) 41.964
A populao sobreestimada, pois para uma populao real de dimenso 495

o estimador de Lincoln-Petersen 501.63 = 149202


. O enviesamento deve-se ao
60

facto de as latas de cerveja se encontrarem agrupadas em dimenses diferentes


e a uma possvel falta de viso por parte do observador. Os grupos com maior
nmero de latas so detectados facilmentemente pelo observador.

Salvo o caso em que N = 495, os restantes foram estimado atraves do programa


PopSize11 utilizando 1000 simulaes.
Quadro 3.6: Comparao entre o estimador de Lincoln - Petersen e o de Chapman.

LP %BIAS N
LP
N
1a captura 2a captura N
%BIAS
200
1000
10000

60
300
3004

79
499
4993

225.7
1108.9
10900.4

0.1285
0.1089
0.0900

220.8
1097.5
10905.2

0.1040
0.0975
0.0905

No Quadro 3.6 verifica-se que o mtodo de Lincoln-Petersen mais eficaz para


populaes grandes; quanto maior populao menor o envisamento. Para
11

PopSize - Copyright 1998 by


www.iup.edu/~rgendron/software.htmlx)

Robert

70

P.

Gengron.

Version

1.0.

populaes pequenas, verifica-se que o estimador de Chapman mais eficz face


ao de Lincoln-Petersen. Apesar da varincia do estimador de Chapam ser menor,
para populaes grandes o enviesamento de ambos os estimadores praticamente
igual.
Da teoria sabe-se que possvel estimar o parmetro g0 utilizando a informao
dos dois modelos: modelo de Lincoln-Petersen e trajectos lineares.
Tendo em conta que p2 = 0.4 e p1 = 0.3, atravs do mtodo de Monte Carlo
obteve-se que n11 60 (ver rotina do Quadro 5.2 no Apndice C). Utilizando a
funo de mxima verosimilhana completa, 3.27, no Maple foi possvel estimar
g0 e os restantes parmetros p1 e , consultar Apndice C:
o
n

g0 1.05, p1 0.3, 77.11

Quadro 3.7: Estimao de g0


SE(g0 )
0.1241
IC 95%

[0.793,1.279]

como pode verificar-se, g0 > 1, pelo que o estimador da populao do modelo


LP . Temos que
combinado deve coincidir com N
R 20 x2

e dx
g
0
0
p2

20

=77.11,
g0 =1.05

71

0.4

e


p = p1 + p2 p1 p2
= 0.3 + 0.4 0.3 0.4
= 0.58

e portanto

MC = n = 291 = 501.7
N
p 0.58
LP , pois as pequenas diferenas
MC coincide com N
Pode considerarar-se que N
devem-se s aproximaes do programa utilizado, Maple. O parmetro g0 pode
LP :
T L e N
tambm ser estimado atravs da razo entre N

g0 =

T L
N
529.00
=
1.05
LP
501.63
N

Apesar de g0 ser maior do que 1, o que no tem importncia sobre o ponto de


vista biolgico, a teoria continua sendo vlida.

72

4. Simulao
Como j se referiu atrs, muitas vezes para melhor se conhecer a realidade recorrese a construo de modelos. Um estudo preciso e rigoroso de um fenmeno pode
ser custoso ou mesmo impossvel de se realizar. Contudo para se ter alguma
garantia da robustez do modelo essencial fazer estudos sobre esse. sobretudo
necessrio conhecer o comportamento do modelo mediante um conjunto de dados e
parmetros diferentes. Para um melhor conhecimento do modelo recorre-se ento
a simulaes do mesmo, utilizando mtodos numricos por via computacional.
O Mtodo de Monte Carlo muito conveniente para tratamento destes
modelos.
O objectivo da simulao encontrar estimativas para os parmetros g0 , p1
e . Primeiro ser analisado o caso em que a funo de verosimilhana no
restringida para depois, com base nesses resultados estudar o caso restringido.
Para tal, consideraremos a funo de verosimilhana dada por 3.27 sugeito a:

0 < g0 < 1

73

(4.1)

0 < p1 , p2 < 1

(4.2)

Mtodo Monte Carlo


O mtodo de Monte Carlo um mtodo de simulao que resolve problemas
atravs de meios numricos gerando variveis aleatrias.
A gerao de amostras aleatrias processa-se em duas fases distintas, uma
de gerar variveis aleatrias uniformes no intervalo [0, 1] e outra transforma-as
noutras, tambm aleatrias mas seguindo uma outra distribuio.
No mtodo de Monte Carlo para estimar um parmetro consideram-se variveis aleatrias X tais que a esperana matemtica deste seja exactamente .
Gera-se ento ns20 amostras, todas com dimenso k, obtendo-se assim matrizes
ns linhas por k colunas, Tabela 4.1. Assim, dos ns amostras obtm-se as respectivas X1 , X2 , , Xns variveis independentes e idnticas X a cuja a mdia
aritmtica

Pns
= i=1 Xi
X
ns

(4.3)

ainda uma varivel aleatria de esperana , com varincia21


20

ns um nmero suficentemente grande, que corresponde ao total de simulaes feitas.


A varincia definida por ( 4.2) a emprica corrigida, mais a frente ser definida a
assimpttica.
21

74


Pns
2

X
x
i
V ar (X) = i=1
ns 1

(4.4)

inversamente ao nmero de simulaes feitas.


Quadro 4.1: Mtodo de Monte Carlo

a11 a12 a1i


a1(k1) a1k
a21 a22 a2i
a2(k1) a2k
..
..
..
..
..
.
.
.
.
.
ans1

a2ns

ansi

ans(k1)

ansk

Parmetros a estimar
Atendendo a 3.27 e que LLP = L1LP L2LP , o Lema de Chapman garante-nos que
= n , consultar o apndice B, uma estimativa vlida. Entretanto para se obter
N
p
p (= p1 + p2 () p1 p2 ()) necessrio estimar p1 e p2 ().
Portanto, para se ter uma estimativa da populao N basta estimar p1 e p2 (),
pois n (= n10 + n01 + n11 ) conhecido.

O parmetro p2 ()
Vejamos como obter uma estimativa de p2 (). A probabilidade de um animal
ser detectado dada em funo dos parmetros, que definem a funo deteco.
Uma vez que a funo de deteco se define como g (x|) = g0 g (x|) certo
que p2 () depende sempre do parmetro g0 e de outros que definem g (x| ) .
Aqui, sero considerados apenas os casos em a funo deteco e a normal ou
75

exponencial negativa, ambas truncadas em [0, w]. Tanto para um caso como para
o outro a funo deteco depende apenas do parmetro . O vector parmetro
que define p2 () ento dado por = (g0 , ).

Os parmetros g0 , p1 e
O parmetro (que define a funo deteco e por conseguinte p2 ), g0 e p1 so
estimados mediante ao mtodo de mxima verosimilhana utilizando a expresso
3.27. Da resoluo numrica dum sistema de trs equaes, em que a cada equao
corresponde a derivada parcial em ordem a g0 , p1 e respectivamente, obtm-se
uma estimativa para cada um dos parmetros.
Entretanto, para gerar amostras de nmeros aleatrios que traduzem as distncias xi (i = 1, 2, , n2 ) necessrio definir um valor para do qual se pretende
estimar.
Vejamos ento como calcular para o caso particular em que a funo deteco
a exponencial negativa . Por hiptese g0 = 1, p2 () = 0.4 e w = 20.
Seja

g (x|) = g0 g (x|) = ex , 0 < x w


temos ento que
Rw
g
(x|)
dx
g0 g (x|) dx
= 0
p2 () = 0
w
w
R 20 x
x 20
e dx
1
e
=

= 0
20
20
0
Rw

76

1
=
20

1 e20

1
1 e20
20

isto

0.4 =

1
1 e20 , > 0
20

(4.5)

e20 + 8 1 = 0

Uma vez resolvida (por mtodos numricos22 ) a equao 4.5 obtm-se um valor
de sigma, que neste caso aproximadamente 0.1116.

Procedimentos do mtodo
O primeiro passo a ser dado a definio dos parmetros hipteses do modelo.
H que se estipular valores para:
ns (numero de simulaes);
N (tamanho da populao) e w;
p1 e p2 ;
e em consequncia de p2 obtem-se um valor para .
De seguida, o objectivo obter n2 (= n01 + n11 ). Para tal gera-se uma multinomial com parmetros N, p1 e p2 .
semelhana do sistema de urna, geram-se nmeros aleatrios U seguindo
uma distribuio uniformes em (0, 1) (U (0, 1)) e de acordo com a probabilidade
22

No programa Maple a equao 4.5 resolvida utilizando o comando fsolve.

77

de cada acontecimento, estes so distribudos na respectiva urna, Figura 4.1. No


fim do ciclo tem-se n10 , n01 , n11 e n00 .

Figura 4.1: Gerar uma multinomial pelo sistema de urnas


A partir do ciclo apresentado na Figura 4.2 obtm-se n2 , definindo assim o
nmero necessrio de distancias a gerar. As n2 distancias seguem uma determinada distribuio de probabilidades.
Para gerar variveis duma distribuio normal truncada utilizou-se o seguinte
pacote predefinido pelo Maple:

stats[random, normald[0, sigma]](1)

dos quais so considerados apenas os que estiverem no intervalo [0, w].


O caso em que a funo de deteco a exponencial negativa com parmetro23
, i.e. quando se tem
23

define-se custa do parmetro p2 .

78

Figura 4.2: Determinao de n2 . A = p1 (1 p2 ), B = p1 (1 p2 ) + (1 p1 )p2 ,


C = p1 (1 p2 ) + (1 p1 )p2 + p1 p2 .

g (x|) = ex

(4.6)

e
f (x) =

g (x|)
ex
= R w x =

e dx
0

79

ex
1
(1 ew )
w

1
0.8
0.6
0.4
0.2

10
x

15

20

x2

Figura 4.3: Grfico da funo deteco da Normal truncada em [0, 20]. g (x) = e , com
= 9.04296162.
considerou-se uma varivel contnua X, com funo densidade de probabilidade
definida em 4.6 e a funo de distribuio invertvel

F (x) =

f (t) dt

Defina-se, por transformao da varivel X numa nova varivel Y ,

Y = F (x) =

1 ex
1
x
1

e
=
1 ew
/1 (1 ew )
/

onde, F a funo de distribuio acima definida.

80

Figura 4.4: Transformao de x = G1 (y)


As funes distribuio, H (y), e densidade, h (y), da nova varivel vm dadas
por :

H (y) = P (Y < y) = P X < x = F 1 (y) = F F 1 (y) = y, y [0, 1]


e

h (y) =

dH (y)
= 1, y [0, 1]
dy

Ora a forma destas funes implica que

Y y U (0, 1)

A concluso a que se chega , portanto, que se uma varivel X tem uma


determinada distribuio com funo densidade f (x) e a funo de distribuio
F (x), ento a varivel Y = F (x) transformada segue uma distribuio U (0, 1).

81

Inversamente, se uma varivel Y segue uma distribuio U (0, 1), ento a varivel

= F 1 (y)

1
1
X = ln

1 y (1 ew )

segue uma distribuio com funo densidade de probabilidade f (x) e a funo


de distribuio F (x). Este o resultado no qual se fundamenta a gerao de
amostras aleatrias provenientes de populaes contnuas com funes de distribuio invertveis.

Comparao e avaliao da performance dos estimadores


Posto isto, encontramo-nos em condies de aplicar o mtodo de Monte Carlo
para avaliar as propriedades dos estimadores de mxima verosimilhana para os
parmetros acima referidos.
Primeiro vejamos o caso mais simples em que s considerado a restrino
4.2 para a funo de maxima verosimilhana completa. Portanto o parmetro g0
livre.
Supondo que
g0 = 1 ;
a populao tem dimenso 150 ou 500;
p1 e p2 tomam os seguintes valores: 0.2 e 0.4;

82

a funo de deteco pode ser a normal ou a exponencial negativa, ambas


truncada em [0, 20], mas apenas o caso da normal truncada sera analisado.

Quadro 4.2: Comparao entre os estimadores de CH, LP e TL com o estimador de MC,


quando a funo deteco a normal truncada

p1 N
0.2 150
500
0.4 150
500

%BIAS
p2 = 0.2
LP
9.26
2.08
0.55
0.30

TL
0.91
0.19
0.50
0.05

MC
0.66
0.11
0.68
0.10

p2 = 0.4
LP
1.72
0.58
2.59
0.09

TL
1.63
0.98
0.93
1.10

p1 N
0.2 150
500
0.4 150
500

EQM
p2 = 0.2
LP
85.28
111.50
36.85
54.34

TL
MC
35.09 5.52
59.67 10.96
32.26 4.82
65.40 7.87

p2 = 0.4
LP
39.52
56.95
17.61
29.37

T L MC
23.11 4.85
35.04 8.31
23.14 4.50
41.70 7.34

MC
0.53
0.11
0.98
0.63

Dos resultados da simulao apresentados no Quadro 4.2 conclui-se que:


ao contrrio dos outros modelos, em todos os casos, o modelo combinado
o mais preciso, sendo mais preciso para populaes pequenas e quando p2
grande, 0.4.
para o par (p1 , p2 ) = (0.4, 0.4) o enviesamento menor, sendo maior em
todos os modelos para amostras de tamanho 150 e curiosamente o enviesamento praticamente nulo para (p1 , p2 , N) = (0.4, 0.2, 500) quando
o mtodo utilizado o trajecto linear;

83

para p1 e p2 pequenos, isto , quando a probabilidade de um individuo


ser detectado na primeira ou na segunda baixa o enviesamento muito
elevado;
Quando no h restrines, os trs parmetros apresentam distribuies em
forma de um sino, distribuio normal.

120

100

100
80

80
60

60
40

40

20

20

,210

,248

,229

,286

,267

,324

,305

,362

,343

,400

,381

,438

,419

,476

,457

,514

,495

,552

,533

,590

1,10

,571

1,86
1,48

2,62
2,24

3,38
3,00

4,14
3,76

4,90
4,52

b)

a) p1

Figura 4.5: O grfico da esquerda diz respeito ao parmetro e o da direita a p1 para 500
simulaes com N=150, p1 = 0.4 e p2 = 0.2.

Temos que a esperana de g0 1.02 e os valores de g0 esto situados entre


0.5915 e 1.4512.
Agora, acrescentando a restrino 4.1 ao modelo de esperar que a funo de
distrubuio do parmetro g0 fosse semelhante ao grfigo ilustrado na Figura 4.7.
Para o caso restringido espera-se que uma estimativa de g0 seja quanto muito 1,
podendo ser mesmo igual a 1. Tendo em conta que para o caso nao restringido
o grfico de g0 analoga a da funo normal, para o caso em que g0 < 1 at
84

1 o grfico deve ser muito parecido e os restantes casos em que g0 > 1 devem
concentrar em redor do valor 1.

120

100

80

60

40

20

0
,1

,3

,5

,7

,9

1,1

1,3

1,5

1,7

1,9

Figura 4.6: Distribuio de g0 , para 500 simulaes com N=150, p1 = 0.4 e p2 = 0.2.

Na tentativa de estimar g0 encontrei vrias dificuldades. Apesar de a funo


de verosimilhana ser continua em g0 , para valores de g0 muito prximos de um a
funo de verosmilhana practicamente constante, Figura 4.8. Ora, isso causa
vrios transtorno sob o ponto de vista computacional. O facto de haver pouca
diferenas faz com que Maple entra num loop.
Fixando g0 = 1 temos que p1 mantem-se com os mesmo valores que obtidos
no caso em que g0 no restringido, e varia inversamente proporcional a g0 . A
simulao assinalada no quadro 4.3 mostra que de facto a estimativa de aumenta
quando g0 restringido face ao caso no restringido.

85

Figura 4.7: Ilustrao do grfico do parmetro g0 caso a funo de verosimilhana seja restringida a g0 <1.
Quadro 4.3: Comparao de estimativas de teta para o caso em que g0 livre e g0=1
0 < g0 < 2
g0 = 1
g0 p1
p1


0.373
0.714
0.373
3.278
2.796
3.196 1.098 0.380
3.206 0.380

3.444 1.019 0.440


3.355 0.440


3.579 0.981 0.353
3.434 0.353
0.446
1.178
0.446
2.800
2.885

Figura 4.8: Grfico da funo de verosimilhana do modelo combinado com p1 =0.4, p2 =0.2,
=20.37, N=150 e a funo de deteco a normal truncada em [0, 20] .
86

5. Concluso

Um dos objectivos do trabalho era obter estimador para o tamanho da populao


atravs da combinco do modelo de Lincoln-Petersen com o mtodo de Trajecto
Linear utilizando o mtodo de mxima verosimilhana restringida. Neste sentido
mostrei como que ambos os mtodos se processam. Utilizei, ainda o mtodo de
mxima verosimilhana para mostrar que sob determinados pressupostos um bom
LP =
estimador para a populao ser N
T L =
e N

n2
p2 (
)

n2
p2

para o mtodo de Lincoln-Petersen

para o mtodo de Trajecto Linear, onde um estimador do

parmetro que define a funo de deteco g (x|).


No modelo combinado g0 deixa de ser um pressuposto critico e estimado, no
caso de g0 < 1, custa dos dois modelos acima mencionados e pelo mtodo de
mxima verosimilhana

g0 =

T L
N
LP
N

mc .
bem como os parmetros: p1 e e consequentemente N
As propriedades dos estimadores so avaliados mediante ao uso da tcnica
de simulao Monte Carlo e se apresenta um exemplo ilustrativo para melhor
87

entendimento dos conceitos.


Atravs do exemplo prtico pude verificar que a nivel terico a igualdade g0 =
T L
N
LP
N

vlida mesmo quando g0 > 1.

A partir de simulaes foi possvel conhecer a distribuio dos parmetros


g0 , p1 e para o caso em que g0 no restringido. Entretanto, para o caso restringido, algumas vezes no foi possvel estimar g0 e consequentemente os outros
dois parmetros: e p1 .
Para alm da definio do mtodo adequado para situaes especficas e das
aplicaes a outras reas, este constitui um bom desafio para os demais interessados neste tipo de metodologia.
No futuro tentarei desenvolver um procedimento para obter estimativas do
prametro da funo de verosimilhana completa restringida.
Cabe-me sinceramente manifestar a alegria laboriosa e que sinto findo este
trabalho de fim de curso, o qual no foi s despertando, em mim, muito mais
interesse sobre este assunto, medida que fui pesquisando como tambm me
serviu para aprofundar conhecimentos.

88

Apndices
Apndice A (Teoremas)
Na passagem de 3.3 para 3.5, L1LP obtm-se dividindo 3.3 por L2LP , isto :

LLP (N, p1 , p2 |n10 , n01 , n11 , (N n10 n01 n11 ))


=
L2LP (p1 , p2 |n10 , n01 , n11 )

N
n10 n01 n11

[p1 (1 p2 )]n10 [(1 p1 ) p2 ]n01 [p1 p2 ]n11 [(1 p1 ) (1 p2 )]Nn

h p1 (1p2 ) in10 h (1p1 )p2 in01 h p1 p2 in11


n
n10 n01 n11


N [(1 p1 ) (1 p2 )]Nn
h in10 h in01 h in11
=
1
1
1
n
p
p
p

N n10 +n01 +n11
=
p
(1 p1 p2 + p1 p2 )Nn10 n01 n11
n

N n
=
p (1 p)Nn
n
= L1LP (N, p|n)

Tambm de uma forma anloga pode-se obter L2LP custa de 3.3 e L1LP .
Lema 14 (Chapman - 1951). Para qualquer p ( [0, 1]) dado,
= n (maior inteiro menor ou igual a n ) maximiza L (N, p), onde L (N, p|n) =
N
p
p
N n
Nn
p (1 p)
.
n
89

Se p =

para algum inteiro N,

e N
1 ambos maximizam L (N, p). Por outro lado N
o nico
ento N
mximo.
(Sanathan, 1972, pag. 144)
Estimar N:
> lnL:=ln(((N!)/(n!*(N-n)!))*(p^n)*((1-p)^(N-n)));

lnL := ln

N!pn (1 p)Nn
n! (N n)!

> ans1:=simplify(di(lnL, N));

ans1 := (N + 1) (N n + 1) + ln(1 p)
> ans2 :=simplify(di(lnL,p)) ;

ans2 :=

n + pN
p(1 + p)

> ans3 :=solve( {ans1 =0, ans2 =0}, {N,p}) ;

ans3 := {p = p, N =
90

n
}
p

Nota 15. (x) =

ln (x) =

(x)
x

(x)

e (x) =

R
0

tz1 et dt.

Apndice B (Clculos auxiliares)


Estimar p1 e p2 ( de L1LP )
>lnL:=ln(((n10+n01+n12)!/(n10!*n01!*n12!))*(((p1*(1-p2))/(p1+p2-p1*p2))
^n10)*
((((1-p1)*p2)/(p1+p2-p1*p2))^n01)*(((p1*p2)/(p1+p2-p1*p2))^n12));

(n10+n01+n12)!(p1(1p2) n10

lnL := ln

p1 +p2 p1 p2

(1p1)p2
p1 +p2 p1 p2

n10 !n01 !n11 !

n01

p1p2
p1 +p2 p1 p2

> ans1:=simplify(di(lnL,p1));

ans1 :=

n10 p2 + n10 p2 p1 + n01 p1 n11 p2 + n11 p2 p1


(1 p1 )p1 (p1 p2 + p1 p2 )

> ans2:=simplify(di(lnL,p2));

ans2 :=

n10 p2 n01 p1 + n01 p1 p2 n11 p1 + n11 p2 p1


p2 (1 p2 )(p1 p2 + p1 p2 )

> ans3:=solve({ans1=0,ans2=0},{p1,p2});

91

n11

ans3 := {p1 =

n11
n11
, p2 =
}
n01 + n11
n11 + n10

onde n1 = n10 + n11 e n2 = n01 + n11 , portanto:

p1 =

n11
n11
e p2 =
n2
n1

Varincia de p2 ():
Atendendo que :
- g (x|) = ex ;
- ln L () =

Qn2

R g(xi )
i=1 ln w g(x)dx =
0


(1ew )
.
- p2 =
w

Pn2

i=1

xi n2 ln () + n2 ln ();

2
X

n2 wew n2
xi
+
ln L () =
w

i=1

2
(n2 w)2 ew n2
ln L () =
2
2

(1 ew )2

Apndice C (Simulaes)
Estimao de NMC utilizando os dados de Otto
92

>x := vector(202,[0.11, 2.18, 2.19, 3.51, 3.75, 4.05, 4.09, 4.1, 5.16, 8.42, 0.93, 0.93, 1.11,
1.11, 1.33, 1.33, 1.69, 1.69, 2.31, 2.31, 4.15, 4.15, 4.26, 4.26, 4.35, 4.35, 5.24, 5.24, 5.28, 5.28,
5.48, 5.48, 7.2, 7.2, 7.31, 7.31, 17.01, 17.01, 0.88, 0.88, 0.88, 0.88, 1.77, 1.77, 1.77, 1.77, 3.35,
3.35, 3.35, 3.35, 4.35, 4.35, 4.35, 4.35, 8.97, 8.97, 8.97, 8.97, 9.58, 9.58, 9.58, 9.58, 9.61, 9.61,
9.61, 9.61, 0.14, 0.14, 0.14, 0.14, 0.14, 0.14, 0.14, 0.14, 0.26, 0.26, 0.26, 0.26, 0.26, 0.26, 0.26,
0.26, 0.3, 0.3, 0.3, 0.3, 0.3, 0.3, 0.3, 0.3, 0.74, 0.74, 0.74, 0.74, 0.74, 0.74, 0.74, 0.74, 1.12, 1.12,
1.12, 1.12, 1.12, 1.12, 1.12, 1.12, 2.68, 2.68, 2.68, 2.68, 2.68, 2.68, 2.68, 2.68, 2.91, 2.91, 2.91 ,
2.91, 2.91, 2.91, 2.91, 2.91, 4.13, 4.13, 4.13, 4.13, 4.13, 4.13, 4.13, 4.13, 5.58, 5.58, 5.58, 5.58,
5.58, 5.58, 5.58, 5.58, 6.03, 6.03, 6.03, 6.03, 6.03, 6.03, 6.03, 6.03, 7.27, 7.27, 7.27, 7.27, 7.27,
7.27, 7.27, 7.27, 7.63, 7.63, 7.63, 7.63, 7.63, 7.63, 7.63, 7.63, 7.9, 7.9, 7.9, 7.9, 7.9, 7.9, 7.9, 7.9,
8.35, 8.35, 8.35, 8.35, 8.35, 8.35, 8.35, 8.35, 8.51, 8.51, 8.51, 8.51, 8.51, 8.51, 8.51, 8.51, 9.69,
9.69, 9.69, 9.69, 9.69, 9.69, 9.69, 9.69, 11.79, 11.79, 11.79, 11.79, 11.79, 11.79, 11.79, 11.79]):
>n10:=89.0:n01:=142.0:n11:=60.0:n2:=n11+n01;n:=n10+n01+n11:w:=20;n1:=n10+n11:
> p2:=(g0/w)*(int(exp(-((u^2)/teta)),u=0..w)):p:=p1+p2-p1*p2:
>odeN:=ln(495!) - (ln(n!)+ln((495-n)!)) + n*ln(p) + (495-n)*ln(1-p) + ln(n!) - (ln(n11!)
+ ln(n10!) + ln(n01!)) + n10*(ln(p1) + ln(1-p2) - ln(p)) + n01*(ln(p2) + ln(1-p1) - ln(p))
+ n11*(ln(p1) + ln(p2) - ln(p)) + n2*ln(1/(int(exp(-((u^2)/teta)),u=0..w))) + sum(ln(exp((((x[i])^2)/teta))),i=1..n2):
>ans1N:=di(odeN,g0):ans2N:=di(odeN,teta):ans3N:=di(odeN,p1):
>ans4N:=fsolve({ans1N=0,ans2N=0,ans3N=0},{g0,teta,p1},{g0=0.5..1.2,p1=0.1..0.5});

ans4N := {g0 = 1.050090732, teta = 77.11151483, p1 = .3010101010}

93

PROGRAMA MODCOMB
O programa tem como objetivo estimar o tamanho da populao usando o mtodo de monte
carlo em conjunto com o mtodo de mxima verosimilhana utilizando os seguintes estimadores:
Lincoln Petersen,Chapman, Trajecto Linear e por fim o do Modelo Combinado.
Depois de definidos os demais parmetros que definem os modelos, incluindo o nmero de
simulaes, estimam-se e comparam-se os diferentes estimadores.

INPUT

> numsim:=1000 ; # Declarao do total de simulaes


> seed:=123; # Semente
> with(stats);
> N:=150; # Tamanho da populao
> p1:=0.4; # Probabilidade de um animal ser capturado
> p2:=0.2; # Probabilidade de um animal ser avistados
> w:=20; # Metade da distncia da largura da rea de trajecto linear de comprimento

Declarao das variavis


> unif:= vector(200): n1:= matrix (numsim,1): n2:= matrix (numsim,1): n00:= matrix
(numsim,1): n11:= matrix(numsim,1): n01: = matrix (numsim,1): n10: = matrix (numsim,1): nlp: = matrix (numsim,1): n10lp:= matrix (numsim,1): n01lp:= matrix (numsim,1):
n11lp:= matrix (numsim,1): n1lp:= matrix (numsim,1): n2lp:= matrix (numsim,1): nch:= matrix (numsim,1): nch: = matrix (numsim,1): nw: = matrix (numsim,1): ans4Ncm: = matrix
(numsim,1): anst:= matrix (numsim,1): Ntlest:= matrix (numsim,1): tetaest:= matrix (numsim,1): mutl:= matrix (numsim,1): pwest:= matrix (numsim,1): p2tl= matrix (numsim,1):

94

teta= matrix (numsim,1): g0cm:= matrix (numsim,1): pcm:= matrix (numsim,1): tcm:= matrix (numsim,1):tcm1:= matrix (numsim,1):
> ode1mc:=matrix(numsim,1):ans1Ncm:=matrix(numsim,1): ans2Ncm:=matrix(numsim,1):
ans3Ncm:=matrix(numsim,1): ans4Ncm:=matrix(numsim,1):Nmc:=matrix(numsim,1):

Inicializao das variavis: n11 , n10 , n01 e n00 ;


> n00:= matrix (numsim,1,0): n11:= matrix (numsim,1,0): n01: =matrix (numsim,1,0):
n10:= matrix (numsim,1,0): a:= matrix (numsim,1,1):

Clculo dos parmetros da funo de deteco


( parmetro da funo deteco normal truncada em [0, w])
> p2FL:=(g01/w)*(int(exp(-((u^2)/teta)),u=0..w)): aN:=fsolve(p2FL=p2,teta):
> sigma:=sqrt(aN/2);

Definio de p2 ; e consequentemente p;
> p2:=(g0/w)*(int(exp(-((z^2)/teta)),z=0..w)):p:=p1+p2-p1*p2:
INCIO DO CICLO GERAL PARA APLICAO DO MTODO DE MONTE CARLO
> for j from 1 to numsim do

Este ciclo gera uma multinomial, onde N a populao e n11 , n10 , n01 e n00 so
variavis
> for k from 1 to N do
> unif[k]:=stats[random,uniform[0,1]](1):
> if (unif[k] > (p11*(1-p21)+p21*(1-p11)+p11*p21)) then n00[j,1]:=n00[j,1]+a[j,1] fi;

95

> if ((unif[k] >(p11*(1-p21)+p21*(1-p11))) and (unif[k] < (p11*(1-p21) + p21*(1-p11)


+p11*p21))) then n11[j,1]:=a[j,1]+n11[j,1] fi;
> if ((unif[k] > (p11*(1-p21))) and (unif[k] < (p11*(1-p21)+p21*(1-p11)))) then n01[j,1]:=
a[j,1]+n01[j,1] fi;
> if unif[k] < p11*(1-p21) then n10[j,1]:=a[j,1]+n10[j,1] fi;
> od;

Clculo de n1 , n2 e n
> n1[j,1]:=n11[j,1]+n10[j,1];n2[j,1]:=n11[j,1]+n01[j,1];
> nw[j,1]:=n10[j,1]+n01[j,1]+n11[j,1];

Este ciclo gera as n2 ; distancias ( xi ) que seguem uma normal truncada em [ 0,


w]. Vai gerando xi, tal que esse seja normal e sero escolhidos apenas os que
forem positivos e menores do que w at obter um total de n2
> Xinorm0w1:=vector(200):Xinorm0w:=vector(n2[j,1]):cout:=0;
> for y from 1 to 200 do
> Xinorm0w1[y]:=abs(stats[random,normald[0,sigma]](1)):
> od:
> for p from 1 while cout<n2[j,1] do
> if Xinorm0w1[p]<w then
> Xinorm0w[p]:=Xinorm0w1[p] :
> cout:=cout+1;
> else
> Xinorm0w[p]:=Xinorm0w1[p+1]:
> cout:=cout+1;

96

> fi:
> od:

Funo de Maxima Verosimilhana ( lnFMV)


Caso Modelo Combinado
>ode1mc[j,1]:=ln(Np!)-(ln(nw[j,1]!)+ln((Np-nw[j,1])!))+ nw[j,1]*ln(pw)+(Np-nw[j,1])*ln(1pw)+ln(nw[j,1]!)- (ln(n11[j,1]!)+ln(n10[j,1]!)+ln(n01[j,1]!))+n10[j,1]*(ln(p1)+ln(1-p2)-ln(pw))+
n01[j,1]*(ln(p2)+ln(1-p1)-ln(pw)) +n11[j,1]*(ln(p1)+ln(p2)-ln(pw))+n2[j,1]*ln(1/(int(exp(-((m^2)
/teta)),m=0..w)))+ sum(ln(exp(-(((Xinorm0w[h])^2)/teta))),h=1..n2[j,1]):

Caso Trajecto Linear


> ode1tl:=n2[j,1]*ln(1/(int(exp(-((mn^2)/teta1)),mn=0..w))) +sum(ln(exp(-(( (Xinorm0w
[hn])^2) /teta1))),hn=1..n2[j,1]):

Aplicao do Mtodo de Mxima Verosimilhana


>ans1Ncm[j,1]:=di(ode1mc[j,1],g0):ans2Ncm[j,1]:=di(ode1mc[j,1],teta):ans3Ncm[j,1]:=di(
ode1mc[j,1],p1): ans4Ncm[j,1]:=fsolve({ans1Ncm[j,1]=0,ans2Ncm[j,1]=0,ans3Ncm[j,1]=0},{g0,
teta,p1},{g0=0..3,p1=0..1});ans1tl:=di(ode1tl,teta1): anstl[j,1]:=fsolve(ans1tl=0,teta1);

p2 definido em funo do parmetro ou conforme o caso:


> p2mc[j,1]:=simplify(eval((g0/w)*(int(exp(-((o^2)/teta)),o=0..w)),ans4Ncm[j,1]));
> p2tl[j,1]:=(1/w)*(int(exp(-((q^2)/anstl[j,1])),q=0..w));
> pwest[j,1]:=eval(p1+p2mc[j,1]-p1*p2mc[j,1],ans4Ncm[j,1]);

Estimao do Modelo Combinado


97

> Nmc[j,1]:=nw[j,1]/pwest[j,1]:
> Ntlest[j,1]:=simplify(nw[j,1]/pwest[j,1]):

Estimao do Trajecto Linear


> Ntlwest[j,1]:=n2[j,1]/p2tl[j,1]:
> g0cm[j,1]:=eval(g0,ans4Ncm[j,1]):
> pcm[j,1]:=eval(p1,ans4Ncm[j,1]):
> tcm[j,1]:=evalf(eval(sqrt(teta/2),ans4Ncm[j,1]),5):
>tcm1[j,1]:=eval(teta1,teta1=anstl[j,1]):
> od:

COMPILAO E APRESENTAO DOS RESULTADOS


>n10lpest:=sum(n10[su,1],su=1..numsim)/numsim: n01lpest:=sum(n01[sq,1],sq=1..numsim)/
numsim: n11lpest:=sum(n11[sr,1],sr=1..numsim)/numsim:
> NLP:=sum(Nlpest[we,1],we=1..numsim)/numsim;
> NLPC:=sum(Nlpcest[wq,1],wq=1..numsim)/numsim;
> Nest:=sum(Nmc[s,1],s=1..numsim)/numsim;
> Ntlest:=sum(Ntlwest[sn,1],sn=1..numsim)/numsim;
> varnlp:=sum(((Nlpest[kr,1]-NLP)^2),kr=1..numsim)/(numsim-1):senlp:=sqrt(varnlp):
> varnlpc:=sum(((Nlpcest[dr,1]-NLPC)^2),dr=1..numsim)/(numsim-1):senlpc:=sqrt(varnlpc):
> varNTL:=sum(((Ntlwest[ar,1]-Ntlest)^2),ar=1..numsim)/(numsim-1):seNtl:=sqrt(varNTL);
> varNMC:=sum(((Nmc[hr,1]-Nest)^2),hr=1..numsim)/(numsim-1):seN:=sqrt(varNMC);
> g0cmest:=sum(g0cm[e,1],e=1..numsim)/numsim;
> g0p:=Ntlest/NLP;

98

> pbiasmc:=((abs(Nest-Np))/Np)*100;pbiastl:=((abs(Ntlest-Np))/Np)*100;pbiaslp:= ((abs(NLPNp))/Np)*100; pbiaslpc:=((abs(NLPC-Np))/Np)*100;


> biasmc:=(abs(Nest-Np)):biastl:=(abs(Ntlest-Np)):biaslp:=(abs(NLP-Np)):biaslpc:= (abs(NLPCNp)):
> ICmc:=[Nest-1.96*seN,Nest+1.96*seN];ICtl:=[Ntlest-1.96*seNtl,Ntlest+1.96*seNtl]; IClp:=[NLP1.96*senlp,NLP+1.96*senlp];IClpc:=[NLPC-1.96*senlpc,NLPC+1.96*senlpc]; ICg0mc:=[g0cmest1.96*seg0,g0cmest+1.96*seg0];
> eficitl:=sqrt(varNTL+biastl^2);eficilp:=sqrt(varnlp+biaslp^2); eficilpc:=sqrt(varnlpc +biaslpc^2); eficimc:=sqrt(varNMC+biasmc^2);

99

Rotinas para simular n1 e n11 .

Quadro 5.1: Rotina binomial para o calculo de n1


>n1:=matrix(1000,1,0):n00:=matrix(1000,1,0):
>a:=matrix(1000,1,1):p1:=0.3;p2:=0.5:
>for j from 1 to 1000 do
>for k from 1 to 495 do
>unif[k]:=stats[random,uniform[0,1]](1):
> if (unif[k] < (p1)) then n1[j,1]:=a[j,1]+n1[j,1] fi:
>if (unif[k] > (p1)) then n00[j,1]:=a[j,1]+n00[j,1]fi:
> od:od:
> n1est:=evalf(sum(n1[e,1],e=1..1000)/1000,5);
> n1se:=sqrt((sum((n1[c,1]-n1est)^2,c=1..1000))/999);

Quadro 5.2: Rotina binomial para o calculo de n11


>n11:=matrix(1000,1,0):n00:=matrix(1000,1,0):
>a:=matrix(1000,1,1):p1:=0.3:p2:=0.5:
>for j from 1 to 1000 do
>for k from 1 to 495 do
>unif[k]:=stats[random,uniform[0,1]](1):
> if (unif[k] < (p1*p2)) then n11[j,1]:=a[j,1]+n11[j,1] fi:
>if (unif[k] > (p1*p2)) then n00[j,1]:=a[j,1]+n00[j,1]fi:
> od:od:
> n11est:=evalf(sum(n11[e,1],e=1..1000)/1000,5);
> n11se:=sqrt((sum((n11[c,1]-n1est)^2,c=1..1000))/999);

100

Bibliografia
[1] Alldredge, J. R. e Gates, C. E. (1985).Line transect estimators for left truncated distributions. Biometrics, 41, Pag. 275-80.
[2] Alpzar-Jara, R. e Pollock, K.H. (1996). A combination line transect and
capture-recapture sampling model for multiple observers in aerial surveys.
Journal Env. Ecol. Stat. 3(4):311-327, www.home.uevora.pt/~alpizar.
[3] Alpzar-Jara, R. e Pollock, K.H. (1999). Combining line transect capturerecapture for mark-resighting studies. Marine Mammal Survey and Assessment Methods, ISBN 90 5809 043 4, www.home.uevora.pt/~alpizar.
[4] Begon, M. (1989). Ecologa animal-Modelos de cuantificacin de poblaciones.
Editorial trillas.
[5] Begon, M. (1979). Investigating Animal Abundance: capture-recapture for
biologists. Edward Arnold, England.
[6] Brownie, C., Anderson, D.R., Burnham, K.P. and Robson, D.S. (1985). Statistical inference from band recovery dataa handbook. U. S. Department
of Interior, Fish and Wildlife Service Resource Publication 156. 305 pp,
www.cnr.colostate.edu/~gwhite/software.html.

101

[7] Buckland, S. T., Anderson, D.R., Burnham, K.P. e Laake, J.L. (1993).
Distance sampling: Estimating Abundance of Biological Populations. Chapman&Hall, London, www.ruwpa.st.and.ac.uk/distancebook/.
[8] Burnham, Kenneth P. et al (1980). Estimation of density from line transect
sample of biological populations. Wildlife Monographs.
[9] Burnham, K. P. et al (1987). Design and analisis methods for fish surbival
expreriments basead on realease-recapture. American Fisheries Society Monograph 5, Betheasda,www.cnr.colostate.edu/~gwhite/software.html.
[10] Casella, G. e R. L. Berger (1990). Statistical inference. Duxbury, California.
[11] Constrained Maximum Likelihood. http://faculty.washington.edu
[12] Cormen, T. et al.. Introduction to algorithims. The MIT Press, Massachusetts.
[13] Dias, J. R. (1979). Aplicao do mtodo de Monte Carlo ao clculo dos valores
de . Barbosa&Xavier LDA, Evora.
[14] Efron, B. e D.V. Hinkley (1978). Assessing the accuracy of the maximum likelihood estimator: Observed versus expected Fisher information.
Biometrika, Vol. 65, n.o 4. Pag.457-87.
[15] Guimares, R. C. (1997). Estatstica. Ed. revista. McGraw-Hill, Portugal.
[16] Krebs, C. J. (1994). Ecology-The experimental Analysis of Distribution and
Abundance. Fourth ed. Harper Collins, New York. Pag.9-11

102

[17] Murteira, B. J. F. Probabilidades e estatsticas. vol. I e II ,2a Ed. Revista


McGraw - Hill, Portugal, Dezembro de 1996.
[18] Otis, D. L., K. P. Burnham, G. C. White, and D. R. Anderson. Statistical inference from capture data on closed animal populations. Wildlife Monographs
62, 1978, 135 pp, www.cnr.colostate.edu/~gwhite/software.html.
[19] Pina, H. Mtodos numricos. McGraw - Hill, Portugal, 1995.
[20] Sanathan, L. (1972). The Annals of Mathematical Statistics. Vol. 43, No 1,
Pag. 142-152.
[21] Seber, G. A. F. (1982). The estimation of animal abundance and related
parameters. Macmillan, New York.
[22] White, G. C., D. R. Anderson, K. P. Burnham, and D. L. Otis. (1982).
Capture-recapture and removal methods for sampling closed populations. Los
Alamos National Laboratory LA-8787-NERP.

103