Professional Documents
Culture Documents
Introduo
Mtodos de inferncia so usados para tirar concluses sobre a populao usando informaes obtidas a partir de uma amostra.
Para obter resultados confiveis, necessrio conhecer a distribuio da estatstica (mdia, mediana, varincia, assimetria, etc. )em estudo. Mtodos Monte Carlo uma sada para fazer inferncias quando no se conhece a distribuio do parmetro de interesse ou quando as suposies de um modelo so violadas.
Monte Carlo
Ulam
Originou-se por causa do uso de aleatoriedade e da natureza repetitiva das atividades realizadas em cassinos de Monte Carlo. A roleta era um gerador de nmeros aleatrios. Primeiro trabalho introduzido por Jon Von Neuman e S.M. Ulam em 1940.
Monte Carlo
Atualmente termo Monte Carlo mais geral. uma tcnica baseada na uso de nmeros aleatrios e estatsticas para resolver problemas. Segundo Gentle(1998), simulaes (experimentos) Monte Carlo so um caminho fcil e expressivo para compreender o fenmeno de interesse.
Realizar inferncias quando a distribuio da estatstica de teste no conhecida. Estimando o desempenho de mtodos de inferncia quando as suposies paramtricas so violadas. Avaliando desempenho de mtodos de inferencias (poder do teste)
O mtodo bsico
A idia estimar a distribuio de uma estatstica extraindo amostras aleatrias de uma populao e observar o comportamento da estatstica sobre as amostras. Neste caso, o mtodo Monte Carlo uma abordagem paramtrica porque a amostra extrada de uma populao com distribuio conhecida. Aplicao do mtodo inicia com definio de pseudo-populao que assumida para representar a populao real.
O mtodo bsico
1. Determine a pseudo-populao que representa a verdadeira populao de interesse. 2. Aplique uma tcnica de amostragem para obter uma amostra da pseudopopulao. 3. Calcule o valor da estatstica de interesse e armazene a mesma. 4. Repita as etapas 2 e 3 M vezes. 5. Use os M valores obtidos na etapa 3 para estudar a distribuio da estatstica.
Objetivo: Estimar a distribuio da estatstica quando a hiptese nula verdadeira. Neste caso, o valor crtico determinado usando a distribuio estimada da estatstica de teste. Extrai-se amostras aleatrias a partir de pseudo-populaes, calcula-se o valor da estatstica de teste em cada replicao e usa-se esses valores para estimar a distribuio da estatstica de teste.
1. Use uma amostra aleatria de tamanho n de uma populao de interesse, calcule o valor observado da estatstica de teste, t0. 2. Defina uma pseudo-populao que reflita as caractersticas da verdadeira populao sob a hiptese nula. 3. Obtenha uma amostra aleatria de tamanho n a partir da pseudo-populao. 4. Calcule o valor da estatstica de teste usando a amostra aleatria na etapa 3 e armazene. 5. Repita as etapas 3 e 4 M vezes. Ao final dessa etapa tm-se os valores t1,..,tM que serve como estimativa da distribuio da estatstica.
Teste unilateral esquerda: obtenha o -simo quantil de t1,...,tM. amostral q Teste unilateral direita: obtenha o (1-)-simo quantil 1 de t ,...,t . amostral q 1 M Teste Bilateral: obtenha os quantis amostrais
/ 2 q
1 / 2 q
Objetivo: avaliar o desempenho de um teste de hiptese em termos dos erros tipo I e tipo II. Uso: as suposies do mtodo podem ter sido violadas ou mtodos analticos no podem ser aplicados. Por exemplo, suponha escolher um valor crtico usando uma aproximao Normal e necessrio avaliar os resultados por usar essa aproximao.
1. Determine a pseudo-populao dado que a hiptese nula verdadeira. 2. Gere uma amostra de tamanho n dessa pseudopopulao. 3. Realize o teste de hipteses usando um valor crtico. 4. Determine se cometeu o erro tipo I, isto , se a hiptese nula foi rejeitada. Registre esse resultado da seguinte forma:
I
t =1
1. Determine a pseudo-populao dado que a hiptese nula falsa. 2. Gere uma amostra de tamanho n dessa pseudopopulao. 3. Realize o teste de hipteses usando o valor crtico terico. 4. Determine se cometeu o erro tipo II, isto , se a hiptese nula no foi rejeitada. Registre esse resultado da seguinte forma:
O valor da estimativa para o erro tipo I comparado com valor terico. O valor da estimativa para o erro tipo II avaliado atravs do poder do teste (1 ). Isso realizado em funo do valor de interesse para o parmetro do teste. esperado que, quando o valor do parmetro se aproxima do valor quando a hiptese nula verdadeira, o poder do teste diminui.
Consideraes
Cada experimento aplicvel somente para a situao que tem sido simulada. Pode-se fazer mltiplos Monte Carlo. O nmero de replicaes da simulao Monte Carlo depende do tempo e recurso computacional. Se isto no uma questo, ento M deve ser grande quanto possvel. Hope (1968) define que resultados de um mtodo Monte Carlo so no enviesado para algum M se o programa est correto. Mooney (1970) estabelece que no existe uma teoria geral que governe o nmero de replicaes. Contudo ele recomenda:
Primeiro use um nmero pequeno para M e assegure que o programa est correto. Uma vez que o cdigo foi testado, o experimento pode ser executado com M muito grande. Muitas simulaes usam M > 1000 e M entre 10000 e 25000 no comum.
Mtodos Bootstrap
Os mtodos Bootstrap foram introduzidos por Efron (1979). So referidos como tcnicas de reamostragens. O termo Bootstrap refere-se a simulaes Monte Carlo que trata a amostra original como a pseudo-populao. Ento reamostragens so feitas a partir da amostra original. Nenhuma suposio feita sobre a populao que gerou a amostra. Usa-se a distribuio emprica amostral como uma estimativa da distribuio. Cada elemento da amostra tem a mesma probabilidade de ser selecionado.
1. Dado uma amostra aleatria x1,..,xn, . calcule 2. Extraia uma amostra com reposio x1b,..,xnb a partir da amostra original. 3. Calcule a mesma estatstica considerando ba amostra bootstrap da etapa . 2 para obter 4. Repita as etapas 2 e 3 M vezes. 5. Use essa estimativa de distribuio para obter a estatstica desejada (erro padro ou intervalo de confiana)
Bootstrap paramtrico
Efron e Tibshirani (1993) apresenta um mtodo Bootstrap em que feito suposio sobre a distribuio dos dados que gerou a amostra original. Parmetros para essa distribuio so estimados a partir da amostra, e amostras Bootstrap so retiradas usando a distribuio assumida e parmetros estimados. O mtodo Booststrap paramtrico similar aos mtodos Monte Carlo.
Bootstrap paramtrico
Exemplo: Suponha que dados (amostra original) seguem uma distribuio exponencial com parmetro . Precisa-se estimar a varincia e usa-la como estimador. Dado essa suposio o parmetro pode ser estimado a partir dos dados . Gera-se uma amostra aleatria de uma exponencial com estimado. Ento obtm-se amostras Bootstrap a partir dessa amostra simulada.
. 1. Dado uma amostra aleatria x1,..,xn, calcule 2. Extraia uma amostra com reposio x1b,..,xnb a partir da amostra original. 3. Calcule a mesma estatstica considerando a b amostra bootstrap da etapa 2 para obter . 4. Repita os passos 2 e 3, B vezes. 5. Ordene as B estatsticas do menor para o maior. 6. Calcule B* and B*(1-) 7. Encontre os valores (quantis) das posies B* e B*(1-). 8. o intevalo [q/2, q1-/2]
Consideraes
Efron mostra que o nmero de rplicas bootstrap deve estar entre 50 e 200 quando estimando o erro padro. Mesmo quando o recurso computacional alto ou a grande, um valor complexidade do clculo de pequeno, B=25, produzir um ganho de informao.
Consideraes
O bootstrap percentil mais confivel na maioria das situaes mas no tem boas propriedades de probabilidade. Uma suposio para uso de bootstrap que a funo de distribuio emprica representativa da verdadeira distribuio da populao. No recomenda-se o uso de tcnicas bootstrap quando o tamanho da amostra pequeno tal que a amostra no representativa. Livro mais recente: Chernick, M. R. 1999. Bootstrap Methods: A Practitioners Guide, New York: John Wiley & Sons. Livro: Efron, B. e R.J. Tibshirani. 1993. An Introduction to the Bootstrap, London, Chapaman and Hall.