Universidade de São Paulo

Escola Superior de Agricultura “Luiz de Queiroz”

Avaliação de modelos geoestatísticos multivariados

Ana Julia Righetto

Dissertação apresentada para obtenção do título de Mes-
tra em Ciências. Área de concentração: Estatística e
Experimentação Agronômica

Piracicaba
2012

Ana Julia Righetto
Estatístico

Avaliação de modelos geoestatísticos multivariados
versão revisada de acordo com a resolução CoPGr 6018 de 2011

Orientador:
Prof. Dr.PAULO JUSTINIANO RIBEIRO Jr

Dissertação apresentada para obtenção do título de Mes-
tra em Ciências. Área de concentração: Estatística e
Experimentação Agronômica

Piracicaba
2012

Dados Internacionais de Catalogação na Publicação
DIVISÃO DE BIBLIOTECA - ESALQ/USP

Righetto, Ana Julia
Avaliação de modelos geoestatísticos multivariados / Ana Julia Righetto.- - versão
revisada de acordo com a resolução CoPGr 6018 de 2011. - - Piracicaba, 2013.
92 p: il.

Dissertação (Mestrado) - - Escola Superior de Agricultura “Luiz de Queiroz”, 2013.

1. Análise multivariada 2. Cokrigagem 3. Função exponencial 4. Geoestatística 5. Modelo
linear de corregionalização I. Título

CDD 519.5
R571a

“Permitida a cópia total ou parcial deste documento, desde que citada a fonte – O autor”

por nunca me deixarem desanimar. Edison e Luzia. 3 Dedicatória Aos meus pais. .

4 .

me motivando e apoiando. pelos conselhos. debatiamos sobre geoestatística na sala de estudo ou até mesmo pelo skype: eu no Brasil e você no Peru! Muito obrigada pela paciência. São muitos anos de amizade. pelos momentos de diversão e alegria! Sempre fiéis! Ao meu orientador Paulo Justiniano Ribeiro Júnior. Elizabeth Hashimoto. 5 AGRADECIMENTOS Agradeço à Deus e Santo Expedito. Simone Sartório. Rafaelly Santos. À Nani e Rebecca. Mais do que pais. obrigada pela sua amizade. Fabiane Silva. Aos meus pais. Lucas San- tana. Renato Nunes. Cás- sio Dessotti. Obrigada por nunca medirem esforços em me ajudar. pela ajuda e mais do que isso. “Amizade é o amor que nunca morre. Dividimos muitos momentos de angustias. pessoa de cara zangada e de um coração enorme. Tiago Santana. Aos amigos da turma de mestrado Daniel. Luiz Ricardo. Obrigada pelas conversas. Natalie Veronika e Patricia Ueda.” A todos os alunos do curso de Pós-graduação em Estatística e Experimen- tação Agrnômica da ESALQ/USP. Maria Joseane. Esta conquista é nossa. ajuda que foi fundamental para mais esse passo na minha vida. Débora de Godoi. sem os quais eu não teria fé suficiente para acreditar e alcançar meus sonhos. vocês são meus amigos e sempre estiveram ao meu lado. Agradeço muito a Deus por ter te colocado nessa minha caminhada do mestrado. Aos amigos que Piracicaba e a ESALQ me proporcionaram. Pessoas maravilhosas com as quais compartilhei momentos inesquecíveis. João Vitor. pelos segredos e angustias compartilhadas. Ao meu amigo e “irmão-acadêmico” Daniel Grados. O senhor por muitas vezes enfatizou que um esta- tístico precisa programar e isso foi a grande luta no decorrer deste trabalho mas. Rodrigo Pescim. em época de provas e seminários. Camila Rossetti. Everton Batista. com os quais eu tive o prazer de conviver. mas também tivemos muitos momentos de lazer e alegria. muito obrigada pela orientação no decorrer deste trabalho. Edison Righetto e Luzia Francisca Pedrazzi Righetto. graças a . Você estava sempre pronto pra me ajudar. Thiago Gentil. Edilan Quaresma. Ezequiel Lopez. companheirismo e eu só tenho a agradecer por você estar sempre presente. Ítalo. pelas risadas. Guilherme Biz. Kuang. Foi muito bom dividir esses momentos com vocês. Amo vocês! Ao meu grande amigo Luiz Ricardo Nakamura. Pedro Henrique. em especial: Mariana Urbano.

Gabriel Adrián Sarriés. Dra. Prof. Dr. eu criei gosto em programar e isso eu devo à você. pelo apoio financeiro em forma de bolsa de estudos. Jorge Alexandre Wiendl e Rosni Honofre Aparecido Pinto pelo apoio técnico e pela amizade. Edwin Moises Marcos Ortega. Foi muito satisfátorio trabalhar com você!! À todos os professores do Departamento de Ciências Exatas da ESALQ: Prof. pela confiança. . Dra. sabedoria e dedicação nesses anos. Prof. minha orientadora de graduação. Às secretárias Luciane Brajão e Solange de Assis Paes Sabadin. por todo apoio. Obrigada! Aos funcionários do Departamento de Ciências Exatas da ESALQ/USP Edu- ardo Bonilha. pela amizade. Obrigada pela confiança depositada. que sempre me motivou. Silvio Sandoval Zocchi e Prof. E em especial à Prof. se mostrou uma grande amiga. Dr. Dra.6 sua ajuda e orientação. Prof. Aos professores do Departamento de Estatística da Faculdade de Ciências e Tecnologia de Presidente Prudente da “Universidade Estadual Paulista Júlio de Mes- quita Filho”. ensinamento. mais que uma professora. Em especial a professora Vilma Mayumi Tachibana. Clarice Garcia Borges Demétrio. Sonia Maria De Stefano Piedade. Dra. Prof. Roseli Aparecida Leandro. Dr.CAPES. À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior . Taciana Villela Savian. pelo apoio constante ao longos desses anos.

7

"A mente que se abre a uma nova idéia
jamais voltará ao seu tamanho original."

Albert Einstein

"’Venha para a beira’, disse ele.
Eles responderam: ’Nós temos medo’.
’Venha para a beira’, disse ele.
Eles vieram.
Ele os empurrou ... e eles voaram."

Apollinaire

8

placeholder

9

SUMÁRIO

RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1 INTRODUÇÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 REVISÃO BIBLIOGRÁFICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.1 Geoestatística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.1.1 Modelos Geoestatísticos Univariados . . . . . . . . . . . . . . . . . . . . . . . 21
2.1.2 Estimação dos Parâmetros do Modelo . . . . . . . . . . . . . . . . . . . . . . . 23
2.1.3 Variáveis Regionalizadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.1.3.1 Semivariograma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.1.3.2 Krigagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.2 Geoestatística Multivariada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.2.1 Cokrigagem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2.2 Modelos Lineares de Corregionalização . . . . . . . . . . . . . . . . . . . . . . 32
2.2.3 Semivariograma Cruzado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.2.4 Modelos Geoestatísticos Bivariados Gaussianos . . . . . . . . . . . . . . . . . 34
2.2.5 Modelo Gaussiano Bivariado com Componente Comum . . . . . . . . . . . . . 35
2.2.6 Modelagem por Função de Correlação . . . . . . . . . . . . . . . . . . . . . . . 37
2.2.6.1 Modelo Mátern Multivariado . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.2.6.1.1 Modelo Mátern Multivariado Parcimonioso . . . . . . . . . . . . . . . . . . 38
2.2.7 Geoestatística Bayesiana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3 MATERIAL E MÉTODOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.1 Estudo de Simulação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.2 Descrição dos dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
4 RESULTADOS E DISCUSSÃO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.1 Estudo de Simulação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2 Análise dos dados do Pacífico Noroeste Norte Americano . . . . . . . . . . . . . 50
4.2.1 Análise exploratória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.2.2 Análise univariada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
4.2.3 Análise Bivariada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
4.2.3.1 Análise pelo Modelo Linear de Corregionalização . . . . . . . . . . . . . . . . 54

. . . . . . . . . . . . . . 77 ANEXOS . . . . . . . . . . . . . . . . . . . . .3. . . . . . 62 5 CONSIDERAÇÕES FINAIS . . . . . . . . . .2. . . . .4 Avaliação dos Modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4. . . . . . . 57 4. .3. . . . . . . . . . . . 71 REFERÊNCIAS . . . . . . . . . . . . . .2. . . .3. .3 Análise pelo Modelo Matérn Multivariado Parcimonioso . . . . .2 Análise pelo Modelo Gaussiano Bivariado com Componente Comum . . . 73 APÊNDICES . . . . . . . . . . . . 87 . . .2. . . . . . 56 4. . . . . . . . . . . .10 4. . . . . . . . . . . . . . . . . . . . . . . .2.4 Análise por métodos Bayesianos . . . . . . . . . . . . . . .

Os interesses de pesquisa podem estar na descrição espacial de duas ou mais variáveis e. Modelo Linear de Corregionali- zação. Foram considerados o modelo linear de corregionalização. Palavras-chave: Geoestatística Multivariada. agronomia. envolvem a compreensão da distribuição espacial de processos a partir de dados espacialmente referenciados. Modelo Matérn Multivariado . foi realizado um estudo de simulação para avaliar a estimação e predição sob o modelo Matérn multivariado. recentemente proposto na literatura. tem-se dois ou mais atributos para modelar. dentre outras. Além disso. Modelos multivariados são propostos para o estudo se há evidências e/ou explicações contextuais de que os processos não são independentes. Cokrigagem. geologia. desta forma. 11 RESUMO Avaliação de Modelos Geoestatísticos Multivariados Questões centrais em diversas áreas do conhecimento como ciências ambien- tais. Estes modelos foram ajustados e utilizados para predição espacial geoestatística (krigagem) em um conjunto de dados com duas variáveis climáticas no qual uma parte dos dados foi separada para avaliação das predições. o modelo bivariado gaussiano de componente comum e um modelo bayesiano de regressão espacial. Diferentes modelos propostos na literatura foram avaliados e comparados ao modelo Matérn multivariado.

12 .

among other. Linear Model of Coregionalization. Cokriging. the bivariate Gaussian common component model and a bayesian spatial reression model were considered. The linear model of corregionalization. Additionally a simulation study assessed estimation and prediction under the multivariate Matérn model. Mul- tivariate Matérn Model . The models were fitted and used for geostatistical spatial prediction (kriging) for a pair of weather related variables with part of the data used only for comparing the predicions. agronomy. there are tow or more attributes to be modeled. 13 ABSTRACT Evaluation of Multivariate Geostatistic Models Key issues in a diversity of subject areas such as environmental sciences. Research interests may include the spatial description of two or more variables and therefore. require the understanding of the spatial distribution of natural processes from spatially referenced data. geology. Keywords: Multivariate Geostatistics. Different models presented in the literature are assessed and compared to the recently introduced multivariate Matérn model. Multivariate models are adopted when there is evidence and/or contextual explanations the two processes are not independent.

14 .

. .Gráfico dos envelopes do variograma . . . 46 Figura 2 . M. . . . . . . . 58 Figura 13 . . 53 Figura 6 . . 54 Figura 8 . . . . . . . 52 Figura 4 . . 52 Figura 5 . . . . . . . . . . . 56 Figura 11 . .Gráfico das predições espaciais (krigagem) após o ajuste do MLC .. . . .primeira variável (pressão). . . . .(a) da variável pressão e (b) da variável temperatura . .Gráfico descritivo do padrão espacial .. . . . . . . . . . . . . . . . 61 Figura 17 . . . . . . . . . . . . . . . . . . . .Gráfico do traço e da densidade do intercepto e de parte da matriz K . Kleiber. . . . . . . . . . .(a) da variável pressão e (b) da variável temperatura . W. . . . . . . . . . . segunda variável (temperatura) . . . . . .Gráfico de krigagem das variáveis em estudo e para a predição das mes- mas no modelo bayesiano . . .Gráfico de círculos . . 57 Figura 12 . . . . .(a) da variável pressão e (b) da variável temperatura . . . . . . . . . . . . . .Gráfico do traço e da densidade da matriz Ψ e do φ1 . . . . . . . . . . . . . .Pacífico Noroeste Norte Americano com as 157 observações.Gráfico do traço e da densidade da matriz K e de parte da matriz Ψ . . . . . . . . 2009 .Gráfico das predições espaciais (krigagem) em uma malha de pontos pelo modelo Matérn multivariado parcimonioso . . . . . . . . . . . . . . 61 . . .. .(a) para a variável pressão e (b) para variável tem- peratura. . . . .Gráfico dos variogramas experimental e teórico . . . . . . . . . . . . . . .(a) da variável pressão e (b) da variável temperatura . . . .(a) da variável pressão e (b) da variável temperatura . .Gráfico do traço e da densidade do φ2 . . . . . . . . .Gráfico das predições espaciais (krigagem). . . . . . .(a) da variável pressão e (b) da variável temperatura . . . . . . . . . . Schlather. . . . . .Localização dos 52 pontos retirados (em vermelho) . . . . . . . . 55 Figura 10 . . . . . .Gráfico dos variogramas univariados e do variograma cruzado . . . 59 Figura 14 . . .Gráfico das predições espaciais (krigagem) univariada . .Gráfico das predições espaciais (krigagem) para os 52 pontos retirados da análise . . . . . . . . . .(a) da variável pressão e (b) da variável temperatura .(a) da variável pressão e (b) da variável temperatura . . T. . . . pelo BGCCM . . . 50 Figura 3 . . . . 60 Figura 15 . 54 Figura 9 . . . . . . 15 LISTA DE FIGURAS Figura 1 . . . . . 60 Figura 16 . . . . . . . . FONTE: Gneiting. em uma malha de pontos. 53 Figura 7 . . . . . . . . . .

. . . . (d)Matérn Parcimonioso. . (e)Bayesiano . 62 Figura 19 . . . . . . . (b)LMC. . . .Gráfico de dispersão da variável temperatura versus valores preditos pelos modelo: (a)univariado. . . . . .Gráfico de krigagem das variáveis do grupo controle e da predição das mesmas no modelo bayesiano . . . . 67 Figura 20 . . . . . . . . . . . . (c)BGCCM. . . . . . . . . . . . . . 68 . . . . . . . (e)Bayesiano . . segunda va- riável (temperatura) . . . . . . . . . . . . . . . (b)LMC. . . (c)BGCCM. . . . . . . .primeira variável (pressão). . . . . .Gráfico de dispersão da variável pressão versus valores preditos pelos modelo: (a)univariado. . . (d)Matérn Parcimonioso. . . .16 Figura 18 . . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65 Tabela 12 -Média e desvio padrão dos erros de krigagem do grupo controle para Pressão . . . do grupo controle. . . . . . . 17 LISTA DE TABELAS Tabela 1 . . . . . . . . . . . . . . . . . . . . . . 59 Tabela 10 -Valor observado e valores preditos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .Estatística descritiva das variáveis em estudo. . . . . . . . . . . . .Quantis e Média para cada parâmetro por método bayesiano . . .Valores do parâmetros estimados para o modelo Matérn multivariado parcimonioso . . . . . . . . . . . . . . . . . . . . .Valores do parâmetros estimados para o variograma cruzado pelo modelo linear de corregionalização . . . 53 Tabela 6 . . . . . . . 49 Tabela 2 . . . . . . . . . . . . . . 50 Tabela 4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 . . . . . . . . . . . . . . . . . . do grupo controle. . . . . . . . . . .Valores do parâmetros estimados no modelo univariado . . . . . . .Estatísticas descritivas do erro absoluto (EA) das variáveis pelo estudo de simulação . . . . . . . . . 66 Tabela 13 -Média e desvio padrão dos erros de krigagem do grupo controle para Temperatura . . 50 Tabela 3 . . . . . . . . . . . . . . . . . . . . .Valores do parâmetros estimados para o modelo Gaussiano Bivariado com Componente Comum . . 55 Tabela 7 . . 51 Tabela 5 . . . . . . . . . . . 57 Tabela 9 . . . . da variável Pressão 63 Tabela 11 -Valor observado e valores preditos. . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Tabela 8 . . . . . . . . 66 Tabela 14 -Medidas de Pressão e Temperatura em 157 localizações (coordenadas) no Pacífico Noroeste Norte Americano . . . . . . . . . . . . . . . . . . . . . . .Estatísticas descritivas do erro quadrático (EQ) das variáveis pelo estudo de simulação . . . . . .Estatísticas descritivas das estimativas dos parâmetros obtidas com 1001 simulações . . . . . . da variável Tem- peratura . . . . . . . . com variável pressão trans- formada . . .

18 placeholder .

Desta forma. devido a avanços recentes no Sistema de Informação Geográfica (SIG) e no Sistema de Posicionamento Global (GPS). que une o conceito de variáveis aleatórias com o conceito de variáveis regionalizadas. levando em conta a localização espacial do fenômeno estudado de forma explícita. No geral. variáveis que possuem um comportamento espacial. modelos estatísticos explicam. entre tantas outras áreas. constitui um grande desafio para esclarecer questões centrais em diversas áreas do conhecimento. do ambiente. é crescente o interesse em analisar e ajustar modelos para dados georrefereciados. em que exista uma forte suspeita de que pontos espaciais próximos possuam valores parecidos da . de geologia. sendo estas últimas. Como o que distingue cada uma dessas categorias é o tipo de dado utilizado. Neste trabalho será enfatizado a geoestatística. que são sistemas relacionados a informação espacial bem como avanço nos procedimentos computacionais que permitem e facilitam a análise ou representação do espaço e dos fenômenos que nele ocorrem. a variabilidade dos processos estocásticos através de uma ou mais variáveis explanatórias que possuam alguma associação com a resposta de interesse. Já a modelagem geoesta- tística se diferencia pois as observações não são assumidas independentes e existe efeito aleatório latente na parte explanatória do modelo. incorpora tanto a interpretação da distribuição estatís- tica como a correlação espacial das amostras. Assim. seja na parte da saúde. Segundo Matheron (1963). com o intuito de descre- ver o comportamento de um ou mais atributos que não podem ser descritos exclusivamente por modelos determinísticos. existe um conjunto de técnicas para encontrar uma função aleatória para um ou mais atributos dos quais suas localizações espaciais são conhecidas. 19 1 INTRODUÇÃO Compreender a distribuição espacial de dados provenientes de fenômenos ocorridos no espaço. Os métodos de estatística espacial têm o intuito de mensurar propriedades e relacionamentos. Este ramo da estatística espacial. dados de área e processos pontuais. o máximo possível. A modelagem estatística é utilizada em muitas áreas. é normal que existam métodos estatísticos diferentes para ana- lisar e descrever os dados em cada uma destas três áreas. geoestatística é a aplicação do formalismo de funções aleatórias para o reconhecimento e estimação de fenômenos naturais. essas técnicas são importantes para capturar a correlação entre as observações das variáveis aleatórias de interesse. na agronomia. Tais estudos tornam-se cada vez mais comuns. Nesta modelagem. Essa área da estatística é dividida em três sub-áreas de estudo: geoestatística.

Na metodologia. que é uma função bastante flexível.20 variável em estudo. Muitas vezes. Estes modelos. realizou-se uma reimplementação deste modelo no mesmo software. O modelo que motivou a realização deste trabalho. Kleiber e Schlather (2009) e consiste no ajuste por estrutura de covariância e covariância cruzada para campo aleátorio gaussiano. em geral. tem-se dois ou mais atributos para modelar. Neste trabalho um conjunto de dados é analisado por diversos modelos geoestatísticos multivariados e avaliar qual modelo que melhor explica os dados. utilizando como função de correlação a função Matérn multivariada. o interesse não está em apenas uma variável mas em estudar duas ou mais variáveis e desta forma. Kleiber e Schlather (2009) foi implementado pelos autores no pacote RandomFields(Schlather. Os dados utilizados referentes a observações de temperatura e de pressão em 157 localizações no Pacífico Noroeste Norte Americano estão disponíveis no pacote RandomFields (Schlather.se faz necessário a modelagem de várias variáveis espaciais simultaneamente. 2012) do software R (R Development Core Team. Em um artigo intitulado “Matérn Cross- Covariance Functions for Multivariate Random Fields”. em estudos na geoestatística. um estudo de simulação foi realizado com o mo- delo Matérn parciomonioso com o propósito de avaliar a qualidade das estimativas dos parâmetros e das predições das variáveis. Além disso. possuem uma estrutura complexa combinando mais de um processo latente com elevado número de parâmetros e que podem apresentar problemas para estimação paramétrica. Os dados foram ajustados com os diferentes modelos utilizados neste trabalho. foi desenvolvido por Gneiting. o modelo proposto por Gneiting. 2006) e neste trabalho. modelos multivariados devem ser propostos para o estudo. 2012). Além disso. os autores comparam este modelo com o modelo linear de corregionalização. Em muitos casos. O passo critico é então identificar a estrutura de dependência espacial. não somente em cada variável como também entre as variáveis e assim. existem vários modelos geoestatísticos multivariados. Ocorrendo evidências de que esses processos não são independentes e existindo explicação prática para isto. trabalha-se com modelos geoestatísticos multivariados. .

o mais simples é o Gaussiano estacionário. cujas suposições são definidas por Diggle e Ribeiro Jr (2007): i. sendo que A ⊂ Rd . para obter valores da variável de interesse.. Condicional a {S(x) : x ∈ R2 }. dado por qualquer conjunto de variáveis aleatórias Y (x).)] = S(xi ) e variância condicional τ 2 . ii.. amostradas de uma região A espacialmente contínua. em que os dados consistem de mensurações y1 .1 Geoestatística De acordo com Diggle. 2. segundo Soares (2006). em que h = ||x − x0 || e ||. {S(x) : x ∈ R2 } é um processo Gaussiano com média µ e variância σ 2 = V ar{S(x)} e função de correlação ρ(h) = Corr{S(x). o primeiro passo da modelagem geoestatística é a concepção de um processo aleatório que melhor caracteriza o conjunto de dados experimentais das observações. média condicionada dada por E[Yi |S(. S. xn . dos valores . e utiliza-se métodos de inferência estatística baseada na função de verossimilhança aplicada a estudos geoestatísticos. a geoestatística é um ramo da estatística espacial. em que d é o número de linhas de x. em n localizações. Além disso. Estas medidas estão associadas a um fenômeno espacial.1 Modelos Geoestatísticos Univariados Dos modelos geoestatísticos em que S(x) é contínuo e diferenciável. no qual os elementos são as localizações amostrais. Considerando que na região de estudo A exista um campo aleatório Gaussi- ano latente. com distribuição normal.|| representa a distância entre as localizações. é necessário realizar uma amostragem. S(x0 )}. x ⊂ Rd .1. que não é diretamente observado. yi são as realizações mutuamente independen- tes da variável aleatória Yi . um processo estocástico é um modo de abordagem do conjunto de dados provenientes das amostras experimentais. na qual a modelagem é realizada especificando um modelo paramétrico para a(s) variável(véis) em estudo. cria-se um vetor Y(x) de dimensão n×1... 21 2 REVISÃO BIBLIOGRÁFICA 2.. Então. Tawn e Moyeed (1998) introduziram o termo “geoestatística baseada em modelos”. x ∈ Rd definidas em um espaço de probabilidade comum.yn obtidas em localizações x1 . Desta forma.. Ribeiro Jr e Christensen (2003). tratado como a realização de um processo estocástico S(x). Diggle.

que possui vetor de médias nulo.. pode-se encontrar a distribuição de probabilidade de Y (x). foi proposta por Box e Cox (1964):  Y λ (x)−1 ∗  λ . n × n e µ = Dβ.22 observados nas localizações amostradas x = (x1 . podendo assim. Alguns valores interpretáveis desse parâmetro são:     λ = 1 : sem transformação  λ = 0. (1) em que  é o ruído branco. Segundo Martins (2010). λ = 0. σ 2 . Então. em que I é uma matriz identidade n × n. θ = (β. contendo q − 1 covariáveis e β é um vetor q × 1 de parâmetros associados a essas covariáveis. no qual o parâmetro λ introduz flexibilidade ao modelo. j=1 Utilizando o modelo (1). tem-se um vetor a ser estimado. definido nas suposições acima. Assim. para que estes passem a seguir uma distribuição Gaussiana. obtem-se o modelo: Y (x) = µ + S(x) + . segundo Martins (2010). Ainda. S(x) é um campo aleatório gaussiano. um vetor de dimensão n × 1. xn ). 5 : transformação raiz quadrada    λ = −1 : transformação recíproco  . Uma transformação muito conhecida. com vetor de médias Dβ e matriz de covariâncias dada por ΣY = Σ + τ 2 I. quando a variável observada Y (x) não segue uma distribuição Gaussiana. φ∗. com distribuição normal de média zero e desvio padrão τ . realiza-se uma transformação nos dados. obter aproximações ruins. . no qual φ∗ é um vetor de parâmetros associados a função de correlação utilizada.. τ 2 ). de dimensão n × 1 e matriz de covariância Σ. esse vetor de médias pode ser escrito por: q X µ = β0 + βj Dj .λ 6= 0 Y (x) =  log[Y (x)]. sendo D uma matriz de dimensão n × q. o valor do erro quadrático médio mínimo do preditor é afetado. Para contornar esse problema.

σ 2 V) no qual tem-se a reparametrização na variância: τ2   2 2 2 σ R+τ I=σ R + 2 I = σ 2 (R + v 2 I) = σ 2 V σ Assim. . σ 2 R + τ 2 I). σ 2 ) = − nln(2π) + ln(|σ 2 V|) + (Y(x) − Dβ)0 (σ 2 V)−1 (Y(x) − Dβ) . (2) em que D é a matriz n × q de covariáveis. considera-se Y(x) ∼ Nn (Dβ. σ 2 . φ) = ln[(2π)− 2 ] − ln(|σ 2 R + τ 2 I| 2 ) − 1 0 − (Y(x) − Dβ) (σ 2 R + τ 2 I)−1 (Y(x) − Dβ) 2 1 = − {nln(2π) + ln(|σ 2 R + τ 2 I|) + 2 0 + (Y(x) − Dβ) (σ 2 R + τ 2 I)−1 (Y(x) − Dβ)} Para a maximização do log-verossimilhança. β é o vetor de parâmetros e R é a matriz de correlação que depende de φ e da distância.2 Estimação dos Parâmetros do Modelo Para estimação dos parâmetros do modelo Gaussiano utiliza-se o método dos mínimos quadrados ou o método da máxima verossimilhança. τ 2 . pode-se reescrever o log-verossimilhança como: 1 l(β. tem-se: Y(x) ∼ Nn (Dβ. 23 2. (4) 2 Em (4) tem-se que: (Y(x) − Dβ)0 (σ 2 V)−1 (Y(x) − Dβ) = Y0 (x)(σ 2 V)−1 Y(x) − Y0 (x)(σ 2 V)−1 Dβ − − β 0 D0 (σ 2 V)−1 Y(x) + β 0 D0 (σ 2 V)−1 Dβ. Neste último.1. Desta forma. a função de verossimilhança da variável dada em (2) é expressa por:   −n 2 2 − 12 1 0 2 2 −1 L[Y(x)] = (2π) 2 |σ R + τ I| exp − (Y(x) − Dβ) (σ R + τ I) (Y(x) − Dβ) (3) 2 e o logaritmo da função de verossimilhança é dado por: n 1 l(β. adimitindo-se uma tendência polinomial para µ(x).

o lagaritmo da função de verossimilhança em (4) pode ser reescrito como:   2 1 2 1 0 −1 l(β. pode-se reescrever (4) da seguinte forma:   1 1 l(β. tem-se: ∂ 1  l(β. (8) Observa-se na equação (8) que o estimador de β só depende de φ e v 2 . σ ) = − nln(2π) + nln(σ ) + ln|V| + 2 (Y(x) − Dβ) V (Y(x) − Dβ) . Desta forma. Por outro lado. σ ) = − nln(2π) + ln(|σ V|) + 2 Y0 (x)V−1 Y(x) − 2 2 (5) 2 σ  0 −1 0 0 −1 − 2Y (x)V Dβ + β (D V D)β Segundo Martins (2010). para obter o estimador de σ 2 .24 Então. σ tem-se que o estimador de máxima verossimilhança de β é dado por: β̂ = (D0 V−1 D)−1 D0 V−1 Y(x). deve-se considerar os seguintes resultados da álge- bra matricial: ∂ (CT ) = C 0 (6) ∂T ∂ (T 0 CT ) = 2CT (7) ∂T em que Cé uma matriz quadrada de ordem n × n e T é um vetor de ordem n × 1. a partir desse resultado. Assim. aplicando-se (6) e (7) em (5). (9) 2 σ .  ∂β σ Considerando: 1 2 (D0 V−1 Y(x) − D0 V−1 Dβ̂) = 0. considera-se que |Var[Y(x)]| = |σ 2 V| = (σ 2 )n |V|. σ 2 ) = − 2 −(Y0 (x)V−1 D)0 + (D0 V−1 D)β .

Na teoria das variáveis regionalizadas. (10) Substituindo (8) e (10) em (4). o estimador de σ 2 é:   2 −1 0 −1 σ̂ = n Y(x) − Dβ̂) V (Y(x) − Dβ̂) . a equação (11) deve ser otimizada numericamente com relação a φ e v 2 . estudar e representar as propriedades estruturais dessas variáveis para a resolução de problemas de estimativa. O conjunto dessas variáveis Y (x) medidas na totalidade da região em estudo.3 Variáveis Regionalizadas Segundo Landim (2006). v 2 ) = − {nln(2π) + nln(σ̂ 2 ) + ln|V| + n}. que ao ser substituida em (8) retorna β̂ e. para obter as estimativas dos parâmetros. pode ser considerada como uma função aleatória Y (x) pois. substituindo vˆ2 e σ̂ 2 em v 2 = τ2 σ2 estima-se τ̂ 2 . Esta teoria tem por objetivos. dada por: 1 lc (φ. mas é esperado que o valor da variável seja parecido para pontos próximos (aspecto estrutural). segundo Yamamoto (2001). o termo geoestatística está relacionado como um tópico da estatística aplicada em que se trabalha com problemas envolvendo variáveis re- gionalizadas. As variáveis regionalizadas possuem duplo aspectos contraditórios. conforme Isaaks e Srivastava . Em seguida obtém-se a matriz V̂. retorna σ̂ 2 ao ser substituída em (10). Estas variáveis possuem um comportamento espacial. σ ) = − + (Y(x) − Dβ) V (Y(x) − Dβ) − 2 2 ∂σ 2 2 σ2 (σ ) e igualando esta derivada parcial a zero. (11) 2 Assim. consequentemente.1. Logo. pois é impossível uma previsão exata do valor da variável em um determinado ponto (aspecto aleatório). com características intermediárias entre as variáveis totalmente determinísticas e as verdadeiramente aleató- rias. obtém-se o log-verossimilhança concentrada nos parâmetros v 2 e φ. 2. 25 Derivando parcialmente (9) com relação a σ 2    ∂ 2 1 n 0 −1 1 l(β. Y (x) pode ser definida como uma variável aleatória que assume diferentes valores Y em função da posição x dentro de uma região A.

Segundo Journel e Huijbregts (1978). a esperança matemática de Y (x) é contante e não depende de x. denominadas de hipóteses de estacionariedade. As hipóteses de estacionariedade são (GRIPP. de alguma maneira. tem-se que o valor de cada ponto está relacionado. com valores obtidos a partir de pontos situados a uma certa distância. na prática. embora a covariância exista entre todas as distâncias possíveis ao longo de h. são variáveis aleatórias regionalizadas e assim. em cada localização x tem-se somente uma realização Y (x) e. fica usualmente impossível inferir sobre a distribuição de Y (x). Para o estudo do comportamento das variáveis regionalizadas. assume-se que a dependência entre elas seja especificada por algum mecanismo probabilístico. Para expressar essa influência é definido o vetor de distância ∆h. . isto é. hipóteses que envolvem diferentes graus de homogeneidade espacial. que possui uma orientação específica e o grau de relação entre pontos em uma certa direção pode ser expresso pela covariância e.1 Semivariograma Considerando uma variável regionalizada Y (x) amostrada em diversos pon- tos que estão regularmente distribuídos em uma região de estudo. 2. Porém.1. a interpretação probabilística da variável regionalizada Y (x) ser uma particular realização de alguma função aleatória Y (x) é válida quando pode-se inferir toda ou parte da lei de distribuição de probabilidade que define esta função aleatória. 2) Hipótese de estacionariedade de ordem 2: a função aleatória Y (x) é estacionária de ordem 2 se E[Y (x)] = m.26 (1989). como o número de pontos é finito. pode ser estipulado que somente sejam considerados valores entre pontos regularmente espaçados por múltiplos inteiros de ∆h (LANDIM. 2006). se fazem necessárias. porém coisas mais próximas são mais parecidas que coisas distantes”. pode-se dizer que a influência entre os pontos é tanto maior quanto menor for a distância entre eles. é usual utilizar ferramentas dos métodos geoestatísticos como o semivariograma e a krigagem. Seguindo o princípio da Primeira Lei da Geografia de Tobler que diz: “Todas as coisas são relacionadas.3. Assim. 1992): 1) Hipótese de estacionariedade restrita: a função aleatória Y (x) é estacionária se a lei de probabilidades de Y (x) for a mesma em qualquer localidade x considerada.

γ(h) é chamado de patamar. C(h) representará a variância. isto é. O semivariograma analisa o grau de dependência espacial entre amostras dentro de um campo experimental. (12) 2N i=1 Para analisar como os valores dos dados estão se comportando conforme várias distâncias estipuladas e assim. 1996). quando o valor de h aumenta. pois exigem hipóteses de estacionaridade menos restritivas (hipótese intrínseca). dado . através da técnica de krigagem (SALVIANO. dada pela metade da variância das diferenças. que representa o valor de γ quando h = 0. denominado “nugget” no inglês. em que N (h) 1 X γ(h) = [Y (xi + h) − Y (xi )]. calcula-se a função denominada de semivariância. 27 A covariância calculada entre os valores encontrados. representada por γ(h). a principal ferramenta para o diagnóstico da existência de correlação entre os pontos em estudo. isto é C(0) = E[Y 2 ] − E 2 [Y ] = V ar[Y ] Desta forma. utiliza-se um gráfico de γ(h) por h denominado de semivariograma. (alcance da dependência espacial. à uma função. (1995). do inglês “range”). é um dos possíveis métodos para estimar os parâmetros do semivariograma. segundo Ribeiro Jr. é expressa por: 1 X C(h) = C(∆h) = Y (x)Y (x + h) − m2 . denominada de alcance. os quais são: efeito pepita (Co ). também expresso por φ. N (h) em que m é a média da variável regionalizada e N (h) é o número de pares de valores medidos separados pela distância h. Ainda. A covariância depende do tamanho de h. analisar o grau de dependência espacial da variável e definir os parâmetros necessários para estimar características em locais não amostrados. os semivariogramas são preferidos para caracte- rizar a estrutura de continuidade espacial da característica avaliada. na distância a. O ajuste de um modelo matemático aos dados no gráfico de γ(h) por h. separados pela distân- cia ∆h ao longo de h. do inglês “sill”. frequentemente aumenta até uma distância a. além de definir parâmetros necessários para a estima- tiva de valores para locais não amostrados. se h = 0. Então.

E > 0. Segundo Vieira (2000). no qual se estabiliza. até atingir o patamar. efeito pepita. em que os pesos utilizados podem afetar os valores estimados. 1988 apud LANDIM. 15: componente aleatória pequena. 1996). Pontos amostrados que estão separados por distância menor do que o alcance são ditos espacialmente dependentes. reflete o erro analítico. 30: componente aleatória muito significativa. E < 0. indica uma variabilidade não explicada de um ponto para outro que pode ocorrer devido a erros de medidas ou microvariação não detectada por causa da distância de amostragem utilizada. ii.28 por C + Co . iii. Uma outra convenção por vezes adotada é determinar o grau de aleatoriedade Co presente nos dados pela fórmula E = C (GUERRA. O modelo matemático ajustado é dividido em duas categorias: modelo com patamar e sem patamar. Este patamar é um parâmetro importante. para h ≥ a  −3h ii. aumentando até atingir um patamar no qual se estabiliza. O alcance é utilizado para definir o raio de ação máximo de interpolação pela krigagem. o que não é o caso de pontos separados por uma distância maior. Exem- plos de modelos nessa categoria são:  γ(h) = C[ 3 ( h ) − 1 ( h )3 ]. em um semivariograma ajustado o valor da semi- variância aumenta na medida em que aumenta a distância de separação entre os pontos. O parâmetro Co . Um modelo com patamar é aquele em que a semivâriancia aumenta com o aumento da distância entre amostras. 30: componente aleatória significativa. Esférico: γ(h) = C. (range). 15 ≤ E ≤ 0. isto é. sendo C a variância estrutural. para h < a  2 a 2 a i. Exponencial: γ(h) = C[1 − e a ] −3h 2 iii. 0. em que: i. Gaussiano: γ(h) = C[1 − e( a ) ] . pois permite a determinação da distância limite entre dependência e indepên- dencia entre as amostras e é atingido quando a variância dos dados fica constante com a distância entre os pontos amostrados.

não prova que o modelo escolhido é o mais correto. a partir de valores adjacentes enquanto considerados como interdependentes pelo semivariograma (LANDIM. 29 Um outro modelo que vem sendo bastante utilizado.2 Krigagem Krigagem é um processo de estimativa de valores de variáveis distribuídas no espaço e/ou no tempo. a) = (a||h||)v Kv (a||h||) Γ(v) no qual Γ(. cada valor original da amostra é removido do domínio espacial e. Utilizado como algoritmo interpolador. e ||h|| é a distância euclidiana entre duas localizações. Depois de estipulado o semivariograma da variável em estudo e ocorrendo a dependência espacial entre os pontos amostrados. mas sim que o mesmo não é de todo incorreto. sem tendência e com variância mínima. utilizando os demais valores. Esta técnica da validação cruzada. é importante realizar a va- lidação cruzada. Kv é a função Bessel de ordem v. Como exemplo dessa categoria de modelo tem o modelo linear e o modelo potencial. pode-se interpolar valores em qualquer posição na área em estudo.1. além de realizar o cálculo médio de uma variável regionalizada para um volume maior que o suporte geométrico. . 2006). tornando-o um algoritmo melhor que os demais existentes.3. devido a sua flexibili- dade. sendo possível assim realizar uma comparação entre o real valor e o estimado. Em todos estes casos. O método de interpo- lação utilizado é a krigagem e quando se trata de um modelo com mais de uma variável envolvida utiliza-se a cokrigagem. é com a função Matérn que é dada por 21−v γ(h) = M (h|v. 2. são modelos que como o próprio nome diz. não se estabilizam em um patamar. Os modelos sem patamar. Após o ajuste de um variograma experimental. Um caso paticular da função Matérn é quando o valor 1 de v é 2 em que a função se iguala a função exponencial.) é a função gama. verificando se o erro de estimação é muito grande. em que depois de obter o modelo variográfico. esta técnica pode prever o valor pon- tual de uma variável regionalizada em um determinado local dentro da área de estudo. este método fornece o erro associado a estimativa realizada. um novo valor é estimado para o ponto retirado.

A maioria dos estudos envolvem mais de uma variável e então. De acordo com Bognola et al. iii) Relações físicas entre variáveis. sendo que essa variável se- cundária é de fácil acesso.2 Geoestatística Multivariada Segundo Chilès e Delfiner (1999). o valor estimado da variável é expresso por: n X Yx∗0 = λ0 + λi Y x i i=1 em que n é o número de vizinhos medidos. Desta forma. correlacionada com a variável de interesse. (2008). realiza-se um estudo da variável de interesse sem muitas medições da mesma. frequentemente combina-se algumas mensurações da variável de interesse com um número maior da secundária e a partir disso. Yxi valores utilizados na estimativa e λi são os ponderadores aplicados a cada Yxi que são selecionados de forma que a estimativa obtida seja não tendenciosa. 2. secundária. as informações disponíveis de um fenômeno natural raramente são limitadas por valores de uma única variável medida em um conjunto de pontos. trabalha-se com modelos multivariados. na qual a função média do processo é estimada. os modelos multivaria- dos são particularmente atrativos quando existe uma variável primária a ser estudada de difícil acesso. ii) Valores númericos da mesma variável estudada em outra época.30 Os tipos de krigagem mais utilizados são krigagem simples. sendo elas: i) Valores númericos de outras possíveis variáveis em outras localizações. Pela krigagem. nas aplicações de ciência da terra existem pelo menos mais quatro fontes adicionais de informação. mas existe uma outra variável. seja por causa de custo elevado ou algum outro motivo. na qual assume- se que a função média do processo estocástico é conhecida e o processo é estacionário e krigagem ordinária. . Quando tem-se a estimação de uma variável em um estudo conjunto com mais variáveis faz-se o uso da cokrigagem. que será discutida mais adiante. iv) Aplicações de conhecimento. Assim.

os modelos e procedimentos são estendidos de diferentes formas. Segundo Bognola et al. quando duas ou mais variáveis são amostradas nos mes- mos pontos amostrais. considera uma ou mais variáveis secundárias na estimativa de uma variável primária. dentro de um mesmo domínio espacial e apresentam significativo grau de correlação entre elas. entre outros tipos de modelagem. respectivamente. Isto é. W =   e G =    −λ1        1 0 0   1        0 1 0 −λ2 0 tem-se que Y1 e Y2 são as variáveis primária e secundária. e e f são os vetores de pesos atribuídos às variáveis primária P P e secundária. são dados por W = J −1 G. 2003 apud BOGNOLA et al. Existem várias técnicas de modelagem multivariada como: modelagem através do vari- ograma e variograma cruzado. utilizando métodos bayesianos.(2008). visando modelar as covariâncias simples e cruzadas entre as variáveis envolvidas (WACKERNAGEL. segundo Isaaks e Srivastava (1989). sendo que ei = 1 e fi = 1 são restrições para garantir . em que:       Cov(Y1 Y1 ) Cov(Y1 Y2 ) 1 e Cov(Y1 Y0 )              Cov(Y2 Y1 ) Cov(Y2 Y2 ) 1   f   Cov(Y2 Y0 )  J =   . modelagem por modelos que implicam estrutura de correlação.2.1 Cokrigagem O método de predição na modelagem geoestatística multivariada é a cokri- gagem. no qual o valor predito em um determinado ponto é dado por uma média ponderada dos dados das variáveis en- volvidas. 31 No caso de observações bi ou multivariadas. respectivamente. 2. em que um modelo muito utilizado é o modelo linear de corregionalização. quando para cada local amostrado obtém-se um vetor de valores ao invés de um único valor. 2008).. usados na interpolação. Esta técnica é bastante útil e evidente. Y0 é referente aos valores que serão preditos. cokrigagem é uma extensão multivariada do método da krigagem. a partir do ajuste de um modelo é possível obter predições espaciais das variáveis de interesse através da cokrigagem. sendo que os pesos W . modelagem através de fun- ção de correlação bi (ou multivariada). como o “Bivariate Gaussian Common Component Model” (BGCCM). podendo ser escrita em termos das covariâncias simples e cruzadas. A cokrigagem.

um conjunto real de funções aleatórias estacionárias de segunda-ordem dado por Yi (x). u=0 em que para todos os índices i.2 Modelos Lineares de Corregionalização A modelagem de corregionalização das variáveis usa o denominado modelo linear de corregionalização (WACKERNAGEL. u e v.32 a não-tendenciosidade. precisa-se que o modelo básico. . N pode ser particionado em sub-conjuntos Yiu (x). Segundo Wac- kernagel (2003). 2003).. p(p+1) sendo que o número total desses variogramas é dado por 2 em que p é o número de variáveis no conjunto em estudo.2. seja o mesmo utilizado nos auto- variogramas. Para que este modelo seja compreendido. 1989). . O de componentes espaciais não correlacionados O X Yi (x) = Yui (x) + mi . 2. mantendo-se assim o valor para o alcance. i = 1. (2007). Yuj (x + h)) = 0 para u 6= v em que Ciju (h) são funções de covariância cruzada associadas com os componente espaciais e são compostas por coeficientes buij . u = 1. permite a modelagem conjunta do variograma simples e do variograma cruzado. Essas funções são proporcionais as funções de correlação . cov(Yui (x).. E[Yui (x)] = 0. j. segundo Bellier et al. Cada variável é caracterizada por seu próprio auto-variograma amostral e cada par de variáveis por seu variograma cruzado amostral (ISAAKS. SRIVASTAVA. O modelo linear de corregionalização fornece um método para modelagem do auto-variograma e do variograma cruzado entre duas ou mais variáveis desde que a va- riância de qualquer combinação linear possível dessas variáveis seja sempre positiva. tem-se E[Yi (x)] = mi . Este modelo. introduzidas pelo uso dos operadores de Lagrange λ1 e λ2 .... utilizado no variograma cruzado.. Yuj (x + h)) = E[Yui (x)Yuj (x + h)] = Ciju (h) cov(Yui (x).

u. obtém-se o modelo linear de corregionalização: O X X N i Yi (x) = wup Wup (13) u=0 p=1 O modelo do variograma multivariado. combinando a decomposição multivariada com a espacial. j. u=0 Cada componente espacial Yui (x) pode ser representado como um conjunto i de fatores não correlacionados Wup com coeficientes de transformação wup . u=0 em que gu (h) representa os variogramas normalizados e Bu é matriz positiva semi-definida. dado por: O X C(h) = Bu ρu (h). O X O X Cij (h) = Ciju (h) = buij ρu (h) u=0 u=0 As matrizes de corregionalização. em que a matriz de corregionalização é positiva semi-definida. segundo Wackernagel (2003). p=1 sendo que para todos os valores do índices i. ou seja. tem-se o modelo de função de covariâncias aninhados multivariado. N X Yui (x) = i wup Wup . . p e q tem-se E[Yup (x)] = 0. cov(Yup (x). associado ao modelo linear de funções aleatórias estritamente estacionárias pode ser representado por: O X Γ(h) = Bu gu (h). 33 ρu (h). Yup (x + h)) = ρu (h) e cov(Yup (x). denotadas por Bu de dimensão N × N . v. Yvq (x + h)) = 0 para u 6= v ou p 6= q Desta forma. podem ser estabelecidas e assim.

. do simples e do variograma cruzado. deve aproximar-se do valor da covariância entre as duas variáveis utilizadas. temos {[Y1(x) ] e [Y2(x) ]} de tal forma que a covariância cruzada entre essas variáveis seja dada por: Cov12 (h) = E{[Y1(x+h) Y2(x) ]} − m1 m2 e Cov21 (h) = E{[Y2(x+h) Y1(x) ]} − m2 m1 Desta forma.4 Modelos Geoestatísticos Bivariados Gaussianos Quando o interesse está em mais de um campo aleatório. p} que foram medidas dentro de uma mesma região de estudo e nos mesmos pontos amostrais.34 Assim. o semivariograma cruzado será: N (h) ∗ 1 X γ12 (h) = {[Y1(x+h) − Y1(x) ][Y2(x+h) − Y2(x) ]} 2N (h) i=1 Segundo Silva et al. suponha-se dois.3 Semivariograma Cruzado Sejam p variáveis {Yj(x) . em que cada um caracteriza uma escala específica da distribuição espacial da variável resposta em estudo. se existir.. 2. desta forma. o patamar. j = 1. o pesquisador escolhe o número e tipo de base de modelos. pois no variograma cruzado o alcance (a) representa a distância máxima de dependência espacial entre as duas variáveis. a covariância será negativa e. 1996) a forma de obter os gráficos do semivariograma cruzado experimental tem significado diferente do obtido pelo semivario- grama simples. Cada função do variograma utilizado para definir o modelo linear de corregionalização tem diferentes famílias e intervalos. con- siderando apenas duas. Dessas variáveis medidas.2. é . 2. acredita-se que o passo inicial é o de ajustar um modelo geoestatístico para cada um dos dois vetores das variáveis observadas porém.. .2. nem sempre é o melhor caminho pois há casos em que existe correlação entre as variáveis aleatórias estudadas e nestes casos. o semi- variograma cruzado produzirá resultados negativos. ao examinar o comportamento do variograma empírico. Quando estas duas variáveis apresentarem uma correlação inversa.(2003 apud Vieira.

no qual o termo Si . σ2 ) um vetor de parâmetros de disperção associados ao modelo (14). Y1 e Y2 . Desta . 2 (14) em que Yi é um vetor ni × 1 dos valores observados no campo aleatório latente Si . Existindo dois campos aleatórios gaussianos. campo aleátorio latente. σ1 . o BGCCM induz uma estrutura de correlação.2 a matriz de covariâncias cruzadas entre as variáveis Y1 e Y2 . já que o campo aleátorio T0 é comum às duas variáveis. a distribuição de Y = (Y1 . 2. sendo n = n1 + n2 . i = 1. de dimensão n1 × n2 .2 Σ2 sendo Σi uma matriz de covariância de dimensão ni × ni da variável Yi com i = 1. µi é um vetor dos parâmetros de média associado a Yi . T0 .2 ΣY =   Σt1. sendo que esta matriz é positiva definida e possui comportamento empírico de correlações utilizado na geoestatística. Segundo Fonseca (2008). vão gerar correlações cruzadas válidas entre as variáveis estudadas. µ2 ) e matriz de covariância ΣY . é decomposto em: Si = σ0i T0 + σi Ti . com vetor de médias µ = (µ1 . utiliza-se o modelo dado por: Yi = µi + Si . i = 1. podendo ser particionada por:   Σ1 Σ1. T1 e T2 são campos aleatórios gaussianos mutuamente independentes. Diggle e Ribeiro Jr (2007) descrevem o modelo denominado “Bivariate Gaussian common component model” (BGCCM). Y2 ) é o interesse fi- nal e esta distribuição é gaussiana n-variada. com vetores de médias nulos. isto é. 2 (15) sendo σ ∗ = (σ01 . 35 interessante utilizar modelos geoestatísticos bivariados. As correlações destes campos aleátorios. em (14).5 Modelo Gaussiano Bivariado com Componente Comum Para problemas bivariados. 2 e Σ1.2. o qual possui um vetor de médias nulo de dimensão ni × 1 e matriz de covariância Σi com dimensão ni × ni . variância unitárias e correlações obtidas por funções de correlação váli- das. quando combinadas desta forma. σ02 .

com a decomposição de S1 e S2 . Para a estimação dos parâmetros desse modelo e a predição espacial. xk e xl . Assim. no qual ρ0 e ρi são as funções de correlação para Ti .k) é representado por Cov(h) = σ0i ρ0 (h) + σi2 ρi (h). Yj (xk )) é dada por:   2 σ01 + σ12 2 σ01 ρ0 (h) + σ12 ρ1 (h) σ01 σ02 σ01 σ02 ρ0 (h)    2  σ01 ρ0 (h) + σ12 ρ1 (h) 2 σ12  σ01 + σ01 σ02 ρ0 (h) σ01 σ02  ΣY =    2 2 2 2   σ01 σ02 σ01 σ02 ρ0 (h) σ02 + σ2 σ02 ρ0 (h) + σ2 ρ2 (h)    2 2 2 2 σ01 σ02 ρ0 (h) σ01 σ02 σ02 ρ0 (h) + σ2 ρ2 (h) σ02 + σ2 Desta forma. i = 0. encontra-se que Σ1. φ∗0 . φ∗2 ) no qual β ∗ é o vetor de parâmetros associados a µ e φ∗j é o vetor de parâmetros relacionados a escolha da função ρj .(l. 1. Então. tem-se que a matriz de covariâncias para o vetor (Yi (xl ). Yi (xk ). . T1 e T2 e assim gerar uma matriz ΣY válida. Yj (xl ). σ ∗ . . o modelo (1) pode ser reescrito por:   Y =µ +σ T +σ T 1 1 01 0 1 1  Y =µ +σ T +σ T 2 2 02 0 2 2 Seja Yi (xl ) e Yi (xk ) observações da variável Yi realizadas nas localizações xl e xk . Pelas propriedades básicas de covariância. φ∗1 .. com j = 0. de dimensão n1 × n2 . k = 1. 2 o elemento Σi. deve-se adotar três funções de correlação para T0 ..2 é igual a σ01 σ02 R0 . 1. Y2 ) está estabelecida e depende do vetor de parâmetros θ = (β ∗ . Considerando apenas duas localizações amostradas.36 forma. e sendo hkl = h a distância entre essas localizações. com l. utiliza- se as técnicas dos modelos geoestatísticos univariados porém. das correlações cruzadas entre as variáveis e depende da função de correlação atribuída para T0 . ni e i = 1. 2. 2. separadas por uma distância euclidiana h = hlk . em que R0 é uma matriz. 2. é necessário uma reparame- trização adicional em θ para obter a função de verossimilhança concentrada. a distribuição de probabilidade do vetor Y = (Y1 .

Kk é a função Bessel. ao invés de estrutura conjunta. a) em que σ 2 > 0 é a variância marginal e 21−k M (h|k. Knutti e Nychka (2008). 37 2..  (16) .   C(h) =   .6 Modelagem por Função de Correlação Como foi descrito acima. Jun.. a função de . Yp (x)) . seja o vetor de variáveis Y(x) = 0 (Y1 (x).. Kleiber e Schlather (2009) a propor um ajuste por estrutura de covariância e covariância cruzada para um campo aleatório gaussiano.. . a) = Γ(k) (a||h||)k Kk (a||h||) é a correlação espacial na distância ||h||. em que cada localização x ∈ Rd existem p componentes. Estas mudanças e desafios motivaram Gneiting. . e como já mencionado. preservando a função Matérn que permite estrutura de covariância cruzada flexiveis e não trivias. por ser uma função bastante flexível. usando covariâncias do tipo Matérn. os modelos espaciais multivariados.2. com vetor de média nulo e matriz de função de covariância dada por   C11 (h) · · · C1p (h) . A família Matérn tem sido muito utilizada na atualidade. É uma proposta potencialmente vantajosa. o BGCCM induz uma estrutura de correlação entre as variáveis através de um campo aleatório comum. por esta falta de flexibilidade do MLC. enquanto que Cij (h) = E(Yi (x + h)Yj (h)) é a função de covariância cruzada entre os processos 1 ≤ i 6= j ≤ p.. Em um processo multivariado. O MLC (modelo linear de corregi- onalização) possui uma falta de flexibilidade. Kleiber e Schlather (2009). Assumindo que o processo é gaussiano multivariado e estacionário de segunda ordem.    Cp1 (h) · · · Cpp (h) em que cada Cii (h) = E(Yi (x + h)Yi (h)) é a função de covariância univariada. No modelo proposto por Gneiting. devido ao fato da facilidade em mudar os parâmetros do modelos e ajustá-los da melhor forma aos dados. estão sendo estudados por muitos autores como revisado em Cressie(1993) e Goovaerts(1992). . estudaram estrutura espacial dos desvios individuais de modelos climáticos. Esta família especifica uma função de covariância dada por σ 2 M (h|k..

Kleiber e Schlather (2009). A covariância cruzada é dada por Cij (h) = Cji (h) = ρij σi σj M (h|kij . então esta função se reduz ao produto da função exponencial e de um polinômio. precisa-se ter cuidado com os valores destes parâmetros. 1 Teorema 1: Seja d ≥ 1 e p ≥ 2. aij ).2. isto é Pn (n+m)! n M (h|n + 21 ) = exp(−a||h||)  m=0 (2n)! m (2a||h||)n−m com n = 0. (18) sendo ρij o coeficiente de correlação. Segundo Gneiting.6. ai ). pois estes valores precisam fornecer uma estrutura de segunda ordem válida. para 1 ≤ i 6= j ≤ p. e considerando que exista um parâmetro de escala comum. 2. a. que possui função marginal e covariância cruzada dada por (17) e (18). que controla a suavidade e é crítico em problemas de interpolação espacial. Segundo Gneiting. Para este modelo os autores definiram alguns teoremas que fazem com que este modelo seja válido. a flexibilidade e popularidade da classe Mátern se deve ao fato do parâmetro k... definem um modelo Matérn parcimo- nioso multivariado.1 Modelo Mátern Multivariado Parcimonioso Gneiting.1. o que é garantido impondo restrições aos parâmetros.2.38 covariância marginal é dada por: Cii (h) = σi2 M (h|ki . Desta forma. ki é relacionado a suavidade e ai é parâmetro de escala. se o parâmetro k da função Mátern for igual 12 .6. 1. isto é. sendo que k > 0. kij é o parâmetro de suavidade e aij é parâmetro de escala espacial. a1 = .. positiva definida.1 Modelo Mátern Multivariado Como já mencionado. Kleiber e Schlather (2009). = ap = a e aij = a. Kleiber e Schlather (2009). isto é. o modelo Matérn multivariado fornece uma . 2. (17) em que σi2 é o parâmetro de variância. supondo que kij = (k 2 i + kj )..

A condição de ter apenas um parâmetro de escala para todos os componentes pode parecer restritiva. em Rd .j=1 . . Essa matriz é simétrica e positiva definida. . . a) (19) e 1 C12 (h) = C21 (h) = ρ12 σ1 σ2 M (h| (k1 + k2 ). Oliver (2003) e. fornece uma flexível estrutura de covariância cruzada para campos aleatórios multivariados para qualquer número de componetes p do processo.. j = 1. isto é. com diagonal composta por βii = 1. Teorema 2: Supondo que c1 . apenas dois componentes. elementos fora da diagonal dados por βij . mais recentemente. Se Cij (h) = (ci ∗ cj )(h) para i. Cressie e Barry (2004). cp funções de valores reais em Rd e essas funções são integráveis e o quadrado delas também é integrável. os parâmetros β12 = β21 admite valores entre −1 e 1. se 1 1 Γ(ki + d2 ) 2 Γ(kj + d2 ) 2 Γ( 21 (ki + kj )) ρij = βij 1 1 Γ(ki ) 2 Γ(kj ) 2 Γ( 12 (ki + kj ) + d2 ) em que (β ij )pi. mas a composição σ 2 a2k pode ser estimada. porém... p em que o * denota o operador de convolução e a matriz dada em (16) é a função de covariância multivariada em Rd .. Zhang (2004) provou que os parâmetros σ 2 e a da função de covariância Matérn. p. por Ver Hoef. Este método de convolução para a construção da função de covariância mul- tivariada tem sido estudada por Ver Hoef e Barry (1998). isso quando parâmetro k da função é fixo. Quando p = 2 . Gaspari e Cohn (1999). 39 estrutura de segunda ordem válida. não podem ser consistentemente estimados sob algumas suposições.. O Teorema 1 acima. o modelo Matérn bivariado parcimonioso é dado por: C11 (h) = σ12 M (h|k1 .. i = 1. Assim. para 1 ≤ i 6= j ≤ p. a) C22 (h) = σ22 M (h|k2 . a) (20) 2 em que 1 1 Γ(k1 + d2 ) 2 Γ(k2 + d2 ) 2 Γ( 12 (k1 + k2 )) |ρ12 | ≤ 1 1 (21) Γ(k1 ) 2 Γ(k2 ) 2 Γ( 12 (k1 + k2 ) + d2 ) ..

40

Considerando p = 2 e d = 2, de um campo aleatório espacial bivariado, a
inequação dada em (21) se resume a

1
(k1 k2 ) 2
|ρ12 | ≤ 1 (22)
(k + k2 )
2 1

Gneiting, Kleiber e Schlather (2009) ainda definem um modelo Matérn biva-
riado completo. Neste modelo, cada função de covariância e covariância cruzada possuem
um parâmetro de escala, isto é, tem-se a1 , a2 e a12 , além de possuir algumas restrições.
O modelo Matérn parcimonioso multivariado é um modelo cujo suporte não
é compacto. A estimação, computacionalmente, dos parâmetros é bastante delicada. Mo-
delos cuja função de correlação são de suporte compacto foram estudados por Gneiting
(2002) e a vantagem deste modelo, com o suporte compacto, é na facilidade e rapidez na
simulção e a predição computacional é bastante eficiente.

2.2.7 Geoestatística Bayesiana

Em geoestatística, os parâmetros dos modelos são estimados e utilizados na
obtenção das predições espaciais das variáveis em estudo. Desta forma, pode-se dizer que
a incerteza sobre estes parâmetros pode ser incorporada na incerteza associada as pre-
dições realizadas. No enfoque bayesiano a incerteza sobre os parâmetros é representada
por distribuições de probabilidades. Ainda, as associações espaciais são melhores captura-
das quando se faz uso de modelos hierárquicos que constróem dependência em diferentes
estágios e, estes modelos seguem o paradigma bayesiano de inferência estatística.
Quando se utiliza a metodologia da geoestatística clássica na estimação de
parâmetros, através do método da máxima verossimilhança, utiliza-se apenas as informa-
ções provenientes dos dados, do modelo adotado e das teorias assintóticas. Porém, quando
se utiliza os métodos bayesianos, além de todos esses conhecimentos, também se utiliza
informações a priori sobre os parâmetros, isto é, pode existir um conhecimento inicial que
é expresso por meio das distribuições a priori e desta forma, na prática, não existe dife-
rença entre parâmetros e observações, sendo que ambos são tratados como quantidades
aleatórias.
Através do Teorema de Bayes obtém-se a distribuição a posteriori dos parâ-

41

metros, dada por:

p(θ, y) p(y|θ)p(θ)
p(θ|y) = = (23)
p(y) p(y)
R
em que θ é o parâmetro, ou vetor de parâmetros, de interesse; p(y) = θ
p(y|θ)p(θ)dθ e
este termo é constante sob a distribuição de probabilidade de θ|y; p(y|θ) é a função de
verossimilhança de y|θ e p(θ) é a distribuição a priori de θ, que representa o conhecimento
prévio da distribuição de probabilidade dos parâmetros.
Segundo Kolman (2004), retirando o termo constante de (23) tem-se:

p(θ|y) ∝ p(y|θ)p(θ) (24)

sendo que p(θ|y) dado em (24) não é uma distribuição de probabilidades, porém ωp(θ|y) é,
se houver uma escolha adequada para a constante ω, que é obtida por métodos analíticos
ou numéricos.
Como já mencionado, após observar Y = y, existe o interesse em realizar
previsões para uma quantidade Yo não observada que, relacionada a θ é dado por:
Z Z
p(yo |y) = p(yo , θ|y)dθ = p(yo |θ, y)p(θ|y)dθ,

sendo que na maioria das vezes, essa integral não possui solução analítica e faz-se necessário
métodos de aproximação para resolve-la.
Depois de definir a distribuição a posteriori dos parâmetros é possível resumir
informações sobre os mesmos através de técnicas inferenciais, utilizando normalmente
probabilidades e esperanças. Nesta etapa, muitas vezes é necessário utilizar métodos
computacionais intensivos como o Monte Carlo via Cadeias de Markov, denominada de
MCMC. Na geoestatística, o amostrador de Gibbs e o algoritmo Metropolis-Hastings são
os métodos mais utilizados.
Neste trabalho, estudou-se o modelo de regressão espacial bayesiana multi-
variada. Inicialmente, considerando um modelo de regressão espacial univariado tem-se
que:

Y (x) = X t (x)β + W(x) + (x)

em que W(x) é um campo aleatório espacial, sendo considerado um campo aleatório
espacial válido somente se para qualquer conjunto de localidades (x1 , ..., xn ) de tamanho

42

arbitrário, o vetor W = [W (xi )]ni=1 segue uma distribuição de probabilidade conjunta bem
definida.
Estendendo o modelo do caso univariado para um modelo de regressão espa-
cial multivariado, cada localização x possui um vetor resposta Y (x) = [Yi (x)]m
i=1 além da

matriz de regressores X t (x). Ainda, no modelo multivariado a matriz W é um processo
Gaussiano multivariado centrado em zero, denotado por W(x) ∼ M V GP (0, K(., .; θ)),
além de capturar a variação espacial; (x) modela o efeito do erro de medida da variá-
vel resposta, segue uma distribuição normal multivariada com média nula e matriz de
dispersão Ψ.
De acordo com Finley, Banerjee, Carlin (2007) o processo Gaussiano mul-
tivariado é especificado pela função de matriz de covariância cruzada K(x, x0 ; θ) =
[Cov(Wi (x), Wj (x0 ))], em que o (i, j)-elemento é a covariância entre Wi (x) e Wj (x0 ),
sendo θ composto por parâmetros que controlam a suavidade e a correlação do processo.
Considerando

Y = Xβ + αŴ + ,

em que Y é vetor np × 1 de respostas, X é a matriz pn × q de regressores e β é o vetor
correspondente dos coeficientes de regressão. Segundo Finley, Banerjee, Carlin (2007), a
especificação dessas matrizes α e Ŵ dão origem a diferentes modelos de regressão espacial
multivariados.
É comum assumir que W(x) = J(x)Ŵ(x), em que J é uma matriz trans-
formada de variação do espaço que é não-singular para todo x e desta forma, a matriz de
funções de covariâncias cruzadas é dada por K(x, x0 ; θ) = J(x)K̂(x)J0 (x).
Na literatura existem vários modelos. Em Finley, Banerjee, Carlin (2007),
os autores apresentam sete modelos:

i) de regressão linear simples sem efeito aleatório;

ii) que assume variância espacial comum;

iii) que permite que o efeito pepita seja o mesmo para as variáveis respostas;

iv) uma extensão do modelo (iii), em que permite termos específicos para variância
espacial e efeito pepita;

v) específico para os elementos fora da diagonal principal da matriz de covariância
cruzada K;

O modelo mais completo é o (vii) sendo que todos os outros são particu- laridades deste modelo. 43 vi) modela específicos termos do alcance espacial. . utilizou-se o modelo (vi) que é representado por: Modelo: J. Para este trabalho. Ψ = diag[τi2 ]m m i=1 . vii) permite que não exista dependencia da variância espacial entre as superfícies de resposta. Φ matriz da dependência espacial e K que depende de J é a matriz espacial de covariância cruzada. Φ = [φi ]i=1 em que Ψ é a matriz não espacial de covariância cruzada.

44 placeholder .

2004). Banerjee e Carlin. isto é. utilizando os pacotes gstat (Pebesma. em um quadrado de lado igual a 25 e com uma malha irregular de localizações. √ √ τ1 = 0. averiguar qual modelo se ajusta melhor aos dados utilizados neste trabalho.7. Realizou- se também a implementação do modelo Matérn Multivariado pois este modelo só está implementado no pacote RandomFields (Schlather. cada vetor Y = (Y1 . Foram feitos estudos de simulação com 1001 conjuntos de dados gerados. spBayes (Finley. Os dados estão diponíveis no Anexo A. e Diggle. 45 3 MATERIAL E MÉTODOS Vários trabalhos que estão sendo publicados. a idéia deste trabalho é de comparar os modelos citados na Revi- são de Literatura -Modelo Linear de Corregionalização.2. τ2 = 0. 3. 2012) e geoR (Ribeiro Jr. As observações do modelo Matérn parcimonioso foram geradas considerando √ √ como valores dos parâmetros: κ1 = 0. Todas as análises e resultados foram obtidos através do ambiente R de pro- gramação (R Development Core Team.1. µ1 = 2 e µ2 = 10. Depois de . Modelo Matérn Multivariado Parcimonioso e Modelo Bayesiano.7. O primeiro grupo foi utilizado para ajustar o modelo bivariado e o segundofoi utilizado para avaliar o erro de predição. retiradas das mesmas localizações. 2006). cada variável era composta por 121 observações. utilizam modelos geoestatísti- cos bivariados para estruturar a dependência espacial entre e dentre campos aleatórios de interesse. Modelo Gaussiano Bivariado com Componente Comum. 2001). σ1 = 0. Sendo assim. κ2 = 0.75.9. Realizou-se um estudo de simulação para o modelo Matérn parcimonioso e fez-se um estudo no conjunto de dados denominado “weather” que foi obtido através do pacote RandomFields (Schlather. ρ = 0. Essas observações são co-locadas.e assim. σ2 = 0. Y2 ) de dados simulados foi dividido em um grupo de modelagem e um grupo de controle. 2012). Para avaliar as precisões das estimativas espaciais. Em cada amostra.1 Estudo de Simulação Esta fase do trabalho é muito importante para detectar possíveis dificuldades no ajuste do modelo Matérn parcimonioso.5. Os parâmetros foram estimados por máxima verossimilhança e cada vetor de parâmetros estimados foi utilizado na predição e krigagem nas localizações do grupo de controle. 2012). das quais 81 foram utilizadas na análise e 40 foram retiradas para validação do modelo.

Nos dados utilizados.. 2009 Uma análise exploratória dos dados foi conduzida utilizando gráficos e me- didas descritivas.. a correlação dessas duas variáveis é -0. Figura 1 . Na análise bivariada. Dos 157 pontos amostrados de cada variável. fez-se a predição das 40 observações retiradas de cada variável. a variável pressão foi utilizada com seus valores divididos por 100 para maior estabilidade dos métodos numéricos. como mostrados na Fi- gura 1. M. Intel (R) Core (TM) i5 M 460 @ 2. Temperatura e pressão são negativamente correlacionados. em locais onde a pressão é alta tem-se baixa temperatura. baixa pressão indica alta temperatura. Kleiber. FONTE: Gneiting. em cada amostra e para avaliar a precisão dessas predições. para validação dos modelos.. retirou-se 52 pontos (grupo controle) para .53GHz 64 bits e as 1001 simulações demoraram em torno de 24h para serem realizadas. Como as duas variáveis pos- suem escalas diferentes.2 Descrição dos dados São dados meteorológicos.46 ajustar o modelo e estimar os parâmetros. W. 3. calculou-se intervalos de confiança marginais.47. isto é. Ressalta-se que as simulações foram realizadas em um computador Dell. referentes a observações de temperatura e de pres- são em 157 localizações no Pacífico Noroeste Norte Americano. T. retirou-se parte dos dados. que detectaram a existencia de padrão espacial nas duas variáveis em estudo.Pacífico Noroeste Norte Americano com as 157 observações. erros quadráticos (EQ) e erros absolutos (EA). Schlather.

realizou a krigagem para os valores preditos do grupo controle. ajustou-se os modelos bivariados mencionados na Revisão de Literatura. Calculou-se os quantis e as médias dos parâmetros e realizou a krigagem para as variáveis antes e após o ajuste do modelo. em uma das variáveis. Conseguiu-se até que bons valores nas predições no grupo controle porém. não conseguiu-se realizar uma krigagem na área de estudo. Uma tentativa de correção para este problema foi de fazer uma mudança. Além disso. ajustou-se um variograma teórico ao variograma experimental de cada uma das variáveis. Uma krigagem na área de estudo foi realizada e além disso. . ajustou-se o modelo linear de corregionalização e com os parâmetros estimados do modelo fez-se uma krigagem para a área em estudo e realizou a predição dos dados no grupo controle. O modelo bivariado gaussiano de componente comum (BGCCM) mostrou-se muito instável para variáveis negativamente correlacionadas. Na abordagem bayesiana. para o vetor Y = (Y1 . realizou-se a predição dos 52 pontos retirados da análise. por problemas computacionais. Nesta análise. A mudança foi de trabalhar criando uma nova variável Y1nova que é dada por: Y1nova = max(Y1 ) − Y1 . Para o modelo matern multivariado parcimonioso. ajustou-se um modelo de regressão espacial bayesi- ana multivariada. sendo Y1 a variável pressão e Y2 a variável temperatura. ajustou-se o modelo aos dados e estimou os parâmetros. 47 predição e os 105 pontos restantes de cada variável foram utilizados na análise. depois realizou-se o variograma cruzado da análise bivariada e então. No modelo linear de corregionalização. Y2 ). Após o ajuste de todos modelos. calculou-se o erro quadrático e o erro ab- soluto para cada uma das variáveis em cada um dos modelos e comparou os resultados obtidos.

48 placeholder .

4222 0.7000 τ12 0.0870 100.2060 σ22 0.9890 Nas Tabelas 2 e 3. 49 4 RESULTADOS E DISCUSSÃO 4. Verifica-se na Tabela 1 as estatísticas descritivas das estimativas paramétri- cas por máxima verossimilhança.2923 0.3300 1. Tabela 1 .9996 0.2408 0.1372 0.0000 2.6738 0. Y2 ).3650 2.9127 2. estão as estatísticas descritivas do erro quadrático médio e do erro absoluto.Estatísticas descritivas das estimativas dos parâmetros obtidas com 1001 simu- lações Parâmetros Mínimo 1o Quartil Mediana Média 3o Quartil Máximo µ1 1.3756 0.2823 1.3300 1.5600 φ 0.8760 5.6090 9.9540 4. sendo este último composto com 40 observações de cada variável.8165 9.0320 1.0000 0.2836 0.5900 κ2 0. respectivamente.8850 2.0522 0.0600 σ12 0.1689 0. das estimativas do grupo de controle.4657 0.0100 10.2171 3.2600 13.0090 2.2220 0. Simulou-se 1001 amostras do vetor Y = (Y1 .2379 0.1725 0. em torno de 90% de cada intervalo contemplam os valores simulados das duas variáveis dos grupos de controle.7630 κ1 0.2240 3.0660 0. sendo gerados 121 dados de cada variável.5472 0.2258 0.2108 0.0000 0.2060 0.0000 10. em cada amostra e cada vetor de dados foi dividido em grupo de modelagem e grupo de controle.9870 4.1 Estudo de Simulação Este estudo teve o objetivo de avaliar a qualidade das estimativas dos parâ- metros e das predições espaciais obtidas com o modelo Matérn parcimonioso multivariado para o qual fez-se uma programação no software R.1150 τ22 0. . Percebe-se que o erro quadrático da segunda váriavel possui uma variabilidade muito alta. Observa-se que os parâmetros σ22 e κ1 foram superesti- mados.6220 3. isto é. Estas variáveis são co-locadas.7810 83. A estimação mostrou-se numericamente instável com dificuldades na convergência das estimações nas análises.2230 µ2 0. são tomadas nas mesmas localizações.0197 0.3119 2.0000 0.7330 10.7600 2. A programação deste modelo está no Apêndice A.1235 0.6020 ρ -0.0030 2. Intervalos de predição foram criados e.

2.0187 0.0003 0.0998 5.0316 0. lembrando que os valores iniciais da variável pressão foram divididos por 100.Estatísticas descritivas do erro absoluto (EA) das variáveis pelo estudo de si- mulação EA Mínimo 1o Quartil Mediana Média 3o Quartil Máximo Y1 -0.0100 0.0008 0.0000 Tabela 3 .2470 3.2 Análise dos dados do Pacífico Noroeste Norte Americano Essa seção mostra os resultados obtidos da aplicação dos modelos detalhados na Revisão de Literatura no conjunto de dados “weather”.019 1.0127 0. Na Figura 3 tem-se os gráficos descritivos das variáveis em estudo.6195 5. 4.5881 -0.50 Tabela 2 .0491 -0.0488 0. média e do desvio padrão de cada uma das variáveis.3160 4.0313 0. já utilizando a variável pressão com os valores transformados.0003 -0.Gráfico de círculos . Na Tabela 4 tem-se os valores da mediana.2136 Y2 0.1050 0. categorizam os dados nos quartis .1 Análise exploratória A Figura 2 mostra os gráficos de círculos com diâmetro proporcional aos valores dos atributos mensurados nas 157 localidades amostradas das variáveis em estudo.(a) para a variável pressão e (b) para variável temperatura.0088 -0.0002 0.2430 Y2 0.1670 119.0076 0.Estatísticas descritivas do erro quadrático (EQ) das variáveis pelo estudo de simulação EQ Mínimo 1o Quartil Mediana Média 3o Quartil Máximo Y1 0. Os gráfi- cos do canto superior esquerdo das Figuras 3(a) e 3(b). (a) (b) Figura 2 .

Nota-se também que a variável temperatura possui ten- dência. Nos gráficos do canto inferior direito das Figuras 3(a) e 3(b).Estatística descritiva das variáveis em estudo. indicam os quartis amostrais.6305 0. “x”. tem-se a densidade amostral das variáveis. A existência de pontos fora do envelope indicam a presença de padrão espacial.9461 1.7182 amostrais das observações. “ o”. O gráfico do canto inferior esquerdo da Figuras 3(a) e 3(b). nesta ordem. Essa dependência espacial também é detectada na Figura 4. Não detectou-se desvio de normalidade nos dados. que é o envelope do variograma. 51 Tabela 4 .9487 Temperatura -0. em que os símbolos “ +”. “∆”. uma vez que existem conglomerados das categorias. Já os gráficos do canto inferior direito. mostram a distribuição de cada uma das variáveis com relação a coordenada no sentido oeste-leste. e os gráficos do canto superior esquerdo é com relação a coordenada no sentido norte-sul. referem-se ao histograma de cada variável. .1408 2.2691 0. Esses gráficos sugerem a existência de padrão espacial nos dados. com variável pressão transfor- mada Variável Mediana Média Desvio Padrão Pressão 1.

Gráfico descritivo do padrão espacial . retirou-se 52 pontos amostrados (grupo controle).(a) da variável pressão e (b) da variável temperatura (a) (b) Figura 4 . com alguns pontos retirados da análise. uma estimação univariada foi realizada para as duas variáveis e também fez-se krigagem para a área de estudo. representados na Figura 6 e ajustou-se um modelo para esses variogramas. Assim. Nota-se que para as duas variáveis o variograma teórico explica muito bem o variograma experimental em distâncias menores.Gráfico dos envelopes do variograma .2 Análise univariada Para validação de cada modelo estudado. Os pontos em vermelho na Figura 5 representam os pontos retirados.(a) da variável pressão e (b) da variável temperatura 4. Realizou-se a estimação dos parâmetros e estes valores estão na Tabela 5 e a krigagem . Além disso.2. realizou-se o variograma experimental para cada uma das variáveis.52 (a) (b) Figura 3 .

Localização dos 52 pontos retirados (em vermelho) (a) (b) Figura 6 . predições foram feitas para o grupo controle. 53 realizada na área de estudo. Figura 5 .003 5.Valores do parâmetros estimados no modelo univariado Variável beta τ2 σ2 alcance Pressão 1. pode ser observada na Figura 7.898 0.2137 .138 Temperatura -0. Além disso.000 7.(a) da variável pressão e (b) da variável temperatura Tabela 5 .1317 1.597 2.Gráfico dos variogramas experimental e teórico .599 0.

2. Percebe-se que as variâncias foram super estimadas.Gráfico das predições espaciais (krigagem) univariada . . respectivamente e o gráfico do canto inferior esquerdo é o variograma cruzado entre as variáveis.54 (a) (b) Figura 7 .3. 2004).(a) da variável pressão e (b) da variável temperatura 4.Gráfico dos variogramas univariados e do variograma cruzado Ajustou-se um modelo para cada um dos variograma da Figura 8 e os parâ- metros estimados do variograma cruzado estão na Tabela 6.2. realizou-se o estudo bivariado pelo modelo linear de corregionalização. Pode-se notar que o mesmo é decrescente. Realizou-se o variograma cruzado das variáveis. isso ocorre devido ao fato das variáveis serem negativamente correlacionadas. Figura 8 .1 Análise pelo Modelo Linear de Corregionalização Através do pacote gstat (Pebesma.3 Análise Bivariada 4. como pode ser observado na Figura 8 onde no canto superior esquerdo e no canto inferior direito tem-se os variogramas das variáveis pressão e temperatura.

dado na Figura 9. Pode-se observar que em localizações com valores altos da variável pressão.Valores do parâmetros estimados para o variograma cruzado pelo modelo linear de corregionalização Variograma Modelo τ2 σ2 alcance kappa Pressão Matérn 0. corroborando o fato de serem variáveis negativamente correlacionadas. realizou-se uma nova krigagem para cada uma das variáveis.135 6. a partir do modelo ajustado. Esta nova krigagem foi realizada em uma malha de pontos para todas as localidades entre as coordenadas dos dados amostrados.437 11 0.(a) da va- riável pressão e (b) da variável temperatura Na Figura 10 tem-se um gráfico das predições realizada no grupo controle.283 18.Gráfico das predições espaciais (krigagem) após o ajuste do MLC .5 Após ajustar o modelo linear de corregionalização.951 11 0. composto pelos 52 pontos retirados da análise.160 11.5 Pressão × Temperatura Matérn 0. estão baixos valores de temperatura. 55 Tabela 6 . (a) (b) Figura 9 . .209 11 0.5 Temperatura Matérn 1.

5. principalmente o da segunda variável. Para contornar este problema redefiniu-se a variável pres- são por: Y1p = max(Y1 ) − Y1 .0000 1.56 (a) (b) Figura 10 . ressaltando que considerou-se média constante. Os σi . i = 1. 2001) . considerou-se o κ = 0.3.Gráfico das predições espaciais (krigagem) para os 52 pontos retirados da análise . . com a devida decomposição do campo latente. realizou-se krigagem para cada uma das variáveis.2 Análise pelo Modelo Gaussiano Bivariado com Componente Comum Para esta análise.5287 — 34. em que as áreas em vermelho possuem os menores valores das variáveis. Na estimação dos parâmetros.2.(a) da variável pressão e (b) da variável temperatura 4. e Diggle.2137 Após a estimação dos parâmetros. As variáveis em estudo possuem correlação negativa o que não é acomodado na implementação do BGCCM.5287 11. 2001) e o modelo utilizado foi o (14). fixo. como revisado na seção 2. 2 foram super estimados. foram feitas adaptações na programação do modelo BGCCM na geoR (Ribeiro Jr.5.Valores do parâmetros estimados para o modelo Gaussiano Bivariado com Com- ponente Comum 2 2 Variável média σ01 σ02 σ12 σ22 alcance Pressão 1.2. Além disso.2137 Temperatura 1.2793 — 23. Tabela 7 . Na Tabela 7 tem-se as estimativas dos parâmetros para este modelo.8579 — 1. e Diggle. utilizou-se as funções disponíveis no pacote geoR (Ribeiro Jr.6511 — 0. que pode ser observada nas Figuras 11 (a) e (b).

para a temperatura foi estimado uma média nega- tiva sendo que a média da variável é positiva porém. 57 (a) (b) Figura 11 . em uma malha de pontos. para as duas variáveis.3. o modelo conseguiu estimar bem os parâmetros. o modelo conseguiu estimar bem a variância desta variável. 472 e na Tabela 8.536 1.831 0.092 0. Para a variável pressão.855 Na Figura 12 observa-se os mapas de krigagem. estão os va- lores estimados dos outros parâmetros deste modelo.310 2.2.855 Temperatura -0.420 1. . Tabela 8 .Gráfico das predições espaciais (krigagem).590 6.485 5.(a) da variável pressão e (b) da variável temperatura 4.3 Análise pelo Modelo Matérn Multivariado Parcimonioso O parâmetro de correlação estimado foi −0. pelo BGCCM .Valores do parâmetros estimados para o modelo Matérn multivariado parcimo- nioso Variável média σ2 τ2 kappa alcance Pressão 1.769 1. rea- lizado em uma malha de pontos que abrange a área estudada.

3. denominada Psi. observa-se os traços (lado esquerdo do gráfico) e a densidade (lado direito do gráfico) dos parâmetros estimados: os interceptos. iniciou-se a análise bayesiana.2. Na Tabela 9 observa-se os quantis e as médias para cada um dos parâmetros estimados. que representam as variáveis (de entrada e de saída) que se interrelacionam e representam a estrutura de raciocínio de um especialista num domínio de aplicação. decidiu-se por optar na distribuição Uniforme para os valores iniciais de phi. optou-se pela Wishart-Inversa como distribuição a priori tanto para matriz não espacial de covariância cruzada.(a) da variável pressão e (b) da va- riável temperatura 4.4 Análise por métodos Bayesianos Para a abordagem bayesiana. denominada K. Nas Figuras 13. Na análise bayesiana. considerou-se 60 número de nós. 15 e 16. Banerjee e Carlin. utilizou-se o pacote spbayes (Finley. o número de iterações para Monte Carlo via cadeis de Markov escolhido foi de 5000 iterações. 2012) para realizar as análises. Para as distribuições a priori. as partições das matrizes de covariância cruzadas não espacial (Ψ) e espacial (K) e os phi. .Gráfico das predições espaciais (krigagem) em uma malha de pontos pelo mo- delo Matérn multivariado parcimonioso . como para matriz espacial de covariância cruzada.58 (a) (b) Figura 12 . 14. Com isso. com burning das 2500 primeiras iterações.

02424 Ψ[2.1985 5.2] 4.47120 5.28691 -0. 1] -0.49635 0.09272 0.07998 4.06280 K[1.6313 0.58157 0.13747 0.4874 3.29911 φ1 0.5996 0.90875 K[2.36666 K[2.22275 -1.23824 0.5% 25% 50% 75% 97.Gráfico do traço e da densidade do intercepto e de parte da matriz K .02074 0.64401 0.96653 7.1] 2.5% Média (Intercepto).52216 0. 59 Tabela 9 .93104 (Intercepto).8082 0.06343 0.19820 0.94664 5.65116 0.0857 -1.35305 3.mod2 -0.1702 -0.57595 Figura 13 . 1] 0.60114 0.5911 0.57644 0.50612 3.83684 -2.Quantis e Média para cada parâmetro por método bayesiano 2.10837 0.51756 Ψ[1.1] -2.4211 0.63527 φ2 0.68684 4.00143 3.06686 -0.02164 0.54184 -1. 2] 0.50882 -0.62445 0.6574 0.26122 0.07714 0.mod1 0.78149 0.17360 0.36461 0.30028 0.55552 0.07643 1.92246 1.23875 Ψ[2.93240 -1.

60 Figura 14 .Gráfico do traço e da densidade da matriz K e de parte da matriz Ψ Figura 15 .Gráfico do traço e da densidade da matriz Ψ e do φ1 .

Figura 17 . Observa-se que o modelo fez uma boa predição para a segunda variável (temperatura). realizou-se a krigagem para os 52 pontos retirados para validação do modelo. quanto a variável temperatura para os valores mais altos. temperatura. mas não fez uma boa predição para a primeira. representados pelas cores mais fortes. tem-se o gráfico de krigagem para as duas variáveis (lado esquerdo) e para a predição das mesmas(lado direito). o modelos não conseguiu predizer bem para valores menores da variável pressão.Gráfico do traço e da densidade do φ2 Na Figura 17. segunda variável (temperatura) . Em ambas as krigagens. Pode-se observar que o modelo conseguiu predizer muito bem tanto a variável pressão. dada na Figura 18.Gráfico de krigagem das variáveis em estudo e para a predição das mesmas no modelo bayesiano .primeira variável (pressão). predizendo valores maiores dos que os reais. 61 Figura 16 . Depois de ajustar o modelo e realizar a krigagem das variáveis utilizadas.

4 Avaliação dos Modelos Como dito anteriormente. segunda variável (tempera- tura) 4.2. para validação dos modelos retirou-se parte dos dados .52 pontos de cada variável. . Assim.62 Figura 18 .Gráfico de krigagem das variáveis do grupo controle e da predição das mesmas no modelo bayesiano . estes pontos foram estimados por todos os modelos estudados e por abordagem univariada e as predições são dadas Tabelas 10 e 11 para pressão e temperatura.primeira variável (pressão). respectivamente.

7682 0.7089 6.0296 -0.4769 2.1146 -0.6492 1.7873 3.8529 0.3774 -1.4416 1.1418 6.1932 0.7603 -5.0207 2.2443 3.9379 6.3567 1.3539 3.8656 -1.5026 3.0230 1.6187 1.8365 6.6993 0.3562 1.3392 0.0212 -0.4486 1.6225 0.7616 2.5526 4.3476 3.2010 1.0651 0.4039 1.2513 0.4632 1.0826 8.4360 3.6648 -1.7222 -0.4928 3.5245 1.1321 0.0657 -0.2783 3.4056 1.7643 8.000 0.29901 1.2007 1.5085 -3.5123 0.0954 2.0166 1.1577 1.1917 0.2037 0.3148 1.5077 0.7962 2.0034 0.2353 2.0422 -1.7434 1.7682 1.2146 1.7489 1.4928 2.2219 -1.6325 2.2496 1.76014 1.1503 1.5572 1.7314 0.6551 1.4345 0.7541 2.7582 2.4139 1.2636 3.6922 0.8076 2.5108 2.5666 -0.8115 -0.8445 2.1660 6.0659 3.2733 1.6987 6.3861 -0.6754 -1.0218 1.7651 1.7764 0.7067 0.0279 -0.3713 2.6277 1.0186 -0. da variável Pressão (continua) Observado Univariado LMC BGCCM Matérn Parcimonioso Bayesiano 2.5961 0.5520 1.8949 0.0549 0.6622 0.1102 2.1398 1.4775 1.6871 2.1854 -0.4411 0.4485 7.2399 0.2368 1.3408 0.5092 2.0280 0.1935 3. do grupo controle.3161 3.0591 3.5900 2.8975 3.1125 0.8878 0.0400 7.8279 1.8245 3.0560 6.4334 1.4809 2.3812 8.7060 .2367 3.3009 0.6448 2.9468 0.9163 0.0843 -0.9766 0.8579 1.3796 2.7984 1.3121 6.1531 2.8267 4.1208 2.5687 1.1555 1.0936 8.1808 1.4252 8.0557 7.5704 1.5027 0.4789 1.8608 4.4942 1.Valor observado e valores preditos.0191 3.5074 0.5477 3.1167 -0.5001 4„3898 1. 63 Tabela 10 .4472 6.6145 0.55088 1.2173 1.0780 3.0911 2.1335 -1.0578 7.3053 0.4329 1.1451 1.2156 0.4602 3.2259 -1.5329 0.7137 2.3204 1.1136 2.5696 0.3302 6.3316 3.3543 1.7173 1.6005 0.3931 1.4749 2.8891 0.0048 -0.1967 1.6524 2.8878 1.7864 2.6708 3.

6048 -1.3396 1.1848 0.1999 -1.6083 2.6673 1.6097 3.6879 -1.0467 0.1820 9.6243 0.2888 2.1862 6.8643 1.2327 3.1350 1.1412 -0.0119 -1.4724 -1.3743 2.3755 1.2238 7.9518 0.6708 0.0080 -1.1201 3.0006 -1.4491 0.4267 1.4465 5.0403 -1.2399 .7022 13.0209 -1.0788 0.8479 0.0754 1.7566 2.7720 2.3098 0.6886 0.1322 -1.1372 0.0492 -1.Valor observado e valores preditos.0508 2.5286 -0.9455 2.3334 2.7949 -1.5206 4.2545 2.2691 2.8471 0.5251 1. da variável Pressão (conclusão) Observado Univariado LMC BGCCM Matérn Parcimonioso Bayesiano 2.9207 -0.5899 0.0487 -0.1226 -0.0844 6.4900 0.8485 12.6386 1.2677 1.5344 -0.6055 -0.7433 1.5318 0.6968 5.0048 2.1050 6.4422 -0.8422 -0.6347 2.6199 -1.4887 2.0919 6.0116 3.9909 -1.6183 -2.6531 -1.3170 1.8166 2.6475 5.7627 0.0106 -0.7929 0.1353 -0.2122 4.6394 -0.3609 0.4915 -0.2297 5.1736 2.8135 2.7013 0.8279 0.1801 1.5969 4.7904 1.8094 3.64 Tabela 10 . do grupo controle.4627 -2.9679 0.1014 -1.6645 5.7064 -0.4588 2.5324 -0.9866 6.4416 0.4287 1.5178 -1.3737 3.4031 2.0080 1.

7212 -0.9120 -0.2489 -1.0474 -0.2640 -0.3046 -0.6073 -0.2132 -0.6212 -3.1159 -0.6901 -3.6141 -3.8901 -0.6869 -0.7902 -1.5517 -2.5760 -0.8827 -0.1232 -0.4029 -0.3785 -0.0950 -0.3632 -2.2347 -1.1291 -0.0623 -0.7164 1.3520 -3.3278 -2.9246 6.7867 -0.0025 -0.4765 -0.8879 -2.2945 -0.1467 0.6819 -3.6365 0.8157 -2.0112 -0.6639 2.3096 1.8101 -0.0220 -0.0820 -1.8399 5.8019 1.2440 -1.3536 0.7757 0.2626 -2.1724 0.9489 -2.5993 -0.0972 -0.0712 -0.3859 12.5932 -0.0936 -0.8791 -0.8784 3.4061 12.2629 -2.2725 -1.4263 -2.1219 0.6513 -0.5898 -2.8063 -0.2404 -0.9233 -0.4231 -0.5197 0.5648 -0.0771 3.4149 -1.0575 -0.6468 1.2719 -1.2118 -1.7217 -0.0575 -0.1095 -0.7393 1.6791 -1.0584 0.2314 -0.2333 4.9673 2.4821 1.7466 -1.5220 -1.6276 -0.8991 0.7308 5.7472 5.0002 -0.9439 -2.0070 0.5808 0.0107 1.2490 -0.0992 3.7396 -1.7734 -0.2486 -2.3794 -0.0001 -4.5543 0.Valor observado e valores preditos.0200 -0.2502 0.1679 -0.5510 -2.1334 0.1623 -0.8169 -1.3386 -2.5105 -0.7277 5.0335 -1.1221 -0.9678 -1.7963 8.4639 -2.5984 -0.1726 -0.0314 -3.0999 2.2762 -1.8776 -1.7849 -0.0781 -1.2437 -1.4346 -0.9677 -1.2178 -1.4049 -2.3562 -0.6416 5.3030 -2.1043 0.6458 -0.6875 -3.0365 -0.6569 3.3771 -1.4302 -1.4928 -1.5131 -0.7264 -1.7224 -2.6349 -2.7001 -1.7336 -0.9787 -1.0622 .3291 -0.7606 -0.5068 1.0535 11.1759 -0.4448 0.4330 0.2089 -1.7909 -1.6563 3.3265 -0.6411 -1.0675 -1.2560 -1.3991 0.2713 0.0272 5.0900 0.6525 -1.2382 3.0761 0.6977 0.9840 2.5358 2.1019 0.0357 -0.3724 -1.5999 0.5570 1.1059 -0.3049 -0.3934 1.5447 -3.4513 -3.0233 6.5279 0.7227 0.2587 -1.1633 -1.5152 -4.2213 0.2707 -1. da variável Temperatura (continua) Observado Univariado LMC BGCCM Matérn Parcimonioso Bayesiano 0.3801 0.3019 0.5016 2.2320 -2.6437 -0.7190 -1.4354 1.8285 0.7293 -3.5991 4.8429 -0.4537 3.6053 -0.3741 -1.5919 -0.2679 5.1058 -0.6111 -1.6389 -1.7015 -1.4580 -1.6244 -0.4399 0.4078 5.5480 -0.6941 -3.6321 1.5301 -3. do grupo controle.6492 5.5093 -1.2749 -0.2802 -0.1059 -0.2266 -0.7747 0.1076 -0.2498 -1.2528 -2.2817 0.9358 -4.2420 -1.1183 1.0596 -1.2612 -1.8231 -0.2109 -1.1209 -0.1594 0.4714 0.2171 1.7430 -0.1700 -0.2392 -1.3999 -1.2896 -0.1120 -2.4045 -4.6390 -1.5967 0.5060 -2.0436 -1.8980 -0.7414 -0.4874 -0.4805 -1.3436 0. 65 Tabela 11 .

1602 -2.2782 0.7721 -2.3052 12.2889 5.2022 0.9232 5.1157 5.9438 -4. pode-se observar a relação entre os valores reais das va- riáveis e os preditos por cada modelo através das Figuras 19 e 20.9423 0.5581 1.3989 0.5394 -3.0058 3.Valor observado e valores preditos. sendo que dos modelos bivariados o LCM se destaca nas melhores predições.5645 3.4150 2.3657 -0.6319 -2. pode-se notar que nenhum modelo ajustou muito bem as duas variáveis.5978 6.1222 0.6979 -10.3860 Desvio Padrão 1.5360 0. Tabela 12 . da variável Temperatura (conclusão) Observado Univariado LMC BGCCM Matérn Parcimonioso Bayesiano -0.3362 .3366 Tabela 13 . do grupo controle.3507 0.6280 1.0764 0.0045 -0.8617 5.Média e desvio padrão dos erros de krigagem do grupo controle para Pressão Estatística Univariado LMC BGCCM Matérn Parcimonioso Bayesiano Média 0.1738 0. só o BGCCM que teve um desvio padrão bem maior que os demais.6610 13.8413 -4.5163 -4.0537 -0.5064 2.1585 6. Nota-se também que o modelo de regressão bayesiano superestimou os valores da variável temperatura. Analisando as figuras. Para a variável pressão.5482 3.2398 -0. Nas Tabelas 12 e 13 estão os resultados descritivos das diferenças entre os valores observados e os valores preditos do grupo controle para a variável pressão e temperatura.5960 -1.2389 Além das tabelas. respectivamente.6589 6.7767 -2.3002 3.2889 -2.66 Tabela 11 . Para a variável temperatura os modelos bivariados também conseguiram explica-la tão bem quanto o univariado. os modelos bivariados conseguiram predição tão boa quanto o modelo univariado.4662 -1.9536 6.0153 Desvio Padrão 1.3625 3.7464 0.0518 -0.4556 5.0698 -0.Média e desvio padrão dos erros de krigagem do grupo controle para Tempe- ratura Estatística Univariado LMC BGCCM Matérn Parcimonioso Bayesiano Média 0.0032 6.3987 12.3186 6.6572 0.4058 0.5712 0.4826 1.8263 -1.2424 -0.1073 5.0727 -0.5188 1.839 4.6455 -2.1238 3.

Gráfico de dispersão da variável pressão versus valores preditos pelos modelo: (a)univariado. 67 (a) (b) (c) (d) (e) Figura 19 . (b)LMC. (d)Matérn Parcimonioso. (e)Bayesiano . (c)BGCCM.

(e)Bayesiano . (c)BGCCM. (b)LMC.68 (a) (b) (c) (d) (e) Figura 20 . (d)Matérn Parcimonioso.Gráfico de dispersão da variável temperatura versus valores preditos pe- los modelo: (a)univariado.

pode-se afirmar que o modelo linear de corregionalização se destaca dentre os demais pois com esse modelo se obteve as melhores predições para as duas variáveis estudadas. 11. 69 Com relação aos modelos bivariados estudados. através das Tabelas 10. 12 e 13 e analisando os gráficos nas Figuras 19 e 20. .

70 placeholder .

para um estudo de simulação no modelo Matérn parci- monioso multivariado. Kleiber e Schlater (2009). 71 5 CONSIDERAÇÕES FINAIS Este trabalho teve como objetivo avaliar o comportamento de modelos geo- estatísticos multivariados para um particular conjunto de dados. Fica como um possível trabalho futuro. i = 1. na falta de recursos para medir e estudar as duas variáveis. visto que no estudo de simulação a variância da segunda variável foi superestimada. existe uma restrição ao parâmetro de correlação (ρ) que de- pende dos parâmetros κi . o estudo de uma pode ser baseado nas medições e análises realizados na outra. Além disso. . o programa não ficou tão estável como se gostaria. foi bastante complicado programar o modelo de uma forma a deixa-lo mais estável e apesar de todo o trabalho demandado. Na implementação. Na análise dos dados weather percebeu-se que os modelos bivariados conse- guiram predizer bem as variáveis. indicando potenciais deficuldades na estimação dos parâmetros do modelo. realizou-se uma programação. Desta forma. Uma possível extensão seria implemen- tar e avaliar o modelo Matérn completo multivariado. os procedimentos numéricos utilizados na simulação mostraram- se instáveis. no software R. A inclusão de informção de gradiente pode melhorar o desempenhodo algoritmo mas não foi possível implementa-la a tempo da conclusão deste trabalho. ocorrendo um destaque para o modelo linear de corre- gionalização. Neste modelo. Desta forma. apesar do estudo de simulação. também proposto por Gneiting. 2 e isso trás maiores dificuldades na estimação dos parâme- tros.

72 .

MONTEIRO. Geostatistics: modeling spatial uncertainty. Amsterdã. J. n. Model-based geostatistics. 241p..4. P. J. BANERJEE. 2007. spBayes: An R Package for Univariate and Multivariate Hierarchical Point-referenced Spatial Models.. Statistics spatial data. RIBEIRO JR. 2002. 2. 209p. A.. 2008. 2008 GASPARI.. CARLIN.. v. Disponível em: <http://CRAN. P.A. P. 722p.. Construction of correlation functions in two and three dimensions. P. P. New York: John Wiley & Sons. 2011.J.... p. . DELFINER. COX. DIGGLE. J. J.30.C. G. Acesso em: 01 ago. S. Spatial Statistics and Computational Methods. Floresta. P.2-2. Modelagem Uni e Bivariada Da Variabilidade Espacial de Rendimento De Pinus taeda l. BOGNOLA.125.E. I. R package version 0.A.org/package=spBayes>. 73 REFERÊNCIAS BELLIER. An analysis of transformation.V. Um estudo sobre estimação e predição em modelos geoestatísticos bivariados..R-project. 493-508. M. Piracicaba. A. (Ed.. p.N. Journal of the Royal Statistical Society. CARLIN. Compactly Supported Correlation Functions. S. 211-252. N. Journal of Multivariate Analysis. 1964. abr/jun. 83. DURBEC. 2012. 2003. 1999. CHILÈS. B.. C. FONSECA.R. P. FINLEY.). RIBEIRO JR.. SILVA.J. CANDAU. DRUCK. Dissertação (Mestrado em Ciências Exatas) .A. EMBRAPA. n. v. p. n. n. E. New York: wiley. 2007. G..2008. v. Curitiba.. In: MØLLER. P. 13p. CRESSIE. spBayes: Univariate and Multivariate Spatial Modeling. T. A. B. Universidade de São Paulo. HIGA. An introduction to model-based geostatistics. 43-86.M. 74p. 1999. Minessota.26.). (Ed. 1993. G. J.. LINGNAU.. BOX. O.Escola Superior de Agricultura “Luiz de Queiroz”.S. 2.. B. Análise espacial de dados geográficos. CÂMARA. P. Identifying spatial relationships at multiple scales: principal coordinates of neighbor matrices (PCNM) and geostatistical approaches. COHN. MONESTIEZ. -P.H. New York: Springer. DIGGLE. Journal of Statistical Software. Ecography.. USA: Springer Series in Statistics. 2007.J. J.A. GNEITING. London.Malden. O.F. n. v. FINLEY.P. E. Quarterly Journal of the Royal Meteorological Society. CHRISTENSEN. 723-757.19.38.F.. S. S. RIBEIRO JÚNIOR. Series B. O. Malden. A. BANERJEE. CARVALHO.. D.385-399. p. 2004. p. Brasília.

jun. Matérn Cross-Covariance Functions for Multivariate Random Fields. R. Austria. Disponível em: < http://cran. Geostatistics for Natural Resources Evaluation. R: A Language and Environmental for Statistical Computing. A. 2009 GOOVAERTS. 2011. 1995. Revista Brasileira de Geociências. P. . Utilização de Geoestatística para o tratamento de dados de prospecção geoquimíca.. SCHLATHER.Escola Superior de Agricultura “Luiz de Queiroz”. Sobre Geoestatística e mapas.74 GNEITING. n. SRIVASTAVA. KOLMAN. JUN. OLIVER. 2010. 30. v. PEBESMA. 2011.M. p. Universidade de São Paulo.B.S. G. Acesso em: 05 jan. Acesso em: 01 jan. New York: Oxford University Press. Terrae Didatica. Disponível em: <http://www.org/web/packages/gstat/>. W. 2003. 2008..Universidade Federal do Parána. 22. Bayesian statistics: an introduction. 934-947.ige. P. 600 p. 1997. 103. v. 2010. 2. A. Vienna.unicamp. KLEIBER. B. 1246-1266. LANDIM. Economic Geology. MARTINS. Curitiba.T. KNUTTI. Análise geoestatística de dados composicionais. 2004. London. London: Academic Press. Dissertação (Mestrado em Ciências Exatas) . Mining Geostatistics.M. C. v. 248-251. D.H. GRIPP. Disponível em: <http://www. An Introduction to Applied Geostatistics. 2..r-project.19-33. v. Principles of geostatistics. ISBN 3-900051-07-0. HUIJBREGTS. M.H. Austin.W. A. MATHERON. p. NYCHKA. R Development Core Team. 496p. D. M. Acesso em: 01 ago.org>. Computers & Geosciences. E.G. 35.E. Department of Statistics. R. 1978. v.. Mathematical Geology.. 2006. R Foundation for Statistical Computing... University of Washington. 462p. p.549. 1995. New York: Oxford University Press. v. Montreal. n. RIBEIRO JÚNIOR. Gaussian cosimulation: Modelling of the cross-covariance. 683-691. P. 1992 ISAAKS. New York: Hodder Arnold. p. J. n. Journal of the American Statistical Association. Visconde. 1989. Piracicaba. 561 p. J. 1. 681-698. 200 p. Spatial Analysis to Quantify Numerical Model Bias and Dependence. p. 58.br/terradidatica/>.R-project.J. Technical Report n. 483. 2011. JOURNEL. Tese (Doutorado) . 99 p. Métodos geoestatísticos no estudo da variabilidade espacial de parâmetros do solo. T.B. p. 1963. 2006. Multivariable geostatistics in S: the gstat package.

. 2001.A. Variabilidade de atributos de solo e de Crotalaria juncea em solo degradado do município de Piracicaba-SP. v. 226p. 2004.0. WACKERNAGEL. 25. 2.54.ed. 403p.C.R. BARRY. v. p. Inconsistent estimation and asymptotically equal interpolations in model-based geostatistics. Tese (Doutorado em Ciências Exatas) . P.. Journal of Statistical Planning and Inference. R. P. 1. SOUZA. Washington.E.A.J. P. 2011. M. URIBE-OPAZO.14-18. 69. VER HOEF. 2004. RandomFields: Simulation and Analysis of Random Fields. DIGGLE. Berlin: Springer-Velag. Tópicos em ciência do solo.M. p.M. E.. 2006. 365-371.org/package=RandomFields>. R-NEWS.. Journal of Computational and Graphical Statistics. p. BARRY. SILVA. p. S. São Paulo: EDUSP.M. 2000. 75 RIBEIRO Jr.J. 1996. 1996. 99. v. Geoestatística para ciêcias da terra e do ambiente. 1998. SALVIANO.2. ROCHA. ZHANG.Escola Superior de Agricultura “Luiz de Queiroz”. n. J. 1-54. p. SOARES. VIEIRA. Constructing and fitting models for cokriging and multivariable spatial prediction. 275-294. Avaliação e Classificação de Reservas Minerais. . v. Maringá. V. geoR: A package for geoestatistical analysis. H. Vienna.G.. 214 p. VER HOEF. Journal of the American Statistical Association..1.An Introduction with applications. Piracicaba. 2003. Multivariate Geoestatistics. R. Agronomy. H. 2.A. 250-261. v. YAMAMOTO.. Disponível em: <http://CRAN. N.K. London. R package version 2. 91 p. 13. Geoestatística em estudos de variabilidade espacial do solo. Acta Scientiarum. A. Portugal: IST Press. 2011. Flexible spatial models for kriging and cokriging using moving averages and the Fast Fourier Transform (FFT). Acesso em: 01 jan.P.A.J.V. Viçosa. A. SCHLATHER. 265-282. 2003. J. p. n. J. CRESSIE. Universidade de São Paulo. Um estimador robusto e o semivariograma cruzado na análise de variabilidade espacial de atributos de solo e planta. Amsterdã.R-project.

76 placeholder .

77 APÊNDICES .

78 .

9 .ncol=sim. sig1 = sqrt(0. upper=T.ncol=1.krige.7).2).ncol=1.matrix(gs).var2))) krige. sig2 = sqrt(0.nrow=length(c(krige. diag=T) ##FUNCOES: .var1 <-matrix(NA.pred2))) ajustesim <.5) .pred.nrow= (nx+ny) ) variavel <-matrix(NA.var2 <-matrix(NA.nrow=length(c(pred1.ncol=1.nrow=sim) #parametros predicao <-matrix(NA.nrow=(nsample)) #O que o programa retorna: gerado <.ncol=1.dist(as.ncol=sim. tau2 = sqrt(0.nrow=1) #Inicio da simulação: for (nsim in 1:sim) { ## grid irregular gs <.nrow=length(c(pred.ncol=sim.ncol=1.matrix(NA. 25).nrow=(nsample)) pred2<-matrix(NA.ncol=sim.7 .matrix(NA.cbind(runif(121.nrow=(nsample)) pred.ncol=1.nrow=(nsample)) pred.var1. 25)) #distancia dM <.var <.1) ) nx = 121 ny = 121 nsample = 40 sim<-150 sim1<-NULL sim2<-NULL var1<.nrow=length(c(var1.var2))) llik <. 79 APÊNDICE A .nrow=(nsample)) krige.nrow=(nsample)) krige. a = 1/4 .matrix(NA.ncol=sim.ncol=sim. tau1 = sqrt(0. 0.Programação no pacote geoR do Modelo Matérn Multivariado Par- cimonioso require(geoR) require(RandomFields) LP <.nrow=(ny-nsample)) pred1<-matrix(NA.var2))) predi <.matrix(NA.matrix(NA.ncol=1. rho = 0.ncol=1.nrow=(nx-nsample)) var2<-matrix(NA.75. nu2 = 0.list(nu1 = 0. 0.var2 <-matrix(NA.ncol=10.matrix(NaN.var1 <-matrix(NA.var1. runif(121.

diag(c22) + tau2^2 c12 <. distPares){ evalq({ n <.40. rnorm(dim(cholSIGMA)[1]))) rm(SIGMA) sim <.cov.spatial(distPares.spatial(distPares.kappa=nu1) c11 <.pars=c(1.sig2^2 * lower2matrix(c22) diag(c22) <.pred[.kappa=nu2) c22 <.rbind(cbind(c11.cov. 1/a).diag(n) M[lower. cbind(c12.model="matern". 121)) sim1<-sim[1:(length(sim)/2)] sim2<-sim[((length(sim)/2)+1):length(sim)] conj<-cbind(gs.model="matern".cov.spatial(distPares.pars=c(1. c22)) }.80 lower2matrix <.3] pred2<-conjunto. NULL) cholSIGMA <.kappa=(nu1+nu2)/2) c12 <.drop(crossprod(cholSIGMA.time(SIGMA <.x M <.] . rep(10. distPares=dV)) dM <. dimnames(dM) <.sim + c(rep(2.tri(M)] <. 1/a).sim1.model="matern".(1+sqrt(1+8*length(x)))/2 M <.t(M) M[lower.function(parList.montaSigma(LP.list(NULL.pred[.(1+sqrt(1+8*length(distPares)))/2 ## condicao/restricao if(abs(rho) > sqrt(nu1 * nu2)/((nu1+nu2)/2)) stop("restricao nos parametros nao satisfeita") c11 <.x M } #Montando Sigma montaSigma <.rho * sig1 * sig2 * lower2matrix(c12) S <.pars=c(1.sim2) amostra<-sample(seq(1:nrow(conj)).as. env=parList) } dV <.matrix(dist(gs. c12).function(x){ n <. cov.tri(M)] <.4] #UTILIZADO conjunto<-conj[-amostra.sig1^2 * lower2matrix(c11) diag(c11) <.cov.rep=FALSE) ###PREDIÇÃO conjunto.as.] pred1<-conjunto.up=T)).diag(c11) + tau1^2 c22 <.vector(dist(gs)) system. cov.chol(SIGMA) sim <. 121). diag=T.cov.pred<-conj[amostra. 1/a). cov.cov.

Machine$double.xmax^0.5) if(evalq(abs(rho)>1||abs(rho) > sqrt(nu1 * nu2)/((nu1+nu2)/2).null(pars$tau1)) pars$tau1 <."nu2"."sig1") %in% names(pars1))) conc <.null(pars$a)) pars$a <.Machine$double.4] logpars2pars <.. n)1e-10 if(conc){ pars$sig1 <.exp(pars$tau1) if(!is.exp(pars$tau2) if(!is. dados$d))) if(conc){ .null(pars$sig1)) pars$sig1 <.exp(pars$a) if(!is. n2."tau2". logpars=FALSE. "nu1". "sig1"."mu2".(exp(pars$rho)-1)/(1+exp(pars$rho)) # } #2 if(logpars){ pars <.Machine$double.xmax^0. ."mu2". printpars = FALSE. pars2."a". names(pars))))) stop("tá faltando parametro!!!") if(!all(c("mu1".exp(pars$sig1) # pars$sig2 <.1 } tchSIGMA <. dados) { # parsList recebe desvios (e não variâncias!) #padrão com opção para log(desvio padrao) # dados : list(d..exp(pars$tau1) # pars$tau2 <.list(pars) if(!is.as.exp(pars$sig2) if(!is.FALSE #1 ou #if(logpars){ # pars$sig1 <.vector(pars) TODOS <."tau1". X.null(pars$rho)) pars$rho <.as.na(match(TODOS.){ pars<-as.pars2)) rodaPARS <<.exp(pars$tau2) # pars$rho <. conc = FALSE."rho") if(any(is.exp(pars$sig1) if(!is.null(pars$sig2)) pars$sig2 <.t(chol(montaSigma(pars.function(pars1.function(pars){ pars <.c("mu1".xmax^0. env=pars)) return(-.list(logpars2pars(pars)) } if(pars$nu1 <=0 || pars$nu2 <=0) return(-.5) if(pars$a <=0 ) return(-.5) if(pars$sig1 <=0 || pars$sig2 <=0) return(-.null(pars$tau2)) pars$tau2 <.(exp(pars$rho)-1)/(1+exp(pars$rho)) return(unlist(pars)) } geral <. n1.list(c(pars1.5) ll<-function(pars. 81 var1<-conjunto[.as."sig2".exp(pars$sig2) # pars$tau1 <.5) if(pars$tau1 <=0 || pars$tau2 <=0) return(-.xmax^0.Machine$double.Machine$double.xmax^0.3] var2<-conjunto[.

calculado a partir da choleski if(conc) llik <.var2)). dados$X))) } else mus <. # c(rep(0.forwardsolve(tchSIGMA. nu1=1. .kronecker(diag(1. 2). dados$n2))) ONEchSIGMA <. dados=lista. rep(mus[2].Mu z <. n2=length(var2).3. tau2=log(sqrt(0.mu2=8. crossprod(ONEchSIGMA.optim(ini.var2).dados$n2)) res <. rho=log((0. sig2=log(sqrt(0. ONE) mus <.) if(printpars){ if(logpars){ cat("original pars: \n") print(unlist(pars)[1:length(pars1)]) cat("logpars: \n") } print(unlist(pars1)) } return(llik) } lista<-list(n=length(c(var1. rep(1.c(pars$mu1. control=list(fnscale=-1.c(mu1=2.forwardsolve(tchSIGMA. n1=length(var1).pars$mu2) #pars[1:2] Mu <. geral.dados$n1). d=as. dados$n1)) ## se n1 != n2: ## ONE <. X=c(var1.#method="BFGS".-0.75))).82 ## matrix (supondo n1 = n2) !!!!!! ONE <. dados$n1). forwardsolve(tchSIGMA.sum(z*z) detSIGMA <.2*sum(log(diag(tchSIGMA))) ## det.65))) ajuste <. dados$n2)). dados$n1).5 * (dados$n * log(2*pi) + detSIGMA + HQ) return(llik) } llik <.dados$X . maxit=3000).c(rep(mus[1]. ..res) HQ <.vector(dist(conjunto[. rep(0. pars2=fixos. nu2=0.3)).1:2]))) ini <-c(tau1=log(sqrt(0.sig1=log(sqrt(0.5.5 * (dados$n * (log(2*pi) + log(HQ/dados$n)) + detSIGMA + dados$n) else llik<. rep(1.solve(crossprod(ONEchSIGMA).ll(pars. a=log(5)) fixos <. conc=T.75+1)/(1-(0..cbind(c(rep(1.6)).-0.4)).

ONE) mus <. tau2<-(ajuste[[1]][[2]]).’nu1’.^2 sig2<-(pars.’rho’. nu1<-ajuste[[1]][[4]]. tau1<-(ajuste[[1]][[1]]). dados$X))) dif<-dados$X-ONE%*%mus sig1.’sig1’) dados<-list(n1=length(var1).’tau2’.dif)) sig1<-sig1.nsim]<-c(pred1.var2) predi[. nu2<-ajuste[[1]][[5]].nsim]<-c(sim1. sig2<-(ajuste[[1]][[6]]).solve(crossprod(ONEchSIGMA).est. solve(tchSIGMA.a.1:2]))) param<-function(pars. crossprod(ONEchSIGMA.mu2.est$tau1)^2 tau2<-(pars.c(’a’. ’tau2’. rep(1.nsim]<-c(var1.param(pars.rho) names(parametros) = c(’mu1’. X=c(var1.nu1.’tau1’.nu2.est$nu1 nu2<-pars.kronecker(diag(1.] mu2<-mus[2.sig1.est<-list(a<-ajuste[[1]][[7]]. d=as.vector(dist(conjunto[.pred2) .’nu2’.solve(tchSIGMA.dados) gerado[.est.’a’.var2).’sig2’.est$a rho<-pars.’rho’) return(parametros) } parametros <.est$sig2)^2 tau1<-(pars.est$rho mu1<-mus[1.t(chol(SIGMA)) ONE <.’nu2’.’sig2’.logp=T) ajuste$par<-logpars2pars(ajuste$par) pars.’sig1’.dados){ SIGMA <. 83 printpars =T.est.tau2.’nu1’. 2).est$tau2)^2 nu1<-pars.sig2. dados$n1)) ONEchSIGMA <.est$nu2 a<-pars.montaSigma(pars.’mu2’.’tau1’. dados$d) tchSIGMA <.<-(1/(dados$n1+dados$n2))*(t(dif)%*%solve(tchSIGMA.] parametros <-c(mu1. n2=length(var2). sig1<-1 ) names(pars.est) <.tau1.(ajuste[[1]][[3]]). rho<.sim2) variavel[.

rho<-parametros[[10]] ) names(parametros) = c(’mu1’.data.coords.matrix(as. kappa1=parametros$nu1.tau2.’a’. variable.pred[.as.data. nu1<-parametros[[7]]. ’tau2’. kappa2=parametros$nu2 )) geodata1<-as.a.col=4) ############# ##PREDICAO:## ############# #Predição dos valores retirados: locations<-conjunto.geodata(conjunto.1:2] pred<-function (object.’rho’) parametros ajustesim[nsim.’nu1’.data.’sig1’.4]).’nu1’.’mu2’.mu2.’nu2’.tau1. sigma2=parametros$sig2. phi=parametros$a. sig2<-parametros[[4]]. tau1<-parametros[[5]].1:2])) S<-montaSigma(k.3]).list(c(n1=length(conjunto[.84 parametros<-list(mu1<-parametros[[1]].frame(list(mu1.col=3) geodata2<-as.geodata(conjunto. ’tau2’.sig2. sig1<-parametros[[3]].’tau1’.rho)) names(k) = c(’mu1’.’sig2’. sigma1=parametros$sig1. mu1=parametros$mu1. locations.’tau1’. d) Sinv<-solve(S) object<-as.’nu2’.col=1:2. a<-parametros[[9]].’sig2’.1:10] <. nu2<-parametros[[8]].data.’mu2’.’rho’) d = as.nu2.sig1. mu2=parametros$mu2.coords.frame(parametros)) ################## ###Para Predição:# ################## k = NULL k = as.to.predict = 1) .vector(dist(conjunto[. n2=length(conjunto[. mu2<-parametros[[2]].’sig1’.col=1:2.’a’. tau2<-parametros[[6]].nu1.

lowerA = Sinv[lower. cov.pars = c(rho * sqrt(sig1) * sqrt(sig2). "geodata1")) geodata2 <.rep(object$mu1.object$mu2)) S012 <.diagA = diag(Sinv)) res$call <. kappa = (object$kappa1+object$kappa2)/2) } if (any(variable. cov. ] <.spatial(loccoords(geodata1$coords.n0) S012[1:n1. locations).object$n2 n <. "geodata2")) #dimnames(locations) <.predict) || length(variable.cov.fc <.list(NULL.predict) != 1) stop("vari?vel deve ser um escalar igual a 1 ou 2") locations <.c((geodata1$data .to.model = "matern".get(attr(object.get(attr(object.nrow(locations) n1 <. ] <.diagquadraticformXAX(S012. "prediction. kappa = (object$kappa1+object$kappa2)/2) S012[(n1 + 1):(n1 + n2). cov.model = "matern". object$phi).cov.n0) S012[1:n1. object$phi).match.pars = c(object$sigma1.model = "matern". locations).matrix(0.to.var0 -geoR:::. NULL) n0 <.cov.tri(Sinv)]. locations). cov.call.model = "matern". ncol = nrow(locations)) if (any(variable.list() res$predict <. object$phi).predict == 1)) { mu0 <.fc attr(res. ] <. nrow = length(res12). cov. locations).call() if (!is.pars = c(rho * sqrt(sig1) * sqrt(sig2).call.fc$locations return(res) } .geodata2 #geodata2 <.object$mu1). Sinv) %*% res12) res$krige.predict) || !is. kappa = object$kappa1) S012[(n1 + 1):(n1 + n2).var <.rep(object$sigma1. cov.n1 + n2 S<-montaSigma(k. 85 { call. n0) var0 <.numeric(variable. ] <-cov.spatial(loccoords(geodata2$coords.to. kappa = object$kappa2) } res <. cov. d) Sinv<-solve(S) res12 <.object$n1 n2 <.spatial(loccoords(geodata2$coords. (geodata2$data .locations geodata1 <.spatial(loccoords(geodata1$coords.rep(object$sigma2.predict == 2)) { mu0 <.to.locations") <.geodata1 #geodata1 <.rep(object$mu2.pars = c(object$sigma2. cov. object$phi).mu0 + drop(crossprod(S012. n0) var0 <.vector(variable.to.

krige. sig2=sqrt(sig2).nsim]<-c(pred.nsim]<-c(krige. printpars=F) llik[.nsim]<-loglik } . a=a).var2<-predicao2$pred krige. rho=rho.var1.pred[.locations.to.predi??o1$pred) pred. nu2=nu2.logpars=T.variable.var1.86 predicao1<-pred(object.4].var predicao2<-pred(object. tau2=sqrt(tau2).var[.var predicao[. conc=T.var1<-predicao1$krige.var2) krige.locations.pred[.variable.var2<-predicao2$krige. dados=lista.predicao2$pred) pred.predict=1) #plot(conjunto. pars2=c(mu1=mu1.pred. sig1=sqrt(sig1)).predict=2) #plot(conjunto. mu2=mu2.var2) ##Loglik do modelo loglik<-geral(pars1=c(tau1=sqrt(tau1).to.3]. nu1=nu1.var1<-predicao1$pred krige.

87 ANEXOS .

88 .

73200 147.70013428 1.164062 -0.01202393 2.29895020 1.375000 -2.101562 1.343750 -1.85500000 -119.63054687 -116.58333 409.99792480 -2.Medidas de Pressão e Temperatura em 157 localizações (coordenadas) no Pa- cífico Noroeste Norte Americano (continua) Longitude Latitude Pressão Temperatura Pressão/100 -131.20000 126.08333 -285.9000 49.6833 49.41171875 -123.5833 48.71375000 -124.617188 -2.242188 -0.45000 240.3800 43.76062012 0.5833 50.84898437 -123.40000 54.7333 50.148438 0.26644897 1.83300 261.726562 -0.23468750 -116.5000 51.453125 -0.84262085 2.92070312 -123.43148437 -123.21667 241.21617187 -119.97451782 -1.39920044 2.63452148 1.53226562 -124.226562 0.59523437 -127.52234375 -115.9333 50.9100 50.36056519 1.51781250 -123.59265137 -1.38333 264.83938599 1.26400757 1.22195312 -119.13333 179.9000 50.28515625 2.46726563 -129.54515625 -126.19679687 -119.53796387 1.63476562 -129.7000 49.515625 -0.Conjunto de dados utilizados Tabela 14 .02101562 -126.914062 -3.47242187 -127.60000 253.99789062 -127.5167 50.195312 -0.65832520 4.81667 166.73724365 0.73962402 2.25271606 4.054688 0.70000 151.30000 248.00000 200.7833 49.5000 49.476562 -2.73202515 2.312500 -0.64929688 -123.01667 115.789062 -2.3000 50.26667 -163.15000 -2.40398437 .054688 -0.20000 156.66054688 -124.10000 156.750000 1.35000 240.40445312 -122.4333 49.43000 227.70153809 2.9000 49.171875 0.3000 48.5000 46.9500 50.8333 49.79625000 -123.804688 -0.125000 -1.09312500 -121.21099854 2.203125 -0.86000 46.48333 299.30000 207.26914062 -125.78734375 -123.56667 -184.56898438 -124.0000 46.27954102 1.2833 50.01309204 1.80000 263.445312 -2.9000 50.03333 -281.23333 156.73789062 -124.984375 -0.74661255 1.75000 -121.265625 -2.76164063 -128.875000 -2.32984375 -114.5500 49.70336914 2.3000 49.25000 199.87478638 3.5000 48.523438 -0.53333 295.4667 48.11667 122.92639160 0.929688 -0.13345337 -0.43453125 -124.22024536 2.851562 -0.61898438 -126.48333 232.60000 -173.59146118 -0.11590576 1.67288208 2.4300 48.789062 0.33050537 -1.14398193 2.99476562 -121.02233887 3.26663208 -1.30670166 2.6500 49.60537720 2.90000 159.5500 51.27835937 -120.5000 44.9220 49.95445313 -122.484375 0.3333 51.03353882 -3.8167 50.898438 -3.05181885 1.23000 -43.0667 51.0500 48.90700 159.0000 48.99017334 -2.75000 -123.59203125 -125.234375 -3.734375 0.63750000 -123.45000 363.398438 -3.445312 -2.62437500 -123.9900 50.63757324 -1.25000 252.8833 49.48429688 -124.90000 384.625000 -4.429688 -1.56265625 -122.468750 -2.554688 -1.45000 -319.15554687 -115.30000 176.4333 49.90000 43.8000 49.77227783 1.4000 41.67916870 2.34000 278.781250 -0.07804688 -122.070312 -2.898438 -1.898438 -0.7667 49.84851563 -124.37243652 2.78333 218.56343750 -117.7000 47.81875000 -121.8000 51.9167 48.835938 -1.1667 49.0000 48.500000 2.437500 -8.63898437 -114.679688 3.18125000 -128.27078247 1.0000 49.898438 -1.08333 462.00484375 -124.476562 -1.65136719 1.24209595 2.9850 49. 89 Anexo A .38333 163.70000 -92.98922729 -0.30000 171.

64484375 -117.484375 -2.546875 0.04031250 -124.39920044 2.61667 -485.61944 -2.46667 -10.054688 -2.648438 5.30100 1.65312500 -120.35366821 -1.05841064 1.5780 46.1667 49.5990 46.3833 49.7667 49.320312 6.95294189 2.8833 45.3667 49.79944 83.88914062 -121.83938599 1.50031250 -124.3000 48.88203125 -117.054688 -2.8667 49.1058 40.49157715 -0.28295898 1.273438 -0.74725342 0.37243652 2.24542236 1.054688 -3.8833 48.61992187 -119.875000 -2.64474487 1.2180 45.35906250 -119.52867188 -119.593750 2.67546875 -121.07945313 -120.34039307 0.2333 41.03333 126.85539063 -122.01078125 -119.2667 49.03333 -281.6700 51.60119629 4.83718750 -119.375000 -0.88203125 -122.2860 46.4283 47.49139 232.99792480 -2.093750 6.507812 -5.10574341 3.539062 9.5053 48.71463013 1.10769653 3.90 Tabela 14 .0667 51.13101196 1.46624756 1.312500 6.031250 -0.054688 -0.43466187 -5.35998535 -0.21578979 -4.94964600 -0.43000 -72.58248901 -1.89414062 -123.56300 -61.5167 49.64370728 -1.24981689 1.98730469 0.74400 1.718750 6.41667 167.75271606 1.4333 48.4333 49.054688 -3.992188 6.22593750 -121.03054687 -125.8086 44.81875000 -121.97917 407.101562 3.50273437 -117.5500 51.43601563 -123.65700 -4.15694 148.9833 51.97875977 1.015625 -3.32164063 -124.164062 1.58531250 -123.085938 -1.77648438 -123.687500 0.929688 4.97417 -122.10739136 -0.43548584 -1.4500 50.95000 184.15194702 0.414062 0.72320312 -119.203125 -1.08333 359.59054687 -125.04929687 -119.43304688 -119.906250 -2.71667 189.10742188 -116.914062 -3.398438 -3.78333 343.83398438 -118.95000 184.07093750 -119.6700 51.30679321 -0.64474487 1.554688 -1.304688 -0.90811157 1.10574341 3.08333 359.74151611 1.437500 -8.65890503 -0.03326416 1.3333 48.07039062 -118.46667 -172.84278 -53.6333 49.25271606 4.36400 -6.3333 51.46954346 2.26773438 -119.20391846 -0.26914062 -125.65000 189.5644 41.68900 -52.68333 150.84375000 -123.08333 462.15554687 -115.4900 47.03326416 1.4833 49.8825 46.87478638 3.96667 -104.9000 49.36667 235.74282837 -2.92465210 -0.648438 2.89335937 -127.66667 18.30000 -588.601562 -1.7667 49.6330 46.16357422 0.30000 -207.335938 -1.695312 -0.65695190 0.031250 -1.67000 103.531250 -0.3600 46.67000 103.5510 46.84375000 -123.078125 1.55600 -83.20000 126.867188 5.12695312 -124.7667 49.05000 188.68000 243.56667 112.71463013 1.18333 158.59500 120.3136 47.687500 -0.18218750 -117.218750 1.59054687 -125.45000 363.7833 49.57800 -65.039062 -1.45000 240.35507812 -120.45000 -319.2406 43.5210 46.6000 49.15109253 2.1661 45.03054687 -125.72647095 0.20101562 -116.679688 3.72015625 -123.63054687 -116.01062500 -120.54583 50.25000 252.234375 -3.7833 49.48687500 -122.09500 77.55000 -167.52234375 -115.05000 188.70000 35.7260 46.62437500 -123.5392 48.2667 49.Medidas de Pressão e Temperatura em 157 localizações (coordenadas) no Pacífico Noroeste Norte Americano (continuação) Longitude Latitude Pressão Temperatura Pressão/100 -124.9564 43.203125 -1.27078247 1.53687500 -122.12222 164.59271240 -1.03353882 -3.19679687 -119.914062 4.773438 -2.742188 0.54500 -107.3010 46.06648437 -119.3667 50.40398437 -124.375000 -0.01667 115.398438 -1.2842 46.8667 49.945312 -0.9900 50.56497192 -0.59786987 -0.67085938 -115.062500 5.585938 1.02585938 .

23389 344.91394043 2.27230835 -3.83233643 3.2144 44.3561 43.773438 3.44472 19.63653564 0.15734863 -0.8722 42.83125000 -119.046875 1.7242 42.19328125 -117.39778 -203.3203 47.52028 173.632812 -0.35679687 -124.68194580 3.8072 40.69937500 -122.5292 47.3136 47.26750 24.6500 47.4247 45.03085327 0.97278 83.18682861 -0.35390625 -115.3000 50.328125 0.48046875 -122.679688 0.21804688 -123.61195312 -117.984375 0.14694 309.4667 41.82507813 -122.14089966 2.14417 -178.8000 46.937500 -0.59674072 1.51139 138.46273438 -121.7875 40.7656 45.45882812 -119.5550 47.14086914 -2.60028 349.03046875 -115.3372 47.16799927 2.851562 -0.34085938 -117.37472 -12.30539063 -119.31781250 -117.2825 47.3133 47.1167 46.11593750 -123.24365234 1.26972 -34.59207153 1.5761 47.562500 4.140625 3.57839966 -0.34070312 -122.86987305 1.23806 91.27667 -34.48333 48.2500 43.257812 3.0097 44.05715942 1.195312 -0.57742188 -122.273438 -2.20974731 0.30806 -91.945312 4.59390625 .04244995 -0.742188 -0.04565430 2.41667 235.359375 5.359375 1.36535645 -0.78897095 -2.15310669 1.9950 44.6003 45.12014771 -0.88333 10.906250 2.406250 2.88906250 -123.343750 -1.6697 47.15000 -1.12359375 -118.281250 0.38632812 -122.31583 112.1136 46.5278 47.757812 -0.8622 45.61667 -122.8342 45.43851562 -121.539062 -0.50562500 -122.0994 44.6506 48.3161 41.64929199 -0.429688 -3.49281250 -122.46139 -261.5192 48.59056 213.89757812 -117.2014 47.90000 246.87023926 -1.38111 282.45333862 2.39553833 0.125000 0.17388916 2.45417 711.26359375 -119.390625 -1.3642 42.44400024 -2.49929810 0.52773437 -128.39195313 -117.73585937 -117.507812 -1.07664063 -124.07791138 -2.2128 47.97257812 -116.19611 145.734375 1.78359375 -122.69833 150.007812 1.1322 45.79730225 1.60733032 1.1500 44.1000 49.44482422 1.89916992 1.10015625 -122.328125 0.54806 138.632812 3.09007812 -117.578125 -0.63945312 -128.59083 126.195312 -0.46406250 -122.03361 -110.34917 169.24889 135.38328125 -123.6564 45.45800781 2.4089 45.015625 -0.046875 1.91632813 -122.359375 -0.10140625 -119.609375 -2.53469849 1.87765503 3.804688 2.93750 232.63964844 7.9544 45.8644 42.29293823 -0.89498901 2.13984375 -122.19306 -97.781250 2.86609375 -123.10007813 -118.47375488 -1.22335938 -122.335938 2.585938 -0.48397827 0.16333008 0.390625 -2.12380981 -1.55111 146.5147 47.359375 0.91507812 -123.0253 48.085938 5.046875 -1.13333 286.44429688 -121.22091675 1.92306 -210.97333 30.90194 359.84185791 3.05734375 -123.25024414 1.648438 -3.9033 46.49444 -15.664062 4.25417 239.070312 1.32578125 -122.5964 46.71405029 0.47146606 0.68556 -88.90778 243.882812 0.38648438 -120.Medidas de Pressão e Temperatura em 157 localizações (coordenadas) no Pacífico Noroeste Norte Americano (continuação) Longitude Latitude Pressão Temperatura Pressão/100 -120.0144 46.2611 45.007812 0.76917 105.507812 2.78333 189.62333 131.82583 63.015625 -2.82639 338.01343750 -122.15046875 -122.62139 -52.12015625 -115.4833 47.00000 -357.74389 21. 91 Tabela 14 .01944 -207.24359375 -122.9303 46.48632812 3.1408 47.12136841 -0.593750 2.

81664062 -122.Medidas de Pressão e Temperatura em 157 localizações (coordenadas) no Pacífico Noroeste Norte Americano (conclusão) Longitude Latitude Pressão Temperatura Pressão/100 -120.500000 -0.32000 184.59069824 2.140625 -0.9000 42.617188 -1.65350 76.64757812 -122.76828125 -128.47835938 -122.828125 -1.5000 42.92 Tabela 14 .20000 642.63800 45.0700 44.757812 -3.4350 47.7400 48.05545044 6.61000 247.265625 -2.56695557 -1.40000 464.96774292 4.26123047 2.84500000 -124.59701538 0.65800 73.3099 47.39000 281.3550 47.960938 5.63900757 0.02194214 1.73140625 .45617188 -124.21789551 0.5336 46.664062 -1.63960938 -122.835938 0.42265625 -129.56417 -163.8400 48.