You are on page 1of 36

Relatrio sobre Modelagem no CRIA

ndice
1 Apresentao ......................................................................................................1
2 Objetivo ...............................................................................................................1
3 Introduo ...........................................................................................................1
Modelagem de nicho ecolgico............................................................................................ 1
Algoritmos Genticos........................................................................................................... 3
3.1.1 Inspirao na Teoria da Evoluo das Espcies e Terminologia.......................................................4
3.1.2 Espao de Busca de Solues e as Superfcies de Otimizao..........................................................4
3.1.3 Operadores Heursticos......................................................................................................................5
3.1.4 Genetic Algorithm for Rule-set Production (GARP).........................................................................6
Modelo de Nicho Ecolgico no GARP ................................................................................. 7
3.1.5 Codificao das Regras no Algoritmo Gentico................................................................................8
3.1.6 Aplicao dos Operadores Heursticos Sobre as Regras...................................................................8
3.1.7 Seleo Natural no GARP e Incio de uma Nova Iterao................................................................9
4 Atividades Realizadas ......................................................................................10
Vinda do Prof. A. Townsend Peterson............................................................................... 10
4.1.1 Atividades Realizadas......................................................................................................................10
4.1.2 Pesquisa GARP ...............................................................................................................................11
4.1.3 Comentrios.....................................................................................................................................11
Pesquisa em andamento................................................................................................... 11
Aquisio de novos software e de capacidade de armazenamento de dados .................. 12
4.1.4 ArcView Concurrent Master Lab Kit Pak 8.2..............................................................................12
4.1.5 Armazenamento de dados................................................................................................................12
Estudo e Anlise dos Dados de Biodiversidade ................................................................ 12
4.1.6 Dados biolgicos.............................................................................................................................12
4.1.7 Qualidade dos dados biolgicos......................................................................................................14
4.1.8 Dados Ambientais............................................................................................................................14
4.1.9 Qualidade dos dados ambientais......................................................................................................15
4.1.10 Converso de dados.....................................................................................................................15
4.1.11 Interpolao de dados..................................................................................................................15
5 Produtos ............................................................................................................16
Aplicaes do GARP no Brasil........................................................................................... 16
5.1.1 Uso do GARP para prever a distribuio geogrfica de espcies....................................................16
5.1.2 Uso do GARP para prever algumas conseqncias de alteraes climticas futuras na distribuio
geogrfica de espcies. .................................................................................................................................17
5.1.3 Uso do GARP para predizer o potencial de invaso de espcies exticas.......................................18
Publicaes........................................................................................................................ 19
Palestras apresentadas ..................................................................................................... 20
Capacitao da Equipe...................................................................................................... 21
5.1.4 Curso de Geoprocessamento............................................................................................................21
5.1.5 Curso de Doutorado em Cincias da Engenharia Ambiental...........................................................21
5.1.6 Bolsista de ps-doutoramento - Fapesp...........................................................................................21
6 Principais Dificuldades Encontradas..............................................................21
7 Concluses, Recomendaes e Diretrizes Futuras.......................................23
8 Bibliografia........................................................................................................24
Anexo 1: Definies de Dados Ambientais...........................................................27
Anexo 2: Curso de Geoprocessamento ................................................................31
Projeto de curso: Fabrcio Pavarin..................................................................................... 32
Projeto de curso: Alexandre Marino................................................................................... 32
Projeto de curso: Rafael Fonseca...................................................................................... 33

ii

1 Apresentao
O nvel de conhecimento sobre a distribuio geogrfica de espcies tropicais precrio. A
maioria das espcies representada por poucos pontos de amostragem e o
georeferenciamento, principalmente dos dados histricos disponveis nas colees
biolgicas, muito impreciso.
O programa Biota/Fapesp introduziu a obrigatoriedade do uso do GPS (Global Positioning
System) nas pesquisas de campo realizadas no mbito do programa e tornou obrigatrio o
compartilhamento do resultado das pesquisas. O SinBiota
1
foi desenvolvido para armazenar
e disponibilizar esses dados juntamente com a base cartogrfica do Estado de So Paulo
(produzida pelo Instituto Florestal). Tem-se ainda que o projeto speciesLink est
desenvolvendo o catlogo virtual das colees cientficas do Estado de So Paulo.
A existncia dessa nova base de informao a servio da pesquisa torna factvel estudar e
desenvolver ferramentas que possam usar esta infra-estrutura para produzir informaes
para anlise e tomadas de deciso.
O CRIA em parceria com pesquisadores de outras instituies vem estudando e
desenvolvendo uma metodologia para anlise espacial desses dados utilizando modelagem
de nicho ecolgico.
O relatrio procura descrever os avanos e as principais dificuldades encontradas neste
processo e tambm fornecer diretrizes futuras para essa linha de pesquisa dentro do CRIA.
2 Objetivo
O objetivo do trabalho estudar, desenvolver e disseminar ferramentas de modelagem de
distribuio geogrfica adequadas para as espcies e para as condies
ecolgicas/ambientais brasileiras.
3 Introduo
A equipe do CRIA comeou a se envolver com modelagem a partir da vinda do Professor
Townsend Peterson ao Brasil em 1999 e a ida de um membro da equipe Universidade de
Kansas para trabalhar no desenvolvimento do GARP (Genetic Algorithm for Rule-set
Production). A aprovao do projeto speciesLink deu ao CRIA a oportunidade e as
condies necessrias para desenvolver esta linha de pesquisa no Brasil.
O GARP foi desenvolvido baseado nos conceito de nicho ecolgico e de algoritmos
genticos. Este algoritmo foi projetado para criar e otimizar um conjunto de regras ou
proposies lgicas sendo desenvolvido originalmente por Stockwell e Noble (1992).
Modelagem de nicho ecolgico
O processo de modelagem de nicho ecolgico consiste em converter dados primrios de
ocorrncia de espcies em mapas de distribuio geogrfica indicando a provvel presena
ou ausncia da espcie, neste caso, atravs da aplicao de algoritmo gentico.
Estes modelos trabalham, na maioria dos casos, com o conceito de nicho ecolgico
fundamental da espcie. Este conceito foi definido por MacArthur (1972), como sendo um
conjunto de condies ecolgicas com as quais as populaes conseguem se manter, que
pode ser representado por um espao ecolgico/ambiental multidimensional (Figura 1).

1
Sistema de Informao Biota/Fapesp: http://sinbiota.cria.org.br
1

Modelo de nicho ecolgico
T
e
m
p
e
r
a
t
u
r
a

Precipitao

Figura 1. Exemplo de espao bidimensional definido como nicho ecolgico de espcie
baseado em dois parmetros ambientais (temperatura e precipitao).
Tais algoritmos tentam encontrar relaes no-aleatrias entre os dados de ocorrncia da
espcie com os dados ecolgico/ambientais relevantes para a espcie (tais como:
temperatura, precipitao, topografia, tipo de solo, geologia, entre outros) no ponto onde a
espcie foi registrada (Figuras 2 e 3).
Modelo de Nicho Ecolgico
G
e
o
g
r
a
f
i
a







E
c
o
l
o
g
i
a

T
e
m
p
e
r
a
t
u
r
a

GARP

Figura 2. Esquema mostrando a relao entre os dados de campo e a previso de
distribuio geogrfica atravs do processo de modelagem de nicho ecolgico.
Registros de ocorrncia da espcie
Precipitao
Distribuio prevista
2


Figura 3. Esquema mostrando a relao entre as variveis ambientais e os pontos de
ocorrncia da espcie.
Existem vrios mtodos na literatura que podem ser aplicados para se obter modelos de
nicho ecolgico a partir dos pontos de ocorrncia de espcies, conforme mostrado na
figura 2. A pesquisa focou algortmos genticos com nfase no GARP (Genetic Algorithm for
Rule-Set Production).
Algoritmos Genticos
Segundo Mitchel (1996), foi entre as dcadas de 1950 e 60 que vrios grupos de cientistas
da computao comearam a estudar os sistemas evolucionrios de maneira independente.
Estes sistemas se baseavam na idia de que a teoria da evoluo das espcies (Darwin,
1859) poderia ser utilizada como ferramenta de otimizao para problemas de engenharia.
Todos esses sistemas seguiam a idia central de que uma populao de solues
candidatas para a resoluo de um problema evolua e seus indivduos eram melhorados
atravs da aplicao de operadores inspirados na variao gentica e na seleo natural.
Ainda durante a dcada de 60, vrias aplicaes foram desenvolvidas usando este conceito,
em problemas de engenharia aeronutica (Rechenberg, 1965), em problemas de cincia da
computao (Fogel et. al., 1966), entre outras.
Foi no incio da dcada de 70 que Holland e seu grupo de pesquisa comearam a estudar
mtodos para estudar o fenmeno da adaptao das espcies como ocorre na natureza e
desenvolver estratgias para a utilizao desses conceitos em sistemas computacionais.
Ao contrrio dos outros pesquisadores da rea que vinham aplicando a teoria da evoluo a
problemas especficos, Holland e seu grupo tinham como objetivo usar a teoria para
desenvolver uma metodologia genrica de resoluo de problemas. Como resultado de suas
pesquisas, foram introduzidos os algoritmos genticos (Holland, 1975). Nesta publicao,
Holland apresentou o conceito dos algoritmos genticos como uma abstrao da evoluo
biolgica e estabeleceu a base terica para a adaptao de solues atravs da variao
gentica e da seleo natural.
3

3.1.1 Inspirao na Teoria da Evoluo das Espcies e Terminologia
Grande parte dos conceitos em que os algoritmos genticos se baseiam esto relacionados
com os conceitos biolgicos da evoluo das espcies e da seleo natural.
Para ilustrar como estes conceitos so empregados na resoluo de um problema atravs
de um algoritmo gentico, considere o seguinte problema de minimizao da funo:
f(x, y, z) = x -2y + 5z
no domnio dos nmeros inteiros entre 0 e 255.
Uma soluo vlida para o problema denominada um indivduo. Um conjunto de indivduos
considerado uma populao. Neste caso os pontos: p =(156, 18, 2) e q =(4, 8, 100) so
dois indivduos e o conjunto dos dois pontos uma populao. Cada indivduo tem seu
prprio genoma que representado por um ou mais cromossomos. No exemplo proposto,
um cromossomo poderia ser representado pela concatenao das representaes binrias
das coordenadas dos pontos. Assim, os cromossomos P e Q (representando os pontos p e
q) teriam a seguinte forma:
P = 100111000001001000000010
Q = 000001000000100001100100
Cada cromossomo subdividido em genes que se encontram disponveis em um nmero de
alelos, e cada indivduo pode ter presente em seu genoma uma combinao arbitrria de
alelos. No caso do exemplo proposto, os cromossomos seriam subdivididos em 3 genes, um
para cada varivel da funo, x, y e z. Os cromossomos P e Q teriam os alelos 156 e 4 para
o gene x, respectivamente.
3.1.2 Espao de Busca de Solues e as Superfcies de Otimizao
A idia de se buscar uma soluo tima para um problema dentre um conjunto de solues
candidatas um conceito bastante comum na Cincia da Computao. Este conjunto que
contm todas as possveis solues para um problema chamado de espao de busca.
Cada soluo pertencente ao espao de busca est associada a um valor que define a
qualidade da soluo. Estes valores associados a cada soluo, se expressados em um
espao multidimensional formam o que se chama de funo ou superfcie de otimizao.
A Figura 4 mostra um exemplo de um espao de solues bidimensionais em que as
diferentes solues so mostradas no eixo x e os respectivos valores da funo de
otimizao f(x) so mostrados no eixo y.

Figura 4. Exemplo de superfcie de otimizao. Fonte: Obitko, 1998
Na Figura 4, as barras verticais representam exemplos de solues presentes no espao de
solues para um problema arbitrrio. A curva em azul representa a funo de otimizao.
No caso do exemplo da funo de otimizao proposta anteriormente, o espao de busca
seria a combinao de todos os valores possveis das trs variveis em seus domnios e a
4

superfcie de otimizao consistiria na superfcie tridimensional definida pelo valor funo de
otimizao em todos os pontos do espao de busca.
3.1.3 Operadores Heursticos
Uma vez definida a maneira com que as solues de um dado problema so codificadas,
pode-se ento aplicar um conjunto de operadores heursticos para modificar solues
existentes, obtendo novas solues para o problema.
Este processo de modificao de solues existentes com objetivo de obter novas solues
o mecanismo bsico usado pelos algoritmos genticos para explorar o espao de solues
de um problema.
Os operadores heursticos mais empregados so: a recombinao gentica (crossing-over)
e a mutao.
3.1.3.1 Recombinao gentica
A operao de recombinao consiste na criao de novos cromossomos a partir da
permutao de segmentos de dois outros cromossomos pais. Veja um exemplo de
permutao entre os cromossomos P e Q definidos anteriormente na posio 12.
Antes da permutao tinha-se P e Q:
P = 100111000001- 001000000010 p =(156, 18, 2); f(p) =130
Q = 000001000000- 100001100100 q =(4, 8, 100); f(q) =488
Aps a permutao tem-se P e Q:
P = 100111000001- 100001100100 p =(156, 24, 100); f(p) =158
Q = 000001000000- 001000000010 q =(4, 2, 2); f(q) =10
Como resultado tm-se dois novos pontos do espao de solues, com valores distintos na
superfcie de otimizao.
3.1.3.2 Mutao
A mutao consiste em realizar uma alterao do valor da seqncia de um cromossomo
numa posio aleatria. Veja o exemplo de uma mutao no cromossomo P, na posio 17.
Antes da mutao tinha-se:
P = 100111000001<0>01000000010 p =(156, 18, 2); f(p) =130
Aps a mutao tem-se P:
P = 100111000001<1>01000000010 p =(156, 26, 2); f(p) =114
Da mesma forma que na recombinao, a mutao proporciona um mecanismo para o
algoritmo explorar o espao de solues do problema.
3.1.3.3 Algoritmo Gentico
De maneira geral, os algoritmos genticos seguem a seguinte estrutura de execuo:
1. Incio: gerada uma populao inicial de n indivduos;
2. Adaptao: Avalia-se o grau de adaptao de cada indivduo da populao
atravs da funo de adaptao f(x). Os indivduos menos aptos, isto , aqueles
que tm valor de f(x) menor que um limiar v, morrem e so eliminados da
populao;
5

3. Reproduo: Os indivduos mais adaptados, isto , que tm valor de f(x) maior
que um limiar v, reproduzem-se e criam um novo conjunto de indivduos. A
reproduo se d da seguinte forma:
a. Seleo: Dois indivduos pais so selecionados a partir da populao
existente, de acordo com os valores de suas funes de adaptao f(x);
b. Recombinao: Os cromossomos dos dois indivduos so alinhados e
recombinados para formar novos indivduos;
c. Mutao: Cada novo indivduo sofre mutao em posies aleatrias dos
seus cromossomos segundo uma probabilidade de mutao pr-definida;
4. Criao da Nova Populao: Os indivduos gerados na fase de reproduo so
incorporados populao;
5. Teste da Condio de Parada e Incio de Nova Iterao: Verifica-se se o
nmero total de iteraes chegou ao fim. Se sim, a execuo do algoritmo
interrompida e o indivduo mais apto da populao atual a soluo do
problema. Caso contrrio, o algoritmo volta ao passo 2.
Os algoritmos genticos processam as populaes de cromossomos atravs das etapas
descritas acima, substituindo uma populao pela prxima. Os cromossomos so
transferidos de uma gerao para a prxima de acordo com o valor da funo de adaptao,
que consiste numa medida de quo boa a soluo representada pelo cromossomo (uma
metfora para o fentipo).
Para mais detalhes sobre os algoritmos genticos sugerem-se a leitura de Davis (1996),
Mitchell (1996) e Goldberg (1989).
3.1.4 Genetic Algorithm for Rule-set Production (GARP)
O GARP um algoritmo gentico projetado para criar e otimizar um conjunto de regras ou
proposies lgicas desenvolvido originalmente por Stockwell e Noble (1992). Este conjunto
de regras a base de inferncia usada para modelar o nicho ecolgico das espcies.
3.1.4.1 Tipos de Regras
As regras usadas no algoritmo apresentam o seguinte formato:
Se A verdadeiro ento B verdadeiro,
onde A a pr-condio e B o resultado ou previso da regra. Neste algoritmo, a pr-
condio uma expresso lgica que define uma regio do espao ecolgico (atravs das
variveis ambientais) e o resultado a previso de presena ou ausncia da espcie.
No GARP as regras podem ser de quatro tipos diferentes: regras atmicas, de faixa, de faixa
negada e logit.
As regras atmicas so as regras mais simples usadas pelo algoritmo. As regras atmicas
usam apenas um nico valor de cada uma das variveis ambientais na sua pr-condio.
Um exemplo de regra atmica seria:
Se Temp = 23C e Elevao = 2000m ento txon est presente
Ao serem criadas no modelo, cada varivel ambiental recebe um valor aleatrio.
As regras de faixa (ou range rules) so uma generalizao das regras atmicas, em que as
variveis ambientais podem assumir valores dentro de uma faixa. Por exemplo:
Se Temp est entre 23 e 28C e Elevao est entre 2000 e 2700m
ento txon est presente
6

Ao serem includas no modelo, estas regras recebem valores das faixas associados a cada
varivel ambiental atravs do algoritmo de previso de distribuio de espcies chamado
BIOCLIM (Nix, 1986).
As regras de faixa negadas consistem das regras de faixa em que a precondio da regra
negada. Por exemplo, uma regra de faixa negada teria a seguinte forma:
Se Temp no est entre 23 e 28C e Elevao no est entre 2000 e 2700m
ento txon est presente
As regras logit so uma adaptao dos modelos de regresso logstica para o formato de
regras lgicas. A regresso logstica uma forma de regresso em que o seu resultado
transformado em uma probabilidade. A regresso logstica definida pelas expresses
abaixo.
p =1 / [ 1 +e
-y
]
y =c
0
+c
1
x
1
+c
2
x
2
+... +c
n
x
n
onde p a probabilidade que determina se a regra deve ser aplicada (equivalente
expresso lgica dos outros tipos de regras), y a varivel dependente (presena ou
ausncia da espcie), x
i
a i-sima varivel independente (varivel ambiental), c
i
o
coeficiente que multiplica a i-sima varivel independente e c
0
o termo constante ou de
interceptao.
A funo de probabilidade p tem a forma de uma curva em S como a apresentada na figura
5.

Figura 5. Exemplo de funo de probabilidade na regresso logstica.
Modelo de Nicho Ecolgico no GARP
O algoritmo GARP define o modelo de nicho ecolgico das espcies atravs de um conjunto
de regras como as apresentadas anteriormente.
As regras presentes num modelo de nicho ecolgico so aplicadas hierarquicamente, de
forma que as primeiras regras do modelo se sobrepem s ltimas. Um exemplo possvel de
modelo do GARP seria:
7

Regra 1: Se Temp est entre 5 e 10C e Elevao est entre 1000 e 2000m
ento txon est presente (regra de faixa)
Regra 2: Se Temp de 18C e Elevao 1500m
ento txon est ausente (regra atmica)
Regra 3: Se p = 1 / [ 1 + e
-y
] > 0.75, onde
y = 0.2 + Temp x 0.45 + Elevao x -0.12
ento txon est presente (regra tipo logit)
3.1.5 Codificao das Regras no Algoritmo Gentico
No GARP, cada regra considerada como um indivduo e o conjunto de regras
considerado uma populao segundo a terminologia definida para os algoritmos genticos.
Internamente as regras so codificadas atravs das faixas de valores ou coeficientes
relativos s variveis ambientais e tambm ao valor da previso da regra. As mesmas
regras apresentadas acima seriam codificadas como cromossomos da seguinte forma:
Regra Tipo da
Regra
Temp:
Primeiro
Fator
Temp:
Segundo
Fator
Elevao:
Primeiro
Fator
Elevao:
Segundo
Fator
Presena
ou
Ausncia
Funo de
Adaptao
1 Faixa 5 10 1000 2000 P 50%
2 Atmica 18 25* 1500 3000* A 12%
3 Logit 0.45 0.17* -0.12 0.02* P 95%
Os coeficientes das variveis ambientais (representados nas colunas 3 a 6) correspondem
aos genes que compem os cromossomos. No caso das regras de faixa (e negadas)
existem dois valores que definem a faixa para cada varivel ambiental, e por isso cada
varivel representada por dois genes. A previso das regras (coluna Presena e
Ausncia) tambm codificada como um gene, podendo sofrer alteraes durante a
execuo do algoritmo.
Note que as regras do tipo logit e atmica no utilizam o segundo fator das variveis. Estas
posies (marcadas com um asterisco - *) so ocupadas por valores irrelevantes para estas
regras, mas que so importantes nas operaes de mutao e recombinao.
A qualidade de cada regra presente no modelo avaliada atravs de uma funo de
adaptao (ltima coluna da tabela anterior), que calculado atravs da significncia
estatstica obtida pela aplicao da regra ao conjunto de pontos de treinamento fornecidos
ao algoritmo.
3.1.6 Aplicao dos Operadores Heursticos Sobre as Regras
Durante a execuo do algoritmo as regras so modificadas aleatoriamente atravs de
operadores heursticos de recombinao e mutao.
Por exemplo, uma operao de mutao sobre a regra 1, na posio do segundo gene
(segundo fator da varivel Temp) seria realizada da seguinte forma:
8

Situao Regra Temp:
Primeiro
Fator
Temp:
Segundo
Fator
Elevao:
Primeiro
Fator
Elevao:
Segundo
Fator
Presena
ou
Ausncia
Funo de
Adaptao
Antes: 1 5 10 1000 2000 P 50%
Depois: 4 5 17 1000 2000 P 67%
Note que a mutao criou uma nova regra, que quando aplicada aos pontos de treinamento,
obtm um valor maior na funo de adaptao, devido mudana realizada em um de seus
genes.
J uma operao de recombinao sobre a posio do segundo gene resultaria em:
Situao Regra Temp:
Primeiro
Fator
Temp:
Segundo
Fator
Elevao:
Primeiro
Fator
Elevao:
Segundo
Fator
Presena
ou
Ausncia
Funo de
Adaptao
Antes: 1 5 10 1000 2000 P 50%
2 18 25 1500 3000 A 12%
Depois: 5 5 25 1500 3000 A 5%
6 18 10 1000 2000 P 97%
Note que os novos cromossomos gerados a partir da recombinao e da mutao so
diferentes dos cromossomos originais e por isso apresentam valores de adaptao
diferentes. Estes valores de adaptao resultantes podem ser tanto melhores quanto piores
que os valores dos cromossomos originais.
3.1.7 Seleo Natural no GARP e Incio de uma Nova Iterao
Aps a criao de novos cromossomos e incluso destes na populao existente,
executada uma operao de seleo natural. Nesta operao aqueles cromossomos que
tm valor da funo de adaptao abaixo de um certo limiar pr-definido so eliminados da
populao.
O GARP processa os conjuntos de regras, gerando novos cromossomos, aplicando os
operadores heursticos a eles e em seguida executando a seleo natural, excluindo-se as
regras menos eficientes sucessivamente.
Quando um nmero predeterminado de iteraes atingido, o algoritmo encerrado.
criado como resultado um conjunto de regras a partir dos indivduos sobreviventes. Este
conjunto de regras representa o modelo de nicho ecolgico da espcie.
Este modelo aplicado de volta ao espao geogrfico, indicando as regies onde a espcie
est provavelmente presente ou ausente.
Diferentemente da concepo original dos algoritmos genticos em que a soluo para o
problema representada apenas pelo indivduo mais apto da populao, o GARP considera
toda a populao (conjunto de regras) como soluo para o problema de modelagem.
Mais detalhes do processo utilizado pelo GARP esto disponveis na literatura (Stockwell
1999, Stockwell & Peters 1999).
Testes anteriores mostraram a habilidade do modelo em prever a distribuio de espcies
em vrias regies (Peterson & Cohoon 1999, Peterson et al. 1999, Peterson 2001, Anderson
et al. 2002a, b, Feria & Peterson 2002, Peterson et al. 2002a, Peterson et al. 2002c,
Peterson et al. 2002d, Stockwell & Peterson 2002a, b, Anderson et al. 2003, Peterson et al.
Submitted, Peterson et al. 2003 e Peterson & Vieglas, 2001).
9

Atualmente o CRIA est estudando novas abordagens para uso do GARP, envolvendo
testes e validao dos modelos resultantes e tambm uso em diferentes escalas de
trabalho, e tambm vem estudando a utilizao de outras abordagens de modelagem. Este
estudo ser abordado em outro documento que nortear a continuidade dessa atividade no
CRIA.
A seguir apresentado um detalhamento das atividades realizadas, dos produtos gerados e
das principais dificuldades encontradas nesse perodo.
4 Atividades Realizadas
Vinda do Prof. A. Townsend Peterson
O Dr. Peterson veio ao Brasil participar do desenvolvimento do projeto Sistema de
Informao Distribudo para Colees Biolgicas: A Integrao do Species Analyst e
SinBiota, processo 02/01298-8. Seu trabalho teve como foco o desenvolvimento de
tecnologia e aplicativos de modelagem do nicho ecolgico de espcies. A vinda desse
especialista foi decisiva para o desenvolvimento dos trabalhos e para o envolvimento da
equipe com a temtica.
4.1.1 Atividades Realizadas
4.1.1.1 Curso de Treinamento - Mtodos e Ferramentas para Modelagem Preditiva de
Espcies
O curso, oferecido em parceria com a Embrapa Informtica Agropecuria
(CNPTIA/EMBRAPA), contou com a participao de 35 pesquisadores
2
. Os seguintes
tpicos foram abordados:
Disponibilidade de dados;
Teoria de modelagem; e,
Exemplos prticos e aplicaes.
A preparao prvia dos participantes possibilitou o desenvolvimento de discusses de alto
nvel sobre o tema apresentado. As discusses tiveram como foco a teoria relacionada com
as idias apresentadas, e o potencial para aplicaes do mtodo em diferentes situaes.
Durante o curso foram feitos diversos contatos que possibilitaram o cumprimento da
segunda atividade prevista Estudos de aplicao da modelagem de espcies, em conjunto
com pesquisadores de vrias instituies de pesquisa brasileiras.
4.1.1.2 Visitas Tcnicas
As seguintes visitas tcnicas foram realizadas durante a estadia do Professor Peterson no
Brasil:
Visita USP reunio com J effrey Shaw para discutir pesquisas colaborativas no
campo da Leishmaniose;
Visita a SUCEN para discutir pesquisa colaborativa em questes de sade pblica,
com a Dra. Vera Camargo Neves e o superintendente da SUCEN, Dr. Luiz J acintho
da Silva;

2
Informaes sobre o curso esto disponveis no endereo www.cria.org.br/eventos/mfmpe/
10

Museu de Zoologia, USP apresentao de palestra e discusso a respeito de
pesquisa colaborativa com o Professor Narcio Menezes;
Museu Nacional, RJ apresentao de palestra e discusso a respeito de pesquisa
colaborativa com Paulo Buckup.
Como resultado dessas visitas, tiveram incio vrios dos projetos listados a seguir.
4.1.1.3 Pesquisa Colaborativa
O Professor Peterson trabalhou em vrios projetos durante sua estadia no CRIA. Vrios
destes projetos resultaram em publicaes juntamente com membros da equipe do CRIA.
Maiores detalhes podem ser obtidos no item Publicaes deste relatrio.
4.1.2 Pesquisa GARP
Durante a estadia do Professor Townsend Peterson (U. Kansas), vrias melhorias do
algoritmo foram discutidas e analisadas. Foi implementado um procedimento de filtragem de
modelos que otimiza o tempo de computao do algoritmo nos melhores modelos gerados.
Clculos preliminares sugerem que este processo ir economizar de 50 a 75% do tempo de
computao dos modelos, e cerca de 90% do esforo humano envolvido no processo.
4.1.3 Comentrios
A visita do Professor Townsend Peterson ao Brasil foi muito importante para o
desenvolvimento do projeto de pesquisa em modelagem. O professor Peterson contribuiu
para a disseminao das idias e tecnologias de acesso e integrao de dados de
biodiversidade, e tambm de aplicaes de metodologias de previso de nicho ecolgico de
espcies a casos brasileiros. Iniciou tambm um processo de pesquisa colaborativa,
mostrando a importncia de compartilhar dados e experincias.
Como resultado dos contatos com pesquisadores brasileiros, principalmente do Estado de
So Paulo, foram criadas condies para iniciar o processo de disseminao das
tecnologias envolvidas no projeto e na capacitao da comunidade cientfica local no uso
dessas tecnologias em pesquisa.
Pesquisa em andamento
Modelagem de espcies de distribuio geogrfica restrita baseada em
similaridade ambiental. Marinez Siqueira (CRIA), Giselda Durigan (IF-Assis),
Ricardo S. Pereira (CRIA) e A. Townsend Peterson (U. Kansas)
Modelagem de espcies de plantas arbreas da Bacia do Mdio Paranapanema -
Marinez F. de Siqueira (CRIA), Giselda Durigan (IF-ASSIS), Wilson Aparecido
Contieri (IF-Assis), Ricardo S. Pereira (CRIA) e A. Townsend Peterson (U.
Kansas).
Determinao de reas para estudos de controle biolgico do caro vermelho do
tomate - Rafael Lus Fonseca (CRIA), Ricardo Scachetti Pereira (CRIA), Imeuda
Peixoto Furtado (ESALQ), Dr. Gilberto J os de Moraes (ESALQ).
Modelos de nicho potencial de espcies vegetais dispersas pela megafauna: os
efeitos da perda de dispersores. Rafael Lus Fonseca (CRIA), Dr. Mauro Galetti
(UNESP Rio Claro).
Sensibilidade do GARP a dimensionalidade dos dado: um teste usando anlise
de componentes principais (PCA). Rafael Lus Fonseca (CRIA), Ricardo
11

Scachetti Pereira (CRIA), Rafael Lus Galdini Raimundo (Unicamp) , Dr. Thomas
M. Lewinsohn (Unicamp).
Distribuio geogrfica de duas espcies crpticas de Tomoplagia (Diptera:
Tephritidae): condicionantes em macroescala. Aluana Gonalves de Abreu
(Unicamp), Marcio Uehara-Prado(Unicamp) e Rafael Lus Fonseca (CRIA).
Modelagem de distribuio geogrfica com espcies de Apocynaceae deteco
de centros de diversidade no Brasil. Ingrid Koch (CRIA).
Biogeografia das espcies neotropicais de Rauvolfia L. (Apocynaceae). Ingrid
Koch (CRIA).
Redes Neurais Artificiais. As RNAs so amplamente utilizadas para a
classificao supervisionada no reconhecimento de padres. Para testar se um
ponto (uma condio) ambiental pertence classe que define o nicho ecolgico
de uma dada espcie o ponto ser utilizado como entrada da RNA e sua sada
indicar a pertinncia ou no ao nicho. Mauro Munhoz (CRIA).
Aquisio de novos software e de capacidade de armazenamento
de dados
4.1.4 ArcView Concurrent Master Lab Kit Pak 8.2
Este pacote conta com 25 licenas, dessas, 8 esto em uso sendo 7 em PCs e uma em
notebook.
4.1.5 Armazenamento de dados
Hoje a modelagem conta com um espao em um servidor PowerEdge 6600 com Linux
RedHat instalado. Esse servidor contem quatro discos com capacidade de 36Gb cada um. A
utilizao da rea modelagem hoje de 19 Gb aproximadamente.
Estudo e Anlise dos Dados de Biodiversidade
4.1.6 Dados biolgicos
Os dados referentes a registros de ocorrncia de espcies so compostos, basicamente,
pelo nome da espcie, as coordenadas (latitude e longitude) onde a espcie foi encontrada,
a preciso destas coordenadas (desejvel) e a data da coleta/observao. Associadas a
estas informaes ainda pode-se ter informaes referentes preciso e grau de
confiabilidade dos dados.
Estes dados so geralmente extrados dos acervos de colees biolgicas (herbrios,
museus, etc) e de observaes realizadas por especialistas (como no programa Biota). Aqui
se v a importncia de projetos como o speciesLink que engendram toda a complexidade
inerente obteno destes dados, permitindo que com apenas uma consulta a um portal
web sejam obtidos dados resultantes dos esforos distribudos por vrias colees tanto do
Brasil como do mundo.
Hoje o CRIA conta com um conjunto de dados bastante razovel sobre registros de
ocorrncia de espcies nativas. A maior parte desses dados composto por dados
qualitativos, ou seja, dados sobre a presena da espcie em um determinado ponto no
espao. Com base nesses dados possvel produzir informao sobre como essas
espcies esto distribudas localmente, regionalmente ou ainda continentalmente. Alm
disso, pretende-se utilizar modelagem para responder outras perguntas como: quais fatores
12

ambientais so responsveis pela distribuio geogrfica das espcies? possvel utilizar
modelagem para buscar espcies no campo? possvel utilizar modelagem para auxiliar a
tomada de deciso para conservao de espcies? possvel utilizar modelagem para
auxiliar a tomada de deciso quanto ao potencial de invaso de espcies exticas?
Temos hoje no CRIA (tabela1) os seguintes dados georeferenciados disponveis para se
trabalhar com modelagem.
4.1.6.1 Tabela 1: Dados de biodiversidade disponveis no CRIA:
Dados N
o
de
espcies
distintas
N
o
de registros
nicos de
espcies e
coordenadas
Fonte Disponibilidade de uso
SinBiota 5928 24127 Sistema de Informao
Ambiental - BIOTA/FAPESP
Dados disponveis na
Internet.
Bacia do Mdio
Paranapanema
478 4023 Estao Ecolgica de Assis
IF/SP
Dados disponveis mediante
a realizao de parceria com
a EEAssis/IF-SP
Cerrado de So
Paulo
552 8745 Projeto Viabilidade de
Conservao dos
remanescentes de Cerrado
do Estado de So Paulo
Programa Biota Fapesp
Dados disponveis no
SinBiota ou atravs de
parceria com EEAssis e o
CRIA.
Colees Biolgicas Projeto SpeciesLink CRIA
AcariDZSJRP 232 379 Coleo de caros do
Departamento de Zoologia e
Botnica - IBILCE/UNESP.
Dados disponveis na
Internet.
AcariESALQ 1036 206 Coleo de caros do
Departamento de
Entomologia, Fitopatologia e
Zoologia - LEF/ESALQ.
Dados disponveis na
Internet.
DZSJRP 470 1690 Coleo de Peixes do
Departamento de Zoologia e
Botnica - IBILCE/UNESP
Dados disponveis na
Internet.
LIRP 653 2146 Coleo de Peixes do
Laboratrio de Ictiologia de
Ribeiro Preto -
FFCLRP/USP
Dados disponveis na
Internet.
SPF 1769 524 Herbrio do Departamento de
Botnica - IB/USP
Dados disponveis na
Internet.
UEC 1428 379 Herbrio da Universidade
Estadual de Campinas -
IB/UNICAMP
Dados disponveis na
Internet.
Total --- 42219 Centro de Referncia em
Informao Ambiental
Parcialmente disponvel na
Internet.
Os dados acima relacionados disponveis na Internet foram coletados a partir do sistema
speciesLink
3
na data de 10/06/2003. Para os dados de colees biolgicas e para o
SinBiota, o termo registro de espcie significa registros cujo valor do campo espcie no
nulo", ou seja, esto sendo tambm considerados como registros identificados at gnero
(registros com "sp" e demais variantes).

3
http://splink.cria.org.br
13

4.1.7 Qualidade dos dados biolgicos
Os maiores problemas com os dados de biodiversidade para a modelagem referem-se
atualizao da nomenclatura e qualidade do seu georeferenciamento. Como vimos na
tabela anterior, grande parte dos dados disponveis hoje so dados de colees biolgicas.
Esses dados compem um vasto conjunto de informao, provendo no s informao atual
sobre essas espcies, mas tambm informao histrica sobre vrios sculos passados
(Chapman & Busby 1994). Porm, muitos destes dados tm pouca informao geogrfica
associada, muitas vezes no passando de uma descrio genrica da localidade onde
foram coletados (Chapman & Milne 1998), ou seja, o georeferenciamento nesses casos no
muito acurado, especialmente em se tratando de dados histricos (Chapman 1999). Para
tentar minimizar este tipo de problema, existem atualmente alguns recursos, como o caso
do uso de Gazetteers (lista de localidades associada a informaes geogrficas, como
latitude e longitude). Atualmente, existem vrios gazetteers disponveis na WEB. Quando
provindos de Instituies fidedignas, estas listas com coordenadas geogrficas so
extremamente teis para georeferenciar espcimens coletados em uma poca em que
aparelhos de GPS no eram disponveis. importante, portanto, desenvolver sistemas de
georeferenciamento automtico e de checagem da nomenclatura para auxiliar as colees
em seu processo de validao a atualizao dos dados de seus acervos. Neste contexto, foi
desenvolvido um projeto denominado BioGeoMancer: Georeferenciamento e validao
automtica para colees biolgicas, que est em processo de avaliao na Fapesp
(processo nmero 02/08379-4).
4.1.8 Dados Ambientais
No contexto da modelagem de distribuio de espcies, os dados ambientais dizem respeito
s informaes acerca do clima (temperatura, precipitao, vento, incidncia de geadas etc)
e do meio fsico (topografia, aspecto, solo, geologia, uso da terra, cobertura vegetal etc) da
regio de estudo. A obteno destes dados feita atravs de cartografia, imagens de
satlite, de fotos areas ou das leituras de estaes de dados. Os dados brutos so
refinados atravs de tcnicas de interpolao (no caso de estaes) ou
classificao/agrupamento (no caso de imagens). Como resultado desse refinamento so
gerados mapas ambientais que so armazenados em forma de grid e que serviro de
entrada para os algoritmos responsveis por gerar os modelos. Temos hoje (tabela 2) os
seguintes dados ambientais disponveis.
4.1.8.1 Tabela 2: Dados ambientais disponveis no CRIA
Dados Metadados Fonte
Bacia do Mdio
Paranapanema solos,
geologia, uso do solo,
declividade, temperatura
(mnimas, mdias e mximas
mensais), precipitao (mdias
mensais), geada, risco e
adequao de uso de solo.
Horizontal coordinate system
Projected coordinate system name:
WGS_1984_UTM_Zone_22S
Geographic coordinate system name:
GCS_Corrego_Alegre
O mapa bsico que gerou o mapa
de solos foi extrado de trabalhos em
escalas 1:100.000, do IAC,
Quadriculas de Assis, Maraca,
Marilia e mapas municipais de
1:50.000 de vrios municpios. Alm
disto, tambm foi usada a base do
Radam, no publicada, e algumas
amarraes de campo.
SinBiota (cobertura vegetal,
UCs, municpios etc)
Horizontal coordinate system
Projected coordinate system name:
World_polyconic
Geographic coordinate system name:
SAD69
Programa Biota/FAPESP Instituto
Florestal
World Data (clima e topografia) Geographic coordinate system name:
GCS_WGS_1984
Universidade de Kansas
14

Os demais dados ambientais disponveis no CRIA (Flora Neotropica; Bacia do Piracicaba;
IPCC entre outros) ainda sero analisados do ponto de vista de metadados e fonte.
4.1.9 Qualidade dos dados ambientais
A utilizao de dados ambientais seria simples se houvesse um padro de armazenamento
e de projeo utilizadas. Como formatos de armazenamento pode-se citar: Arc/Info, ERDAS,
GEO-TIFF, DEM, Raster, etc. O problema da padronizao da projeo um pouco mais
complexo, pois dependendo da extenso, do formato e da localizao da rea que se deseja
representar, diferentes projees so mais indicadas. O intuito dessa parte do relatrio
mostrar o cuidado que se deve ter quando se trabalha com coordenadas geogrficas
(latitude e longitude) de pontos. Para isso sero abordados alguns conceitos de Cartografia
(Anexo 1) que sero simplificados para que seja facilitada a compreenso em seu sentido
mais amplo. Parte da equipe do CRIA est fazendo um curso em geoprocessamento para
poder auxiliar a equipe de informao nessa rea.
So necessrios alguns cuidados para se trabalhar com a transformao de sistemas de
coordenadas utilizadas pelos usurios. O uso de diferentes procedimentos de transformao
gera diferenas nos valores das coordenadas transformadas. As conseqncias dessas
diferenas so percebidas em problemas de fuso de dados de mltiplas fontes. Duas
bases de dados podem estar sob o mesmo sistema de referncia, mas terem sido
transformadas de outros sistemas utilizando diferentes procedimentos. Isso pode fazer com
que a mesma representao de uma feio seja transformada em duas representaes
diferentes (i.e., com diferena nas coordenadas dos seus pontos). Para se evitar este tipo de
problema, cada base de dados deve ter a devida documentao tcnica dos dados e dos
processamentos aplicados a eles.
4.1.10 Converso de dados
Os dados ambientais comumente so armazenados em arquivos do tipo grid. Porm cada
aplicativo proprietrio tende a utilizar um formato prprio para os arquivos grid que geram.
Este foi o caso para os dados climticos da bacia do mdio Paranapanema cujos dados
originais esto no formato Idrisi. Para permitir sua utilizao e cruzamento com outros dados
j utilizados pela equipe fez-se necessria criao de um filtro conversor do formato Idrisi
para o ArcInfo ASCII-Grid. O formato destino foi escolhido devido familiaridade da equipe
com o software ArcView que utiliza este formato e que no consegue ler o formato Idrisi.
O programa responsvel pela converso entre os dois formatos foi desenvolvido pela equipe
do CRIA em linguagem C++ atravs da implementao de uma classe capaz de ler o
formato Idrisi para a memria, fornecer uma interface para a manipulao destes dados e
ainda grav-los em um arquivo no formato ArcInfo ASCII-Grid. Desta forma pode-se realizar
a converso entre os formatos e ainda permitir a leitura e utilizao do formato Idrisi por
programas futuros.
4.1.11 Interpolao de dados
Devido dificuldade que o CRIA vem encontrando para localizar e adquirir bases ambientais
para o Brasil e mesmo para o estado de So Paulo foi desenvolvido um estudo para gerar
mapas baseados em dados brutos, que no caso de dados climticos, so mais fceis de
conseguir.
Esta seo dedicada exposio desse estudo sobre o processo de interpolao dos
dados de estaes climticas para a obteno de mapas ambientais, desde a entrada dos
dados brutos gerados pelas estaes, passando pela interpolao em si e finalizando com a
gravao dos arquivos contendo os mapas ambientais.
15

Para o estudo foram utilizados os dados do Arquivos de Srie Pluviometria Histrica
disponibilizados pela Rede Nacional de Agrometeorologia
4
. Os arquivos esto no modo
texto e contm os valores dirios de precipitao para uma estao pluviomtrica, alm de
seu nome e de sua localizao (latitude, longitude e altitude).
O processo de interpolao foi realizado com a ajuda do programa Grass (Geographic
Resources Analysis Support System)
5
. Este programa foi escolhido por ser um dos GIS
open source mais utilizado. Este programa permite que se entre com uma lista de estaes
com suas coordenadas e sua medio, e se obtenha um mapa (grid) que representa a
superfcie resultante da interpolao das medies.
Tendo os dados brutos das estaes e definido o programa de interpolao, foi necessrio
criar um outro programa capaz de ler os dados brutos e gerar as listas de estaes no
formato aceito pelo Grass.
Foram gerados mapas contendo informaes sobre as mdias do total de precipitao no
perodo chuvoso (dezembro, janeiro e fevereiro) e no perodo de seca (junho, julho e agosto)
para o estado de So Paulo no perodo de 1952 a 1995. Estes mapas foram visualmente
comparados com os fornecidos pela RNA e pareceram satisfatrios, porem ainda sem testes
devidamente conduzidos para que possam ser utilizados como fonte de informao
ambiental para modelagem. Porem, muitas dificuldades foram encontradas para a gerao
de mapas ambientais a partir das medies de estaes climticas, ento, aconselha-se que
a gerao de mapas ambientais seja realizada por agncias especializadas no assunto, ou
em parceria com elas atravs da proposta de um projeto exclusivo para a gerao de mapas
ambientais ou ainda atravs da compra de bases prontas para o uso, em formato digital.
5 Produtos
Aplicaes do GARP no Brasil
O GARP vem sendo utilizado para estabelecer previses sobre a distribuio geogrfica de
espcies para condies tropicais. A seguir apresentamos alguns exemplos, a ttulo
ilustrativo, do que vem sendo desenvolvido no Brasil.
5.1.1 Uso do GARP para prever a distribuio geogrfica de espcies
Ainda precrio o nvel de conhecimento sobre a distribuio geogrfica de plantas
tropicais. A maioria das espcies representada por poucos pontos de amostragem e
muitas vezes, esses pontos so georeferenciados de maneira muito imprecisa.
Como um primeiro teste para se avaliar a eficcia do GARP em prever a distribuio
geogrfica de espcies tropicas (figura 6), foi selecionado um conjunto de dados,
provenientes do Projeto de Cooperao Tcnica Conservao e Manejo da Biodiversidade
do Bioma Cerrado EMBRAPA Cerrados UnB Ibama/DFID e RBGE/Reino Unido para
gerar os modelos (Koch et. al. Submitted). Foi escolhido este conjunto de dados por se tratar
de uma base de dados bastante completa e precisa referente s espcies arbreas de
cerrado (Ratter et. al. 2001).
Este conjunto foi dividido em dois subconjuntos de dados independentes, um utilizado para
construir os modelos e predizer a distribuio geogrfica das espcies (dados de
treinamento) e outro utilizado para testar a previso de distribuio (dados de teste).

4
http://masrv54.agricultura.gov.br/rna
5
http://grass.itc.it/
16

Posteriormente, devem-se empregar anlises estatsticas para validar se o resultado obtido
significativo estatisticamente.
Com base em anlises deste tipo possvel avaliarmos se a modelagem de nicho ecolgico
uma ferramenta robusta para auxiliar no entendimento da distribuio geogrfica de
espcies de plantas tropicais. A figura 6 mostra um exemplo de resultado do uso de GARP
para prever a distribuio geogrfica de espcies arbreas de cerrado.

Figura 6. Distribuio prevista para Terminalia argentea.
Os crculos azuis representam os pontos usados na confeco do modelo (dados de
treinamento), os tringulos amarelos so os pontos usados para testar o modelo (dados de
teste) e os quadrados verdes so registros dessa espcie provenientes de outros conjuntos
de dados (New York Botanical Garden, Biota/Fapesp e Missouri Botanical Garden).
5.1.2 Uso do GARP para prever algumas conseqncias de alteraes
climticas futuras na distribuio geogrfica de espcies.
A figura 7 mostra as conseqncias de alteraes climticas para trs espcies arbreas de
cerrado baseado em dois cenrios futuros de alterao climtica (Siqueira & Peterson,
Submitted). Em vermelho temos a rea prevista de distribuio da espcie no presente, em
azul temos a rea habitvel em 2055 baseado no cenrio HHGSDX50 (cenrio mais
otimista) e em rosa temos a rea habitvel em 2055 baseado no cenrio HHGGAX50
(cenrio mais pessimista).
17


A B
Figura 7. Exemplo de previso de distribuio atual (1961-1990) em vermelho escuro e
futura (2055) em azul para o cenrio HHGSDX50 e em rosa para o cenrio HHGGAX50,
para espcies arbreas de cerrado: A - Rudgea viburnoides (Cham.) Benth. (Rubiaceae) e B
- Qualea parviflora Mart. (Vochysiaceae).
Os modelos de circulao usados foram provenientes do HadCM2 (Carson, 1999). Foi
utilizado um cenrio mais otimista e outro mais pessimista em relao ao modo como o
clima poderia se alterar nos prximos 50 anos usando cenrios Hadley HHGSDX50 e
HHGGAX50 respectivamente. O cenrio HHGSDX50 baseia-se em um aumento de
0,5%/ano de CO2 e o cenrio HHGGAX50 baseia-se em um aumento de 1%/ano de CO2 na
atmosfera, prevendo um aquecimento global e reduo de precipitao em vrias regies.
Como um exemplo sobre o que representam essas alteraes climticas futuras foi feito um
clculo para o Mxico, cuja concluso foi que essas alteraes ocasionariam um aumento
de 1,6 a 2,5
o
C na temperatura mdia e uma diminuio de 70 a 130 mm na precipitao
mdia (Peterson et. al., 2002b).
Como resultado podemos observar uma reduo de rea na distribuio geogrfica, que
varia de intensidade dependendo da espcie, para algumas espcies arbreas de cerrado.
5.1.3 Uso do GARP para predizer o potencial de invaso de espcies
exticas.
A possibilidade de invaso de espcies exticas em outras regies uma questo de
relevncia conservacionista e econmica. possvel utilizar o GARP para se tentar prever o
comportamento de uma espcie potencialmente invasora do seguinte modo. Modela-se o
nicho ecolgico de uma espcie na sua rea de distribuio geogrfica nativa e
posteriormente projetar essa modelagem, atravs da projeo do nicho potencial de
ocupao dessa espcie, em outras reas de interesse.
O exemplo a seguir (Peterson et. al. 2003) ilustra o caso da possibilidade de invaso da
Amrica do Sul por Homalodisca coagulata (inseto vetor de transmisso da bactria Xylella
fastidiosa) dado o potencial de seu impacto como um vetor para agentes fitopatolgicos.
Foram desenvolvidos modelos de nicho ecolgico para a espcie na sua rea de
distribuio geogrfica nativa, no sudeste dos Estados Unidos.
A capacidade de previso dos modelos foi testada tanto na rea de distribuio nativa
quanto em projees no estado da Califrnia, onde a espcie tem estado presente por muito
tempo como uma espcie invasora. Em ambos os casos, os testes indicaram alta
significncia estatstica para as previses. Projees dos mesmos modelos para a Amrica
do Sul indicaram poucas chances de invaso ao sudeste do Brasil, local em que doenas
em culturas de ctricos so preocupantes. Entretanto, todos os modelos so concordantes
18

ao prever alto risco de estabelecimento da espcie na regio onde se encontram as
vincolas do norte da Argentina e no extremo sul do Brasil.

A
B
Figura 8. Previso de invaso de Homoladisca coagulata na Amrica do Sul. A previso
de distribuio nativa da espcie. B projeo do nicho ecolgico potencial de ocupao da
espcie na Amrica do Sul (modificado de Peterson et. al. 2003).
Publicaes
Modelagem GARP da distribuio nativa e extica da planta invasora Chromolaena
odorata (Asteraceae). Rafael L. G. Raimundo (Unicamp), Rafael L. Fonseca (CRIA),
Ricardo S. Pereira (CRIA), A. T. Peterson (U. Kansas), Thomas M. Lewinsohn
(Unicamp). Submetido para "J ournal of Aplied Ecology".
Predicting the potential of invasion of two Crotalaria species (Fabaceae) in
Conservation Units in Brazil. Rafael Lus Fonseca (CRIA), Paulo Guimares J r.
(Unicamp), Srgio R. Morbiolo (Herbrio Unicamp), Ricardo Scachetti Pereira
(CRIA), Townsend Peterson (KUNHM-BRC). Manuscrito finalizado.
Modelagem do potencial invasivo de Lantana camara l. (Verbenaceae) em
ecorregies e unidades de conservao tropicais. Srgio R. Morbiolo (Herbrio
Unicamp) e Rafael Lus Fonseca (CRIA). Submetido para "Biota Neotropica".
Characterizing geographic distributions of tropical woody plant species via ecological
niche modeling. Ingrid Koch (Unicamp), Marinez Ferreira de Siqueira (CRIA), A. T.
Peterson (U. Kansas). Status da publicao: Submetido para " Global Ecology and
Biogeography" .
Global Climate Change Consequences for Cerrado Tree Species Distribution.
Marinez Ferreira de Siqueira (CRIA) & A. T. Peterson (U. Kansas). Submetido para
"Biota Neotropica".
Avaliao do potencial de invaso de Homalodisca coagulata na Califrnia e no
Brasil. A. T. Peterson (U. Kansas), Ricardo Scachetti Pereira (CRIA), Daniel A. Kluza
(U. Kansas). Biota Neotrpica 3(1):
http://www.biotaneotropica.org.br/v3n1/pt/abstract?article+BN00703012003
Detectando problemas de identificao em conjuntos de dados sobre biodiversidade
baseado em modelagem de nichos ecolgicos. A. T. Peterson (U. Kansas), Ingrid
Koch (Unicamp), Ricardo Scachetti Pereira (CRIA), Adolfo G. Navarro-Sigenza
(UNAM, Mexico). Submetido para Diversity and Distributions.
Detection of errors in biodiversity data: Collectors itineraries flag mislabeled
specimens. A. T. Peterson (U. Kansas), Adolfo G. Navarro-Sigenza (UNAM,
19

Mxico), Ricardo Scachetti Pereira (CRIA, Brasil). No prelo. Bulletin of the British
Ornithologists Club.
Distribuio de vetores da Leishmaniose cutnea em So Paulo. Vera Camargo
Neves (SUCEN), A. Townsend Peterson (U. Kansas), Ricardo Scachetti Pereira
(CRIA). Submetido para Sociedade Brasileira de Medicina Tropical.
Distribuio da capivara na bacia do Rio Piracicaba no Estado de So Paulo. Ktia
Ferraz (ESALQ, Piracicaba), Ricardo Scachetti Pereira (CRIA), A. T. Peterson (U.
Kansas). Aceito para publicao nos anais do IALE2003 (Simpsio sobre landscape
ecology).
Palestras apresentadas
Workshop Modelagem de Biodiversidade
Local: Belm Data: 10-12 de Fevereiro de 2003
GEOMA - Rede Temtica de Pesquisa em Modelagem Ambiental da Amaznia - MCT
Participantes do CRIA: Ricardo Scachetti Pereira e Marinez Ferreira de Siqueira
Apresentao da palestra: Algoritmos genticos - GARP
A Informtica como Ferramenta para Conservao da Biodiversidade.
II Semana da Biologia UFSCar - 24 a 29 de maro de 2003
Universidade Federal de So Carlos So Carlos SP
Apresentao: Rafael Lus Fonseca
Modelagem Preditiva de Distribuio de Espcies
I Curso de Introduo ao Sistema de Informao do Programa Biota/Fapesp (SinBiota)
13 e 14 de fevereiro de 2003 - Instituto de Biologia Unicamp
Apresentao: Rafael Lus Fonseca
Modelagem do potencial invasivo de Lantana camara L. (Verbenaceae)
Apresentao oral no III Segundo Simpsio do Programa Biota/Fapesp
26 a 28 de novembro de 2002 Universidade Federal de So Carlos SP
Apresentao: Rafael Lus Fonseca e Srgio Rodrigues Morbiolo
Modelagem Preditiva de Distribuio Geogrfica de Espcies
Participao em Aula de Biogeografia Prof. Dr. Thomas Michael Lewinsohn
Curso de Geografia
06 de novembro de 2002 Instituo de Biologia Unicamp
Apresentao: Rafael Lus Fonseca
Modelagem Preditiva de Distribuio Geogrfica de Espcies
Participao em Aula de Ecologia Bsica - Prof. Dr. Paulo Sergio oliveira
Curso de Cincias Biolgicas
18 de outubro de 2002 Instituo de Biologia Unicamp
Apresentao: Rafael Lus Fonseca
20

Capacitao da Equipe
5.1.4 Curso de Geoprocessamento
Curso de Geoprocessamento 2003 modalidade Extenso Universitria, oferecido pelo
Instituto de Computao da Unicamp.
Participantes: Alexandre Marino, Fabrcio Pavarin e Rafael Fonseca.
O curso oferecido de janeiro a dezembro de 2003, nas instalaes do Instituto de
Computao da Unicamp. O programa do curso composto por 16 disciplinas totalizando
360 horas. Maiores detalhes so apresentados no anexo 2.
5.1.5 Curso de Doutorado em Cincias da Engenharia Ambiental
Marinez Ferreira de Siqueira, Departamento de Hidrulica e Saneamento. PPG Cincias
da Engenharia Ambiental. Escola de Engenharia de So Carlos Universidade de So
Paulo.
Ttulo: Uso de modelagem de nicho ecolgico na avaliao do padro de distribuio
geogrfica de espcies arbreas.
Neste trabalho pretende-se utilizar modelagem para conhecer a distribuio observada e
esperada para um conjunto de espcies (aquelas registradas em 30 ou mais localidades
diferentes) arbreas para o Cerrado e para a Floresta Estacional Semidecidual ocorrentes
no estado de So Paulo. Para algumas espcies, a serem escolhidas de acordo com alguns
critrios pr-estabelecidos, pretende-se fazer a modelagem de nicho ecolgico para
conhecer as reas onde essas espcies potencialmente poderiam ocorrer e verificar a
possibilidade desse tipo de abordagem auxiliar o trabalho de busca dessas espcies no
campo, para uma rea de estudo previamente definida. Para alguns casos podem tambm
ser aplicados modelos de alterao climtica para observar qual seria a tendncia de
resposta da vegetao, ou da espcie analisada, mediante alguns cenrios futuros de
mudanas climticas.
5.1.6 Bolsista de ps-doutoramento - Fapesp
Dra Ingrid Koch
Parte deste projeto relacionado modelagem de nicho ecolgico para previso da
distribuio de espcies a partir de colees de herbrio. Com a finalidade de se capacitar
para este trabalho, a bolsista realizou um curso para o uso do programa GARP com o Dr. A.
Townsend Peterson e interagiu com o pesquisador nos meses de junho e julho de 2002.
Tem trabalhado com a equipe do CRIA, realizando experimentos desde ento. Como a
pesquisadora taxonomista e tem trabalhado com a famlia Apocynaceae, os experimentos
tm sido realizados com espcies desta famlia. Atualmente, tem tido contato com outros
programas SIG, como o FloraMap e o Diva por intermdio do Dr. Arthur Chapman,
pesquisador visitante vinculado ao CRIA.
6 Principais Dificuldades Encontradas
Problemas com o georeferenciamento dos pontos de coletas. Quando comeamos a
utilizar bases de dados georeferenciadas, foi muito comum nos depararmos com
problemas do tipo: pontos que caem no mar (em caso de espcies terrestres) ou fora
da mscara, ou seja, fora da rea de estudo. No geral esses erros so devidos a
inconsistncias nas coordenadas geogrficas (erros ou diferenas no datum). Pode
tambm haver erro na mscara utilizada. Por exemplo, no caso das pequenas ilhas
21

da Amrica Central, a mscara utilizada no inclua determinadas ilhas devido falta
de informaes ambientais para essas ilhas.
Converso de dados: geralmente cada aplicativo proprietrio tende a utilizar um
formato prprio para os arquivos grid que geram. Quando isso ocorre, a utilizao
desses dados por outro aplicativo fica bastante complicada. Para resolver este
problema no CRIA foi necessria a criao de um filtro conversor de formatos (Idrisi
para o ArcInfo ASCII-Grid). O programa responsvel pela converso entre os dois
formatos foi implementado em linguagem C++.
Criao de novos conjuntos de dados (datasets): quando se utilizou o Garp para
modelar espcies distribudas em ilhas da Amrica Central, surgiram problemas
relacionados definio das informaes climticas (0,5.). O programa considera
apenas um ponto em cada GRID e, como as ilhas so relativamente pequenas, os
pontos de coleta so muito prximos, poucos pontos foram considerados na anlise.
Alm disso, muitas vezes as reas costeiras no possuem informaes ambientais
vinculadas a elas, bem como muitas das ilhas menores. A soluo encontrada foi
buscar dados climticos com uma melhor definio e criar novos datasets. Quando
criados os novos datasets, foi possvel notar que, em algumas situaes, havia um
deslocamento do GRID em relao ao GRID original, e por isso, os pontos
apareciam fora da mscara. Foi necessrio corrigir as coordenadas nos arquivos
ASCII originais e refazer os datasets para fazer nova modelagem. Este problema de
deslocamento dos GRIDS est relacionado ao Script que corta os datasets e ocorre
quando se re-amostra o tamanho das clulas.
Uso do SIG: a troca de verso do ArcView vem acarretando vrios problemas para
as pessoas que trabalham com modelagem no CRIA. A verso 8.2 lanada no
mercado vem apresentando problemas bugs que desconhecamos na verso 3.2.
Isso tm acarretado atrasos no desenvolvimento dos projetos em andamento. Estes
problemas esto sendo avaliados por usurios do software e pelo departamento de
suporte do CRIA. A GEMPI - Gesto Empresarial & Informtica Ltda (representante
do software no Brasil) est sendo informada e consultada para ajudar na soluo do
problema.
Aquisio de novos dados ambientais: estamos encontrando bastante dificuldade na
localizao e aquisio de bases ambientais, em formato digital, em escalas mais
adequadas (maior detalhe) para o Brasil e para o estado de So Paulo.
Interpolao de dados: as seguintes dificuldades foram encontradas para a gerao
de mapas ambientais a partir das medies de estaes climticas.
H grande dificuldade de se obter as medies histricas das estaes. Como
exemplo, a prpria RNA (Rede Nacional de Agrometeorologia) s fornece sries
histricas de precipitao, alm de haver vrios arquivos corrompidos, como a
maioria das estaes do Amazonas e todas as do Acre.
Os dados das estaes precisam ser corrigidos. Isto porque h um elevado
nmero de inconsistncias, tais como duas estaes na mesma localidade,
localidades dadas apenas com graus e no graus, minutos e segundos, o que
leva a uma grande incerteza na hora de realizar a interpolao.
Deficincia de dados do entorno. Para gerar um bom mapa ambiental de uma
certa regio necessrio utilizar medies em pontos que estejam prximos
fronteira, mas fora da regio. Portanto, se quisermos um mapa ambiental do
Brasil, temos que utilizar estaes em outros pases.
A realizao de todo o processo dispende bastante esforo e tempo. Isto porque
a adequao dos dados das estaes para o formato a ser utilizado pelo
22

interpolador dispendioso e dificilmente pode ser reaproveitado para outros tipos
de estao, pois no parece haver um formato padro.
Impossibilidade de adquirir novos pontos que possam melhorar o mapa. Para se
obter mapas com qualidade deve-se fazer uma anlise criteriosa das
distribuies das estaes. Por exemplo, regies onde h maior variao devem
ser cobertas por mais estaes. No entanto, a deciso de adicionar estaes no
de competncia do Cria.
7 Concluses, Recomendaes e Diretrizes Futuras
Para dar continuidade linha de pesquisa em modelagem recomenda-se realizar as
seguintes atividades.
1. Continuar fomentando o desenvolvimento de parcerias para que no s tenhamos
acesso a mais e melhores dados biolgicos, mas tambm para que tenhamos mais
respaldo cientfico quanto anlise biogeogrfica, para diferentes grupos
taxonmicos, dos resultados gerados.
2. Estudo de ferramentas para verificar a qualidade e melhorar a confiabilidade de
dados biolgicos, como por exemplo, o uso de Gazetteers.
3. Desenvolvimento do algoritmo GARP em forma de biblioteca implementada na
linguagem C++.
4. Desenvolvimento de outros tipos de modelagem: alm do uso do GARP
recomendvel que o CRIA conhea, teste e avalie outros tipos de modelagem
disponveis hoje para que possamos ampliar e melhorar nossa rea de atuao
nesse ramo.
5. Desenvolvimento de um ambiente para o desenvolvimento de algoritmos para a
modelagem da distribuio de espcies. O ambiente de experimentao proposto
permitir o desenvolvimento, teste e validao de algoritmos utilizados para a
previso da distribuio de espcies e tambm a gerao dos modelos de
distribuio. Uma conseqncia da utilizao deste ambiente para o
desenvolvimento de algoritmos de modelagem a modularizao do algoritmo
atravs de uma interface padro. Esta caracterstica permite a fcil transposio do
algoritmo para outros sistemas, permitindo a fcil reproduo do processo de
modelagem por parte de vrios grupos de pesquisa.
6. Em relao qualidade de dados ambientais, necessrio ateno ao procedimento
de transformao de coordenadas pelos usurios. O uso de diferentes
procedimentos de transformao gera diferenas nos valores das coordenadas
transformadas. As conseqncias dessas diferenas so percebidas em problemas
de fuso de dados de mltiplas fontes, por exemplo.
7. aconselhada a aquisio de bases ambientais em escalas mais detalhadas, em
formato digital, para uso em projetos de modelagem cuja abordagem seja de teste de
eficcia do modelo no campo e validao estatstica do modelo. Atualmente estamos
em processo de compra do Mapa Pedolgico do Estado de So Paulo (escala
1:500000) - IAC, formato digital (ArcView), georeferenciado em coordenadas
geogrficas. Contm os limites (poligonizados) das unidades de mapeamento de
solo, com os respectivos identificadores e hidrografia.
8. Ainda sobre bases ambientais, necessrio incluir a devida documentao tcnica
dos dados e dos processamentos aplicados a eles. Duas bases de dados podem
estar sob o mesmo sistema de referncia, mas terem sido transformadas de outros
sistemas utilizando diferentes procedimentos. Isso pode fazer com que uma mesma
23

representao de uma feio seja transformada em duas representaes diferentes
(i.e., com diferena nas coordenadas dos seus pontos).
9. Em relao aos dados ambientais, referente ao tpico interpolao de dados,
aconselha-se que a gerao de mapas ambientais seja realizada por agncias
especializadas no assunto, ou em parceria com elas atravs da proposta de um
projeto exclusivo para a gerao de mapas ambientais ou ainda atravs da compra
de bases prontas para o uso, em formato digital.
10. Implementar estudo para a possibilidade de desenvolvimento de novas bases
ambientais, ou adequao das que j existem, s necessidades do CRIA.
11. Estudo e implementao de tcnicas para validao de modelos.
8 Bibliografia
Anderson, R. P., D. Lew, & A. T. Peterson. 2003. Evaluating predictive models of species
distributions: criteria for selecting optimal models. Ecological Modelling 162:211-232.
Anderson, R. P., M. Laverde, & A. T. Peterson. 2002a. Geographical distributions of spiny
pocket mice in South America: Insights from predictive models. Global Ecology and
Biogeography 11:131-141.
Anderson, R. P., M. Laverde, & A. T. Peterson. 2002b. Using niche-based GIS modeling to
test geographic predictions of competitive exclusion and competitive release in South
American pocket mice. Oikos 93:3-16.
Carson, D. J . 1999. Climate modelling: Achievements and prospects. Quarterly J ournal of
the Royal Meteorological Society 125:1-27.
Chapman, A.D. 1999. Quality Control and Validation of Point-Sourced Environmental
Resource Data pp. 409-418 in Lowell, K. and J aton, A. (eds). Spatial Accuracy
Assessment: Land Information Uncertainty in Natural Resources. Chelsea, MI: Ann.
Arbor Press.
Chapman, A.D. and Busby, J .R. 1994. Linking Species Information to Climate Modeling for
Continental Biodiversity Inventory and Monitoring pp. 177-195 in Miller, R.I. (ed).
Mapping the Diversity of Nature. London: Chapman and Hall.
Chapman, A.D. and Milne, D.J . 1998. The Impact of Global Warming on the Distribution of
Selected Australian Plant and Animal Species in relation to Soils and Vegetation.
Canberra: Environment Australia.
Darwin, C. R. 1859. On the Origin of Species by Means of Natural Selection. J ohn Murray,
London.
Davis, L. 1996. Handbook of Genetic Algorithms. International . Thomson Computer Press,
Boston, Massachusetts, 1996.
Feria, T. P., & A. T. Peterson. 2002. Using point occurrence data and inferential algorithms to
predict local communities of birds. Diversity and Distributions 8:49-56.
Fogel, L. J ., Owens, A. J . & Walsh, M. J . 1966. Artificial Intelligence through Simulated
Evolution. Wiley.
Goldberg, D. Editor. 1989. Genetic algorithms in search, optimization and machine learning.
Addison-Wesley Publishing Company, Inc., Reading, Massachusetts, 1989.
24

Holland, J . 1975. Adaptation in natural and artificial systems. The University of Michigan
Press, Ann Arbor, Michigan, 1975.
http://www.biotaneotropica.org.br/v3n1/pt/abstract?article+BN00703012003
Koch, I., M. F. Siqueira, & A. T. Peterson. Submitted. Characterizing geographic distributions
of tropical woody plant species via ecological niche modeling. Global Ecology and
Biogeography.
MacArthur, R. 1972. Geographical Ecology. Princeton Univ. Press, Princeton, NJ .
Mitchell, M. 1996. An Introduction To Genetic Algorithms. MIT Press, 1996.
Nix, H.A., 1986. A biogeogaphic analysis of Australian Elapid snakes, in Longmore, R. (ed.)
Atlas of Australian Elapid Snakes. Australian Flora and Fauna Series 8: 4-15.
Obitko, M. 1998. Genetic Algorithms. http://cs.felk.cvut.cz/~xobitko/ga/
Peterson, A. T. 2001. Predicting species' geographic distributions based on ecological niche
modeling. Condor 103:599-605.
Peterson, A. T., & K. C. Cohoon. 1999. Sensitivity of distributional prediction algorithms to
geographic data completeness. Ecological Modelling 117:159-164.
Peterson, A. T., & Vieglais, D.A. 2001. Predicting species invasions using ecological niche
modeling. BioScience 51:363-371.
Peterson, A. T., D. R. B. Stockwell, & D. A. Kluza. 2002d. Distributional prediction based on
ecological niche modeling of primary occurrence data. Pages 617-623 in J . M. Scott,
editor. Predicting species occurrences: Issues of scale and accuracy. Island Press,
Washington, D.C.
Peterson, A. T., J . Soberon, & V. Sanchez-Cordero. 1999. Conservatism of ecological niches
in evolutionary time. Science 285:1265-1267.
Peterson, A. T., L. G. Ball, & K. C. Cohoon. 2002a. Predicting distributions of tropical birds.
Ibis 144:e27-e32.
Peterson, A. T., M. A. Ortega-Huerta, J . Bartley, V. Sanchez-Cordero, J . Soberon, R. H.
Buddemeier, & D. R. B. Stockwell. 2002b. Future projections for Mexican faunas under
global climate change scenarios. NATURE 416:626-629.
Peterson, A. T., M. Papes, & D. A. Kluza. Submitted. Predicting the potential invasive
distributions of four alien plant species in North America. Weed Science.
Peterson, A. T., R. Scachetti-Pereira, & D. A. Kluza. 2003. Assessment of invasive potential
of the glassy-winged sharpshooter Homalodisca coagulata in California and South
America. Biota Neotrpica 3(1):
Peterson, A. T., V. Sanchez-Cordero, C. B. Beard, & J . M. Ramsey. 2002c. Ecologic niche
modeling and potential reservoirs for Chagas disease, Mexico. Emerging Infectious
Diseases 8:662-667.
Ratter, J . A., Bridgewater, S. & Ribeiro, J . F. 2001. Espcies lenhosas da fitofisionomia
cerrado sentido amplo em 170 localidades do bioma cerrado. Boletim do Herbrio
Ezechias Paulo Heringer, Brasilia 7: 5-112.
25

Rechenberg, I. 1965. Cybernetic Solution Path of An Experimental Problem, Ministry of
Aviation, Royal Aircraft Establishment, United Kingdom, 1965.
Siqueira, M. F. & A. T. Peterson. Submitted. Consequences of Global Climate Change for
Geographic Distributions of Cerrado Tree Species. Biota Neotropica.
Stockwell, D. R. B. & Noble, I. R., 1992. Induction of sets of rules from animal distribution
data: a robust and informative method of data analysis. Mathematics and Computers in
Simulation 33: 385-390.
Stockwell, D. R. B. 1999. Genetic algorithms II. Pages 123-144 in A. H. Fielding, editor.
Machine learning methods for ecological applications. Kluwer Academic Publishers,
Boston.
Stockwell, D. R. B., & A. T. Peterson. 2002a. Controlling bias in biodiversity data. Pages 537-
546 in J . M. Scott, editor. Predicting species occurrences: Issues of scale and accuracy.
Island Press, Washington, D.C.
Stockwell, D. R. B., & A. T. Peterson. 2002b. Effects of sample size on accuracy of species
distribution models. Ecological Modelling 148:1-13
Stockwell, D. R. B., & D. P. Peters. 1999. The GARP modelling system: Problems and
solutions to automated spatial prediction. International J ournal of Geographic Information
Science 1999;13:143-58.
26

Anexo 1: Definies de Dados Ambientais
Parte das informaes disponveis neste anexo foi retirada dos seguintes sites da Internet:
www.dpi.inpe.br/~julio/carto_geoprocessamento.pdf
www.geotrack.hpg.com.br/cart.pdf
www2.prudente.unesp.br/dcartog/galo/pdf/2002_propagacao.pdf
www.spg.com.br/informacoes/artigos_gps/125.HTM
Mapas: a representao do globo terrestre, ou de trechos de sua superfcie, sobre um
plano, indicando fronteiras polticas, caractersticas fsicas, localizao de cidades e outras
informaes geogrficas, scio-polticas ou econmicas. Os mapas, normalmente, no tem
carter tcnico ou cientfico especializado, servindo somente para fins ilustrativos ou
culturais e exibindo suas informaes por meio de cores e smbolos. Ou seja, mapas tm
finalidade ilustrativa, como por exemplo, um "Mapa Turstico". s vezes, nem se quer tem
sistema de coordenadas, e a escala aproximada.
Cartas: trata-se tambm de uma representao da superfcie terrestre sobre um plano, mas
so especialmente traadas para serem usadas em navegao ou outra atividade tcnica ou
cientfica. As Cartas permitem medies precisas de distncias e direes (azimutes),
podendo inclusive ser temticas (Carta topogrfica, gravimtrica, geolgica, etc).
Maiores informaes podem serem obtidas no site da CPRM - Definies de documentos
cartogrficos - http://www.cprm.gov.br/didote/p0135.htm
Coordenadas: o mapa serve apenas para dar uma idia do terreno, mas tambm para
identificar pontos dentro dele. Para isso, os pontos do mapa podem ser referenciados por
suas coordenadas cartesianas. As coordenadas podem ser angulares (graus, minutos e
segundos) ou mtricas.
Latitude: no sistema de coordenadas angulares, o ngulo vertical entre o equador e o
paralelo que passa sobre o ponto, chamado de latitude. Se o ponto est ao Norte do
Equador, tem latitude positiva. Se estiver ao Sul do Equador, tem latitude negativa.
Longitude: a distncia angular entre o meridiano de Greenwich e o meridiano que passa
sobe o ponto visado. Imaginando-se o planisfrio onde a Inglaterra ocupa o centro do mapa,
o que estiver oeste de Greenwich, tem latitude negativa e o que estiver Leste tem
latitude positiva.
Portanto, quase todo o territrio brasileiro tem coordenadas duplamente negativas. Por
exemplo, um ponto em Braslia com coordenadas (-15 48' 11.5" -48 03'57.2") pode ser
registrado como (15S 48' 11.5" 48W 03' 57.2") ou (15 48' 11.5" S 48 03'57.2" W) ou ainda
(-15.8030 -48.0530 ) em graus decimais. um ponto a 15 graus ao sul do equador, e a 48
graus a oeste de Greenwich.
Escala: a relao que expressa a diferena de grandeza entre as feies no terreno e
como elas aparecem no mapa. A escala pode ser grfica ou numrica. A escala grfica tem
a aparncia de uma rgua que mostra o tamanho no terreno de um segmento de reta no
mapa. sempre uma frao que tem: o nmero 1 como numerador, indicando uma
unidade de comprimento no mapa (Ex: cm, mm, polegada). Um nmero muito maior que 1
como denominador, indicando quantas unidades no terreno equivalem a uma unidade no
mapa. Assim, uma escala 1:100.000 indica que: 1cm no mapa equivale a 100.000cm ou
1km no terreno.
Projees: os mapas so representaes em papel (portanto em um plano) de trechos da
superfcie da terra que aproximadamente esfrica. Para fazer a representao de uma
27

superfcie curva em um plano, os cartgrafos fazem uma projeo, ou seja, fazem a
correspondncia entre cada ponto da superfcie da terra a um ponto sobre o mapa. A
projeo cartogrfica mais comum a de Mercator (Transversa de Mercartor). Claro que no
sculo XXI no se faz mais projees diretamente do globo. Os mapas so feitos hoje com
levantamentos aerofotogramtricos, imagens de radar, e mais recentemente por satlite. A
diferena que a projeo se faz em uma rea pequena, normalmente a rea coberta por
um mosaico de fotos areas j corrigidas e ajustadas, o que reduz muito as distores.
Projeo UTM - " Universal Transverse Mercator" : o mapeamento sistemtico, ou seja,
detalhado e completo do Brasil feito usando a projeo UTM nas escalas (1:250.000,
1:100.000, 1:50.000). Cartas detalhadas do Exrcito / IBGE / Outros.
Para se obter um mapa em Projeo de Mercator, que um tipo de projeo cilndrica, a
idia a seguinte: Envolver o globo terrestre por um cilindro. Este cilindro que tem o mesmo
dimetro da Terra, e que tangente a um ponto conveniente, no necessariamente no
Equador. Depois de projetados os pontos, perpendicularmente superfcie do cilindro, este
desenrolado.
Como caracterstica desta projeo, teremos os paralelos projetados como retas paralelas,
com distncia entre elas cada vez menor, medida que distanciamos do Equador. Teremos
tambm um meridiano central que uma linha reta, e os demais meridianos ligeiramente
curvos.
Na projeo UTM, a Terra foi dividida em 60 fusos (meridianos), criando setores (fatias) de 6
graus de extenso. Da mesma forma, foi dividido em 30 outros setores no sentido dos
paralelos criando "retngulos esfricos" de 6x6 graus. Cada cilindro chamado de zona, e
esta zona recebe um nome formado por uma letra e um nmero. (Ex: L23). O cilindro de
projeo tangente ao centro deste "retngulo esfrico" e recebe com pouca distoro os
pontos nele projetados.
Outra caracterstica da Projeo UTM, que as coordenadas so mtricas. Ou seja, os
pontos tm coordenadas (X,Y) cartesianas em metros, em relao a um ponto de origem.
Isso facilita calcular a distncia, e tambm a extrair as coordenadas mtricas de um ponto
no mapa usando uma rgua.
Elipside: a Terra est aproximada de um elipside de revoluo, que consiste em um
slido, gerado pela rotao de uma elipse em torno do eixo dos plos (eixo menor). Nas
determinaes geodsicas, esse elipside utilizado como superfcie de referncia.
Estudos geodsicos apresentam valores diferentes para os elementos do elipside, medidos
nos vrios pontos da Terra. Assim, cada regio deve adotar como referncia o elipside
mais indicado. Por diferentes razes tcnicas, histricas, polticas e econmicas, cada pas
tem utilizado um determinado elipside, que em geral diferente dos demais, pois antes da
utilizao de satlites era muito difcil determinar com exatido o centro da terra para que se
pudesse derivar um datum padro para o mundo. Atualmente, o padro mais aceito o que
leva o nome WGS84 (World Geodetic System, 1984). Toda carta traz na legenda o elipside
de referncia.
Um sistema geodsico consta de um elipside (superfcie de referncia), de um conjunto de
parmetros matemticos que definem a amarrao do elipside superfcie da Terra e de
um conjunto de pontos da superfcie. O conjunto formado pelo elipside e os parmetros
conhecido como Datum.
No Brasil, inicialmente, adotou-se o elipside de Hayford, recomendado na conferncia de
Madri de 1924, que utiliza o Datum Crrego Alegre. Suas dimenses foram consideradas as
mais convenientes para a Amrica do Sul.
28

Atualmente, o Sistema Geodsico Brasileiro utiliza o elipside da Unio Astronmica
Internacional de Geodsia, que passou a se chamar Elipside de Referncia Internacional,
homologado pela UGGI (Unio Geodsica e Geofsica Internacional) em 1967.
Posteriormente este mesmo elipside foi utilizado para o Sistema Geodsico Sul-Americano,
ficando ento conhecido como South American Datum de 1969 - SAD-69.
No site da Universidade do Colorado pode-se ver alguns dos Elipsides de Referncia -
http://www.colorado.edu/geography/gcraft/notes/datum/datum_f.html
A razo para existirem tantos elipsides, que um elipside pode aproximar bem a
superfcie da terra em um determinado ponto, mas pode ficar meio distante em outros locais.
Datum: utilizado como referncia em toda a cartografia mundial para elaborao de mapas
e na recuperao das informaes nele contidas, o Datum uma caracterstica comum nas
cartas cartogrficas. Ele pode ser entendido como um modelo matemtico que aproxima a
forma da terra e permite clculos como posio e rea a serem levantadas, de forma
consistente e precisa. Para a definio do Datum escolhe-se um ponto central em relao
rea de sua abrangncia. Existem vrios tipos de Datum, como:
Local: Datum geodsico utilizado na cobertura de pases ou regies, escolhido de forma a
minimizar as distncias entre o geide e o elipside de referncia, numa determinada zona
de interesse. Exemplos: SAD-69, Crrego Alegre, NAD-83, Indian.
Global: Datum geodsico utilizado na cobertura geral do globo, escolhido de forma a fazer
coincidir o centro de massa da Terra com o centro do elipside de referncia, e o eixo da
Terra com o eixo menor do elipside, procurando assim minimizar, globalmente, as
diferenas entre este e o geide. Os sistemas globais de posicionamento utilizam um Datum
global. Exemplos: WGS-84, SIRGAS (Sistema de Refrncia Geocntrico para as Amricas).
Geodsico: Conjunto dos parmetros que constituem a referncia de um determinado
sistema de coordenadas geogrficas, e que inclui a definio do elipside de referncia e a
sua posio relativamente ao globo terrestre.
Buscando ainda sua definio, o Datum uma superfcie de referncia para controle
horizontal e vertical de pontos em um sistema de referncia cartogrfico. Uma superfcie de
referncia (Datum horizontal) consiste em cinco valores: latitude, longitude de um ponto
inicial, azimute de uma linha que parte deste ponto e duas constantes necessrias para
definir o elipside de referncia. Assim, forma-se a base para o clculo dos levantamentos
de controle horizontal no qual considera-se a curvatura da Terra. A superfcie de nvel
(Datum vertical) refere-se s altitudes.
Qualquer carta tem uma referncia a um Datum e geralmente apresentado em sua
legenda. As linhas de latitude e longitude numa carta ou mapa so referenciados a um
especfico Datum. Se comparar as coordenadas de GPS a uma carta ou outra referncia, o
mapa Datum selecionado deve ser o mesmo do da carta.
Sistema Geodsico Brasileiro - SGB:
O Sistema Geodsico Brasileiro foi regulamentado pelas instrues reguladoras das Normas
Tcnicas da Cartografia Nacional e institudo pelo Decreto nmero 89.317 de 20 de junho de
1984.
Estas normas estabelecem o Datum SAD-69 como datum oficial a ser utilizado em toda e
qualqer representao cartogrfica do territrio nacional. O SAD-69 foi adotado para
uniformizar a rede geodsica de controle bsico continental. Porm, boa parte da cartografia
do Brasil ainda existente est referida ao Datum anterior ao SAD-69. E ainda existem mapas
feitos at com Datum locais.
29

Aps uma viso geral sobre todos esse conceitos podemos mostrar alguns exemplos reais e
mensurar alguns possveis erros:
Crrego Alegre - MG
Latitude: 19
o
45' 41.34" S
Longitude: 48
o
06' 07.08" W
SAD-69
Latitude: 19
o
45' 41.6527" S
Longitude: 48
o
06' 04.0639" W
Azimute de Uberaba: 271
o
30' 04.05"
As coordenadas geogrficas, na verdade geodsicas, variam menos que 60m entre SAD-69
e Crrego Alegre e menos de 100m entre SAD-69 e WGS84, no territrio brasileiro.
A primeira concluso a necessidade de ateno ao procedimento de transformao de
coordenadas pelos usurios. O uso de diferentes procedimentos de transformao gera
diferenas nos valores das coordenadas transformadas.
As conseqncias dessas diferenas so percebidas em problemas de fuso de dados de
mltiplas fontes, por exemplo. Duas bases de dados podem estar sob o mesmo sistema de
referncia, mas terem sido transformadas de outros sistemas utilizando diferentes
procedimentos. Isso pode fazer com que a mesma representao de uma feio seja
transformada em duas representaes diferentes (i.e., com diferena nas coordenadas dos
seus pontos). Portanto a segunda concluso a necessidade da devida documentao
tcnica dos dados e dos processamentos aplicados a eles.
30

Anexo 2: Curso de Geoprocessamento
Curso de Geoprocessamento 2003 modalidade Extenso Universitria, oferecido pelo
Instituto de Computao da Unicamp.
Participantes: Alexandre Marino, Fabrcio Pavarin e Rafael Fonseca.
O programa do curso composto por 16 disciplinas, que variam de 8 a 40 horas, oferecidas
em aulas semanais aos sbados em tempo integral e em determinadas noites de sextas-
feiras (18 s 23h), totalizando 360 horas. As disciplinas esto estruturadas numa seqncia
lgica e de complementaridade. O curso oferecido de janeiro a dezembro de 2003, nas
instalaes do Instituto de Computao da Unicamp.
Descrio dos mdulos:
Introduo ao Geoprocessamento - A importncia de informaes georreferenciadas,
principais sistemas de geoprocessamento, Sistemas de Informaes Geogrficas,
aplicaes de geoprocessamento (8 horas).
Cartografia Digital Bsica - Conceitos bsicos fundamentais que permitem utilizar, de
um modo mais adequado e confivel, produtos cartogrficos como mapas, imagens
de satlites, fotografias areas (24 horas).
Pr-processamento de Dados Espaciais - Dados analgicos vs dados digitais,
modelos de dados digitais, estrutura de dados vetoriais, sistema CAD, tcnicas de
digitalizao, exerccios prticos (24 horas).
Introduo ao Sensoriamento Remoto - Conceitos radiomtricos bsicos, rbitas e
sensores, comportamento espectral de alvos, pr-processamento de imagens de
satlites (16 horas).
Processamento de Imagens de Sensoriamento Remoto - Imagens digitais,
histogramas, realce, contraste, filtragem, imagens de radar, classificao e exatido
de classificao, correes (geomtrica, topogrfica), composio, interpretao, uso
e aplicaes de imagens de satlite (24 horas).
Introduo a Banco de Dados para Aplicaes Geogrficas - Banco de dados e
sistemas de arquivos, gerenciadores e arquitetura de banco de dados, utilizao em
aplicaes geogrficas, modelagem de dados (MER), projeto lgico de dados,
processamento de consultas em banco de dados (linguagem SQL) (16 horas).
Engenharia de Software para Aplicaes Geogrficas - Paradigma da engenharia de
software, ciclo de vida de um software geogrfico, tcnicas e ferramentas de
levantamento de requisitos do usurio e do sistema, mtodo de anlise e projetos de
sistemas, planejamento e execuo de testes, documentao e manuteno de
aplicaes (24 horas).
Sistemas de Informao Geogrfica (SIG) - Introduo, arquitetura de um SIG,
modelos de dados, superfcies contnuas em SIG, anlise espacial, aplicaes
bsicas (40 horas).
Bancos de Dados Espaciais (BD) - Modelagem e especificao BD, BD geogrficos
para aplicaes ambientais e urbanas, estruturao de dados geogrficos em BD,
BD temticos, textuais e de imagens, processamento e otimizao de consultas
espaciais (28 horas).
Redes de Computadores e Sistemas Distribudos para Geoprocessamento - Noes
bsicas de redes, sistemas distribudos, Internet para gerenciamento de dados
31

geogrficos, protocolo de redes, Ethernet, token ring, ATM, TCP/IP, servidores Web,
transmisso de dados via Web, segurana, estudos de caso (24 horas).
Sistemas Espaciais de Apoio Deciso (AD) - Modelagem de sistemas vs AD,
inteligncia artificial e AD, interfaces e visualizao em sistemas de AD, sistemas
cooperativos, sistemas de AD em grupo, tomada de deciso em geoprocessamento,
anlise multicritrio (24 horas).
Fundamentos de Geoestatstica - Estatstica descritiva, funes aleatrias,
estacionariedade, conceito de varivel regionalizada, semivariograma, estimao e
krigeagem (16 horas).
Monitoramento Ambiental (MA) - Conceitos de planejamento ambiental,
geoprocessamento e MA, base de dados para MA, modelagem de dados do meio
fsico para MA, MA em bacias hidrogrficas, zoneamento ambiental, Meio Fsico e
planos diretores municipais e estudos de caso (16 horas).
Projeto de SIGs para Infraestrutura de Redes Urbanas - Caracterizao de
aplicaes de redes de concessionrias de servios pblicos, municipalidade,
mapeamento urbano bsico, caractersticas e modelagem, redes de infra-estruturas,
converso de dados (16 horas).
Projeto de Sistemas Georeferenciados - Especificao e projeto de ferramentas e
tcnicas de geoprocessamento combinadas com metodologias e tecnologias da
computao, para solues de problemas em aplicaes geogrficas (24 horas).
Implementao de Sistemas Georeferenciados - Desenvolvimento e implementao
de projetos em geoprocessamento a partir de problemas especficos em aplicaes
geogrficas (36 horas).
Projeto de curso: Fabrcio Pavarin
Com base em levantamentos realizados na bacia do Mdio Paranapanema existem hoje
disponveis informaes biolgicas e ecolgicas para 481 espcies arbreas que ocorrem
naturalmente na regio. A Estao Ecolgica de Assis liderou um trabalho de levantamento
de dados no campo em 83 diferentes localidades da regio. Porem, esses dados sozinhos,
apesar de serem uma fonte riqussima de informao, sem uma ferramenta de anlise e de
integrao de dados, no so suficientes para a tomada de deciso quanto escolha sobre
quais espcies usar e em qual situao. Neste caso, uma soluo seria desenvolver
ferramentas, utilizando tcnicas de geoprocessamento, modelagem espacial e a integrao
de dados atravs de sistemas de informao georreferenciadas (SIG), para gerar uma
metodologia aplicvel em casos de identificao de reas prioritrias para recuperao
ambiental e conservao de espcies nativas. Esta metodologia servir de base para
orientar futuros trabalhos no s de identificao de reas para recuperao como tambm
dar apoio para a escolha das espcies mais adequadas, de acordo com suas
necessidades ecolgicas, para diferentes reas da regio de estudo.
Projeto de curso: Alexandre Marino
Ttulo: Ferramenta de classificao da qualidade da gua da Bacia do Rio Piracicaba (PCJ )
na WEB
Objetivo: O presente projeto tem por objetivo a elaborao de uma ferramenta SIG na WEB
com o intuito de facilitar a interpretao de qualidade da gua de alguns rios da bacia em
questo, numa estrutura acessvel a todos os tipos de usurios, possibilitando sua utilizao
32

como instrumento para o conhecimento, o planejamento e o gerenciamento dos recursos
hdricos.
Descrio do Produto: A bacia dos rios Piracicaba, Capivari e J undia localiza-se entre as
coordenadas geogrficas 2200 e 2300 latitude Sul e 4600 e 4800 longitude Oeste;
correspondendo a uma superfcie de 12.450 km2. Desta bacia, so retirados cerca de
2,3Hm3 (2.300.000m3) de gua por dia, para uso na rea urbana (37%), uso em usinas de
aucar e lcool (16,5%), uso em outras indstrias (32,7%) e uso agropecurio (13,8%). A
produo de gua durante a estiagem fica em situao crtica para o abastecimento pblico
das cidades, das bacias e de mais 5 municpios de outras bacias. Adicionalmente a essa
demanda, h tambm a reverso de 31m3/s, pelo sistema Cantareira, para o abastecimento
de cerca de 55% da populao da Regio Metropolitana de So Paulo. Para agravar a
situao, somente 12% dos esgotos domsticos recebem tratamento e, cerca de 75% das
cargas industriais so removidas, lanando uma carga remanescente nos nossos rios e
cerca de 106 tDBO/dia referente aos esgotos industriais e 133 tDBO/dia referente aos
esgotos domsticos. Este projeto tem como proposta criar uma ferramenta na WEB para
exibir um mapa com os principais rios da bacia coloridos de acordo com a qualidade da
gua, partindo dos valores dos parmetros da gua medidos em diversos pontos do rio em
um determinado espao de tempo. Um ndice de classificao ser adotado para facilitar a
interpretao das informaes de qualidade de gua de forma abrangente e til, para
especialistas ou no. As cores serviro para mostrar a qualidade da gua em questo,
classificando-a em tima, boa, aceitvel, ruim ou pssima. Esta ferramenta ter uma
estrutura acessvel a todos os tipos de usurios, possibilitando sua utilizao como
instrumento para o conhecimento, o planejamento e o gerenciamento dos recursos hdricos.
Projeto de curso: Rafael Fonseca
Ttulo: Sistema de Anlise de Similaridade de reas
Orientador: Professor Dr. J urandir Zullo J unior (Cepagri/Unicamp)
Uma espcie pode habitar uma determinada regio se possuir adaptaes necessrias s
condies abiticas do local. Algumas espcies encontram condies timas e, na ausncia
de inimigos naturais, tornam-se pragas. Identificar reas cujas condies climticas sejam
similares a da regio invadida pela praga, possibilita um estudo de campo direcionado para
busca de inimigos naturais. O Sistema de Anlise de Similaridade de reas visa identificar
similaridade ambiental de reas e criar um mapa de probabilidade de ocorrncia de
espcies. A distribuio poder ser associada com o tipo de disperso que a planta possui
(sndrome de disperso) e com as variveis ambientais da localidade da coleta. Tambm
permitir visualizar as coletas em uma escala temporal.
A relao entre coleta e variveis abiticas permite compreender a distribuio de espcies.
Essa compreenso possibilita inferir em quais regies h maior probabilidade de ocorrncia
de espcies, auxilia na elaborao de inventrios, no estudo de espcies raras e nos
programas de controle biolgico. O controle biolgico dado pela busca de inimigos
naturais para uma determinada praga. Essa busca pode ser otimizada se for direcionada
para locais similares (clima, topografia, solos etc) a regies de invaso da praga. As regies
indicadas pelo Sistema de Anlise de Similaridade de reas apenas demonstram que, se for
encontrado um inimigo natural na rea prevista, ele ter grande potencial de ser um bom
agente de controle.
As acamadas ambientais sero divididas em clulas, pequenos polgonos que possuem
igual valor de temperatura, precipitao etc. Essas quadrculas sero definidas por um ponto
central. Quando se insere uma coleta, o sistema realizar uma associao entre os pontos
de coletas e as clulas. Essa configurao permite criar buscas de variveis, clculos
estatsticos e os resultados podem ser visualizados graficamente.
33


Casos de Uso
1. Recomendao de locais prioritrios para estudos de controle
biolgico
Considerando-se a importncia da produo agrcola do Brasil em sua economia e sua
presena significativa nas exportaes, tornam-se essenciais estudos para aumentar a
produo, diminuir gastos na lavoura e melhorar a qualidade dos produtos. Atualmente,
esse controle da lavoura realizado com a utilizao em massa de agrotxicos e outros
produtos qumicos que alm de influenciarem na qualidade do produto final, encarecem a
produo, pois muitos desses componentes so importados. A utilizao de controle
biolgico uma alternativa positiva para os agricultores brasileiros. Utilizar um inimigo
natural para controlar a praga, ao mesmo tempo em que reduz ou elimina a utilizao de
agrotxico, agrega uma qualidade ao produto.
2. Identificao de reas de riscos
Muitas doenas possuem vetores de transmisso. Atravs de uma analise de ocorrncia de
vetores, podem-se buscar reas similares onde ele possa vir a ocorrer, impedindo uma nova
epidemia em uma outra rea similar.
3. Estudos de espcies endmicas
Espcies endmicas so muito especificas quanto ao seu habitat timo, isto , so
tolerantes a poucas variaes no ambiente. O sistema pode auxiliar na busca de reas onde
a espcie possa a vir a ocorrer bem como auxiliar a reintroduo dessa espcie em reas
nativas.
34