You are on page 1of 10

Traduzido do Inglês para o Português - www.onlinedoctranslator.

com

Informática Ecológica 53 (2019) 100983

Listas de conteúdos disponíveis emScienceDirect

Informática Ecológica
Página inicial do jornal:www.elsevier.com/locate/ecolinf

Uma análise exaustiva de métodos heurísticos para seleção de variáveis em


modelagem de nicho ecológico e modelagem de distribuição de espécies

Marlon E. Cobosuma,1, A. Townsend Petersonuma,1, Luis Osório-Olverauma,b,2, Daniel Jiménez-Garcíauma,c,⁎


umaInstituto de Biodiversidade, Departamento de Ecologia e Biologia Evolutiva, Universidade do Kansas, Lawrence, KS, EUA
bCentro do Câmbio Global e da Sustentabilidade no Sureste AC, Villahermosa, Tabasco, México
cCentro de Agroecologia e Ambiente, Instituto de Ciências, Benemérito Universidad Autónoma de Puebla, Puebla, Puebla, México

INFORMAÇÕES DO ARTIGO ABSTRATO

Palavras-chave: Modelos de nicho ecológico e modelos de distribuição de espécies são usados em muitos campos da ciência. Apesar de sua popularidade, apenas recentemente foram desenvolvidos aspectos importantes do

Canivete processo de modelagem, como a seleção de modelos. A escolha de variáveis ambientais com as quais criar esses modelos é outra parte crítica do processo, mas os métodos atualmente em uso não são consistentes

kuenm em seus resultados e não existe uma abordagem abrangente para realizar essa etapa. Aqui, comparamos sete métodos heurísticos de seleção de variáveis com uma nova abordagem que propõe selecionar os
Maxent
melhores conjuntos de variáveis avaliando o desempenho de modelos criados com todas as combinações de variáveis e configurações de parâmetros distintos do algoritmo em conjunto. Nossos resultados foram
Contribuição variável
que, com exceção do método canivete para uma das 12 espécies e índice de flutuação para duas das 12 espécies, nenhum dos métodos heurísticos de seleção de variáveis coincidiu com o exaustivo. O desempenho
Importância variável
diminuiu nos modelos criados com variáveis selecionadas com métodos heurísticos e tanto underfitting quanto overfitting foram detectados ao comparar suas projeções geográficas com as de modelos criados com
Fator de inflação de variação
variáveis selecionadas pelo método exaustivo. Usar a abordagem exaustiva pode ser demorado, portanto, um exercício de duas etapas pode ser necessário. No entanto, o uso desse método identifica conjuntos de

variáveis e configurações de parâmetros adequados em conjunto que estão associados ao aumento do desempenho do modelo. O desempenho diminuiu nos modelos criados com variáveis selecionadas com

métodos heurísticos e tanto underfitting quanto overfitting foram detectados ao comparar suas projeções geográficas com as de modelos criados com variáveis selecionadas pelo método exaustivo. Usar a

abordagem exaustiva pode ser demorado, portanto, um exercício de duas etapas pode ser necessário. No entanto, o uso desse método identifica conjuntos de variáveis e configurações de parâmetros adequados

em conjunto que estão associados ao aumento do desempenho do modelo. O desempenho diminuiu nos modelos criados com variáveis selecionadas com métodos heurísticos e tanto underfitting quanto overfitting

foram detectados ao comparar suas projeções geográficas com as de modelos criados com variáveis selecionadas pelo método exaustivo. Usar a abordagem exaustiva pode ser demorado, portanto, um exercício de

duas etapas pode ser necessário. No entanto, o uso desse método identifica conjuntos de variáveis e configurações de parâmetros adequados em conjunto que estão associados ao aumento do desempenho do

modelo.

1. Introdução publicação de múltiplas plataformas para calibração eficiente de modelos


candidatos e cálculo dos índices relevantes. O ENMTools forneceu o código inicial
A modelagem de nicho ecológico (ENM) começou como uma empresa de ajuste de para calcular o critério de informação Akaike corrigido para tamanhos de amostra
modelo que era feita em configurações padrão (por exemplo,Wisz et al., 2008) ou por pequenos (AICc) (Warren et al., 2010;Warren e Seifert, 2011), e o ENMeval forneceu
meio do que pode ser chamado de "pela arte" - ou seja, com configurações de uma plataforma mais integral a partir da qual os modelos podem ser calibrados e
parâmetros do modelo estabelecidas com base na experiência anterior do modelador. avaliados em diversas combinações de parâmetros (especificamente em termos
Com adaptação do critério de informação de Akaike (AIC;Warren e Seifert, 2011) de multiplicador de regularização e tipos de recursos ou respostas;Muscarella et
estatísticas para Maxent, a plataforma ENM mais popular (Maxent;Phillips et al., 2006), no al., 2014). Mais recentemente, o pacote kuenm R permitiu que os usuários
entanto, um novo panorama se abriu, no qual as configurações de parâmetros do realizassem uma avaliação em três partes (em aspectos como significância
modelo podem ser exploradas e testadas, e as configurações de parâmetros ideais e estatística, desempenho preditivo e simplicidade do modelo, conforme resumido
combinações de configurações de parâmetros podem ser verificadas quantitativamente. no AICc), explorando combinações de valores de parâmetro para multiplicador de
Esta etapa prometia um rigor adicional considerável em ENMs, particularmente quando regularização, tipos de recursos e ambiente conjuntos de dados (Cobos et al., 2019
os modelos deveriam ser transferidos para condições futuras ou passadas, ou para ). Como consequência bem-vinda, as abordagens de seleção de modelos
outras regiões (Peterson et al., 2018;Peterson e Nakazawa, 2008;Petitpierre et al., 2017). tornaram-se agorade rigueurno campo, embora alguma preocupação tenha sido
expressa sobre a natureza incompleta da adaptação original do AIC para Maxent (
A seleção de modelos em ENM foi ainda mais habilitada pelo desenvolvimento e Peterson

⁎Autorcorrespondente em: Instituto de Ciencias, Benemérita Universidad Autónoma de Puebla, Edificio Val. 1, km 1.7 carretera San Baltazar Tetela, 72960 Puebla,
México.
Endereço de email:daniel.jimenez@correo.buap.mx (D. Jiménez-García).
1Endereço atual: Biodiversity Institute, University of Kansas, 1345 Jayhawk Blvd., Lawrence, KS 66045, EUA.
2Endereço atual: Centro del Cambio Global y la Sustentabilidad en el Sureste AC, 142 Centenario Instituto Juárez, Villahermosa, Tabasco 86080, México.

https://doi.org/10.1016/j.ecoinf.2019.100983
Recebido em 28 de março de 2019; Recebido em formulário revisado em 21 de junho de 2019; Aceito em 12 de julho de 2019 Disponível

on-line em 15 de julho de 2019

1574-9541/ © 2019 Elsevier BV Todos os direitos reservados.


ME Cobos, et ai. Informática Ecológica 53 (2019) 100983

e outros, 2018;Velasco e González-Salazar, 2019). variáveis em ENM, cada uma das quais tem visto uso em estudos publicados na
Embora as configurações do multiplicador de regularização e os tipos de área. Especificamente, derivamos duas medidas diretamente da saída do Maxent
recursos sejam de fato fatores importantes nos resultados do ENM, muitos sinais versão 3.4.1 k:importância da contribuição (porcentagem de contribuição), e
iniciais indicam que a dimensionalidade e as dimensões específicas do espaço importância variável (importância de permutação).A porcentagem de contribuição
ambiental podem constituir um fator ainda mais significativo na determinação dos representa o efeito da variável no ganho regularizado do modelo, enquanto a
resultados.Araújo e Guisan, 2006;Peterson e Nakazawa, 2008). Ou seja, é sabido importância da permutação representa o efeito na AUC de treinamento causado
que um espaço ambiental altamente dimensional produzirá modelos com pela randomização dos valores dessa variável. Após criar um modelo inicial com
qualidades muito diferentes de um espaço mais simples, principalmente no caso configurações padrão no Maxent e utilizar todo o conjunto de variáveis, os
de transferências de modelos (futuro ou passado, ou outra região;Peterson e preditores que apresentavam valores de importância zero foram removidos da
Nakazawa, 2008). No entanto, a escolha dos parâmetros ambientais ainda não foi análise.
incorporada aos métodos de seleção de modelos ENM e atualmente é suportada Uma terceira abordagem foi a docaniveteabordagem, que deriva de
apenas pelo pacote kuenm. Em vez disso, até o momento, as dimensões explorações iniciais porPeterson e Cohoon (1999), e habilitado por rotinas
ambientais foram escolhidas para ENM por uma variedade de abordagens implementadas no Maxent. Nas análises sequenciais, o desempenho do modelo é
heurísticas (por exemplo,Fan et al., 2018) ou por preferências pessoais, e sem avaliado na forma de ganho do modelo (efetividade da classificação realizada) em
avaliações quantitativas. modelos baseados em cada dimensão isoladamente e em todas as dimensões,
Nesta contribuição, exploramos essa questão profundamente por meio exceto a em questão. Em cada iteração, as variáveis que mostravam uma
de uma série de pesquisas exaustivas e explorações de interações entre a combinação de baixo ganho quando analisadas isoladamente e baixo efeito no
questão da escolha das dimensões ambientais e a ideia mais ampla de ganho do modelo quando eliminadas (ou seja, sua ausência não faz muita
seleção de modelos. O resultado é que, com exceção de três casos de 84 diferença na qualidade do modelo) foram eliminadas e as iterações foram
exemplos explorados, nenhuma das abordagens heurísticas encontra a executadas até que nenhuma dessas variáveis fosse identificada.
combinação ótima de dimensões ambientais; em vez disso, em diferentes a (Jueterbock
Uma quarta abordagem foi via “MaxentVariableSelection” R pacote
et al.,
graus e com diferentes tipos de tendências, cada uma das abordagens 2016), que avalia o desempenho de vários modelos criados com configurações de
heurísticas perde a combinação ótima de dimensões ambientais e leva o parâmetros distintas, com base apenas no AIC. As configurações de parâmetros
pesquisador a escolhas subótimas. Usando espécies virtuais, também testadas incluíram 12 valores multiplicadores de regularização, uma combinação
testamos o quão bem os métodos exaustivos e heurísticos selecionaram de classes de recursos (linear, quadrática e de produto; observe que o pacote
variáveis ambientais - nenhum dos métodos selecionou o conjunto exato permite explorar apenas uma combinação de recursos por vez) e diferentes
de variáveis relevantes para as espécies virtuais, mas o método exaustivo conjuntos de variáveis ambientais (definidas automaticamente pelo software ).
teve um desempenho melhor do que outros métodos. Recomendamos Os melhores conjuntos de variáveis foram escolhidos determinando o modelo
pesquisas exaustivas de combinações de dimensões ambientais em com melhor desempenho e selecionando preditores com contribuições
conjunto com as avaliações mais habituais de outros valores de parâmetros (porcentagem de importância variável) que foram≥1%.
como parte integrante do processo de seleção de modelos em ENM.
Também exploramos a seleção de variáveis com base em resultados de
2. Materiais e métodos análises de fatores de inflação de variância (VIF;Brauner e Shacham, 1998), que
têm sido sugeridos como meio de seleção de variáveis há algum tempo (Guisan
2.1. Espécies de exemplo et al., 2002). A razão de variância em um modelo com múltiplos termos foi dividida
pela variância em modelos baseados em cada termo individual; tais resultados
Com o objetivo de ilustrar as ideias exploradas nesta contribuição em indicam quanto da variância é representada por cada preditor. Variáveis com
diversos e variados casos, escolhemos 12 espécies de exemplo para análise valores de VIF < 5 foram selecionadas como melhores preditores. Selecionamos
(10 espécies do mundo real e 2 espécies virtuais). Para facilitar a descrição esse valor relativamente baixo para a seleção das variáveis ser conservadora,
completa dos exemplos envolvidos, escolhemos esses exemplos dentre as pois não há consenso na literatura sobre qual valor é melhor. Avaliamos o VIF para
espécies que viram estudo recente em nosso grupo coletivo, e que estão modelos logísticos ponderados para cada espécie com base em respostas lineares
todas publicadas e citadas aqui. Escolhemos exemplos para incluir diversos usando o pacote car em R; os pesos atribuídos às presenças e pontos de fundo
táxons (ou seja, invertebrados, vertebrados), diversos conjuntos de variáveis foram 1 e 10.000, respectivamente. Usamos esta forma de modelo (criada aqui
ambientais (dados climáticos, dados de índice de vegetação multitemporal) e como modelos lineares generalizados), pois eles são considerados comparáveis
diversos tipos de gestão de variáveis ambientais (dimensões brutas, aos modelos Maxent sob certas condições e suposições (Fithian e Hastie, 2013).
componentes principais). Em cada caso, analisamos o conjunto de variáveis
que foi usado no estudo publicado (veja o resumo detalhado emtabela 1). Outro método usado para selecionar preditores para ENMs é o método hierárquico
Espécies virtuais foram criadas usando os preditores de um dos exemplos para impulsionar análises de árvore de regressão (BRT;Elith et al., 2008). Aqui, os
de espécies reais (Amblyomma americanum);os pesos das variáveis para a preditores foram selecionados com base na quantidade de informações relevantes
criação da espécie virtual foram os seguintes: para a Espécie 1, foram contribuídas por cada variável para o modelo BRT. Geramos esses modelos para todas as
utilizadas as variáveis bioclimáticas 5, 6, 16 e 17, com pesos 5, 1, 6 e 3, espécies usando as variáveis não correlacionadas, registros de ocorrência e um plano
respectivamente; para a Espécie 2, usamos as variáveis 2, 3, 16 e 17, com de fundo selecionado aleatoriamente em toda a extensão das camadas raster (por
pesos 6, 1, 5 e 3, respectivamente. As análises para criar as espécies virtuais exemplo,Cerasoli et al., 2017). Selecionamos todas as variáveis com contribuições acima
e obter 100 ocorrências aleatórias para cada foram realizadas usando o de 5% para análise; as análises foram realizadas usando o pacote dismo (Hijmans et al.,
SDMvspecies (Duan et al., 2015) e raster (Hijmans, 2019) pacotes em R 3.5.1 ( 2015) em R.
Equipe R Core, 2018). Por fim, usamos um método baseado no índice de flutuação (Guisande et al.,
Para evitar os casos mais extremos e óbvios de não independência das 2017) para selecionar variáveis para modelos. Aqui, a importância das variáveis
dimensões ambientais (para variáveis de linha), e também para reduzir a para o modelo é determinada com base em sua contribuição para um índice de
carga computacional, realizamos uma análise inicial de correlação. Ou seja, instabilidade calculado usando o índice de flutuação deDubois (1973), modificado
removemos da análise uma de cada par de variáveis ambientais para as porGuisande et ai. (2011). Selecionamos todas as variáveis com contribuição
quais as correlações de momento do produto de Pearson eram altas (r≥0,8). diferente de zero para o índice de flutuação para todas as espécies. Realizamos
Realizamos esta etapa usando R. um processo de seleção de preditores em duas etapas para todas as espécies
usando o pacote R ModestR (García-Roselló et al., 2013) para preparar os dados e
2.2. Protocolos de escolha de variável heurística SPEDInstabR (Guisande et al., 2017) para avaliar as contribuições variáveis para o
índice de flutuação. Como o ModestR permite apenas camadas com tamanhos de
Exploramos sete abordagens heurísticas para escolher pixel≥1′,nossas camadas foram reamostradas automaticamente para

2
ME Cobos, et ai. Informática Ecológica 53 (2019) 100983

tabela 1
Resumo das 12 espécies de exemplo analisadas neste estudo, juntamente com suas características gerais (por exemplo, tamanho da amostra, dimensões ambientais exploradas) e
fontes.

Espécies Variar Tamanho da amostra Variáveis Resolução Referência

Aedes notoscriptus Austrália e arredores 89 Computadores: 1–9 10′ (Peterson e Campbell, 2015) (
Amblyomma americanum América do Norte 185 Bioclim: 2, 3, 5, 6, 16, 17 Bioclim: 10′ Raghavan et al., 2019) (Hosner
Cyanoderma ruficeps Sudeste da Ásia 73 1, 2, 3, 5, 7, 15, 16, 17 PCs: 1–7 2,5′ et al., 2015) (Jathar et al., 2015) (
Heteroglaux blowitti Índia 78 8″ Alkishe et al., 2017) (Reeves et
Ixodes ricinus Europa e Norte de África 416 Bioclim: 2, 6, 7, 13, 14, 15, 16 10′ al., 2015) (Freeman et al., 2018)
MERS Norte de África 67 PCs: 1–5 10′ (Cobos et al., 2019) (Atauchi et
Pan trogloditas África Tropical 120 Computadores: 1–9 7,5″ al., 2018)
Peltophryne empusa arquipélago cubano 64 Bioclim: 3, 4, 5, 6, 7, 16, 17 30″
Phytotoma raimondii Equador e Peru 71 Bioclim: 1, 4, 7, 12, 15, 17 2,5′
Biótico: 1, 2
Streptopelia decaocto Europa, Ásia Ocidental 214 Computadores: 1–5 5′ (Ingenloff et al., 2017)
Espécie virtual 1 América do Norte 100 Bioclim: 2, 3, 5, 6, 16, 17 10′ –
Espécies virtuais 2 América do Norte 100 Bioclim: 2, 3, 5, 6, 16, 17 10′ –

Bioclim=Variáveis bioclimáticas do banco de dados WorldClim (Hijmans et al., 2005). Os números correspondem à ordem das variáveis originais.
Biótica = Variáveis construídas com base na adequação para outras espécies que interagem significativamente com a espécie de interesse (verAtauchi et al., 2018).
PCs = Componentes principais derivados de variáveis bioclimáticas e, apenas paraPan trogloditas,a partir de produtos multitemporais do índice de vegetação por diferença
normalizada (NDVI) do MODIS.

mesa 2
Métricas de desempenho das configurações do modelo selecionado em relação ao multiplicador de regularização (RM), classes de recursos (FC; l = linear, q = quadrático, p = produto, t = limiar eh =
dobradiça) e conjuntos de variáveis ambientais, por cada espécie . PorPan trogloditas,apenas 3 das 61 configurações selecionadas são apresentadas, consulte o material complementar Tabela S1.

Espécies Configurações do modelo valor p P. ROC Taxa de omissão (5%) delta AICc Parâmetros

Aedes notoscriptus RM= 4; FC =p; Definir 387 RM = 0,00 0,04 0,00 5


5; FC =p; Definir 387 RM = 4; FC 0,00 0,04 1,23 5
=p; Definir 461 RM = 4; FC =p; 0,00 0,04 1,33 6
Definir 385 RM = 5; FC = qp; 0,00 0,04 1,38 5
Amblyomma americanum Definir 53 RM = 0,2; FC= lp; 0,00 0,02 0,00 5
Cyanoderma ruficeps Definir 217 RM = 0,2; FC= lqp; 0,00 0,03 0,00 15
Definir 196 RM = 2; FC = qpt; 0,00 0,03 0,20 14
Heteroglaux blowitti Definir 31 RM = 2; FC = lpt; 0,00 0,03 0,00 12
Definir 74 RM = 1; FC =ph; 0,00 0,03 1,08 17
Ixodes ricinus Definir 103 RM = 0,5; FC= qp; 0,00 0,04 0,00 37
MERS Definir 21 RM = 0,5; FC= lqp; 0,00 0,03 0,00 8
Definir 21 RM = 0,4; FC= lqp; 0,00 0,03 0,99 9
Definir 12 RM = 0,2; FC= lp; 0,00 0,03 1,99 7
Pan trogloditas Definir 38 RM = 2; FC = t; Definir 0,00 0,02 0,00 4
219 RM = 2; FC = t; Definir 89 RM 0,00 0,00 0,09 2
= 0,8; FC=t; Definir 14 RM = 0,9; 0,00 0,00 0,09 2
Peltophryne empusa FC=t; Definir 14 RM = 0,9; FC= 0,00 0,00 0,00 4
pt.; Definir 14 RM = 0,9; FC=h; 0,00 0,00 0,97 4
Definir 29 RM = 0,1; FC= qp; 0,00 0,00 0,97 4
Definir 101 RM = 1; FC = lt; 0,00 0,00 1,64 7
Phytotoma raimondii Definir 11 RM = 0,2; FC= lqp; 0,00 0,03 0,00 6
Streptopelia decaocto Definir 25 RM = 0,2; FC= p; 0,00 0,05 0,00 31
Espécie virtual 1 Definir 53 RM = 3; FC = lqph; 0,00 0,02 0,00 7
Definir 19 RM = 3; FC = lqph; 0,00 0,04 1,84 9
Espécies virtuais 2 Definir 41 RM = 3; FC = qph; 0,00 0,04 0,00 7
Definir 5 RM = 3; FC = lqph; 0,00 0,04 0,05 7
Definir 5 RM = 3; FC = lqh; 0,00 0,04 1,32 5
Conjunto 5 0,00 0,04 1,34 5
0,00 0,02 1,78 5

atender a esse requisito conforme necessário. avalia cada modelo candidato em três dimensões: (1) significância estatística, com
base na área característica de operação do receptor parcial sob a razão da curva
(usamos uma taxa de omissão admissível deE =5%; VejoPeterson et al., 2008); (2)
2.3. Teste exaustivo de todas as combinações de variáveis
desempenho preditivo, em termos de erro de omissão derivado de subconjuntos
aleatórios independentes de dados de ocorrência e limites mínimos de presença
Procuramos criar um exercício exaustivo de seleção de modelos,
de treinamento ajustados para permitir E =5% entre os dados de calibração (
incluindo diversas combinações de valores multiplicadores de regularização
Anderson et al., 2003); e (3) ajuste e simplicidade do modelo, em termos de AICc,
(0,1–1 em intervalos de 0,1 e 2–5 em intervalos de 1) e tipos de recursos
conforme adaptado e implementado para Maxent porWarren e Seifert (2011). No
(todas as 29 combinações potenciais de linear, quadrática, produto, limite e
kuenm, os modelos ótimos são selecionados como aqueles que são
dobradiça), com todas as combinações possíveis das variáveis ambientais
estatisticamente significativamente melhores do que os aleatórios em suas
incluídas em cada modelo (consultetabela 1). Este exercício foi possível
previsões de subconjuntos independentes de dados de ocorrência (ou seja, P≤ .
graças ao pacote kuenm R (Cobos et al., 2019), em que foram criadas
05), mostram baixo erro de omissão (ou seja, taxa de falso-negativo≤E),e estão
combinações de variáveis ambientais em grupos de dois ou mais
dentro de 2 unidades AICc do valor mínimo AICc entre os modelos
preditores. Kuenm é uma plataforma ideal para tais análises, pois

3
ME Cobos, et ai.

Tabela 3
Resumo de dados de espécies e resultados de seleção de variáveis com métodos heurísticos e exaustivos. PorPan trogloditas,apenas 3 das 61 configurações selecionadas com a abordagem exaustiva são apresentadas, consulte o material complementar Tabela S2.

Espécies Métodos para selecionar variáveis ambientais

Importância variável Importância variável Canivete Variável máxima Inflação de variação Como impulsionar a regressão Índice de flutuação Calibração exaustiva
(percentagem) (permutação) seleção fator árvore

Aedes notoscriptus Tudo Tudo PCs: 1, 2, 3 e 8 Computadores: 1–3 Computadores: 3–9 Todos menos PCs 4, 7 Todos menos o PC 9 PCs: 1, 2, 3, 5, 7, 9 PCs: 1,
2, 3, 5, 6, 9 PCs: 1, 2, 3, 4,
5, 7, 9 Bioclim: 2, 5, 6, 16 ,
Amblyomma americanum Tudo Tudo Bioclim: 5, 6, 16, 17 Bioclim: 2, 5, 6, 17 Bioclima: 16, 17 Tudo Todos menos Bioclim 16 17 Bioclim: 2, 3, 5, 15, 16
Cyanoderma ruficeps Tudo Tudo Bioclim: 1, 2, 5, 7, 16, Bioclim: 1, 2, 5, 7, 15, Bioclima: 16, 17 Todos menos Bioclim 7 Todos menos Bioclim 5 Bioclim: 1, 2, 3, 5, 15, 16
17 17 PCs: 1, 4, 5
Heteroglaux blowitti Tudo Tudo Computadores: 1–4 PCs: 2–4, 6 Tudo PC: 2–4, 6 Todos menos o PC 7

Computadores: 1, 4, 5, 7

Ixodes ricinus Tudo Tudo Bioclim: 6, 7, 14, 16 Bioclim: 2, 6, 7, 14 Bioclim 15 Todos menos Bioclims 2, 13 Todos menos Bioclim 2 Bioclim: 2, 7, 13, 15, 16
MERS Tudo Tudo Todos, exceto PC 5 PCs: 1–5 Tudo Todos Todos menos PC 5 PCs: 1, 2, 4

4
Computadores: 1, 2, 3, 4

Pan trogloditas Tudo Tudo PCs: 1, 3–7 PCs: 1–3, 6 Tudo todos menos o PC 5 Tudo Computadores: 1, 2, 4

Computadores: 3, 4, 7, 8

Computadores: 3, 4, 8

Peltophryne empusa Todos menos Bioclim 7 Todos menos Bioclim: 7, 17 Bioclima: 3, 5, 16 Bioclima: 3–6, 17 Bioclima: 5, 16, 17 Tudo Todos menos Bioclim 17 Bioclima: 3, 6
Bioclim: 3, 6, 16
Phytotoma raimondii Tudo Tudo Bioclima: 4, 12 Bioclima: 1, 4, 7, 12, Bioclim: 7, 12, 15, 17 Todos menos Bioclim 17 Todos menos Bioclim 15 Bioclim: 1, 7, 15, 17
15
Biótico 2 Biótico: 1, 2 Biótico 2
Streptopelia decaocto Tudo Tudo Todos menos o PC 3 Tudo Tudo Tudo Todos menos o PC 5 Computadores: 1, 2, 3

Espécie virtual 1 Tudo Tudo Todos menos Bioclim 3 Todos menos Bioclim 16 Bioclima: 16, 17 Tudo Todos menos Bioclim 3 Bioclim: 5, 6, 16
Bioclim: 2, 5, 6, 16, 17
Espécies virtuais 2 Tudo Tudo Todos menos Bioclim 5 Tudo Bioclima: 16, 17 Tudo Todos menos Bioclim 2 Bioclim: 6, 16
Bioclim: 6, 16, 17
Bioclim: 5, 6, 16, 17

Bioclim= Variáveis bioclimáticas do banco de dados WorldClim (Hijmans et al., 2005). Os números correspondem à ordem das variáveis originais.
Biótica = Variáveis construídas com base na adequação para outras espécies que interagem significativamente com a espécie de interesse (verAtauchi et al., 2018).
PCs =Componentes principais derivados de variáveis bioclimáticas e, apenas paraPan trogloditas,a partir de produtos multitemporais do índice de vegetação por diferença normalizada (NDVI) do MODIS.
Informática Ecológica 53 (2019) 100983
ME Cobos, et ai. Informática Ecológica 53 (2019) 100983

Figura 1.Resumo de concordância e discordância entre sete abordagens heurísticas e um exame exaustivo na seleção de variáveis ambientais para modelos de nicho
ecológico para 10 estudos de exemplo e duas espécies virtuais. VI = importância variável; Maxent Var Sel = abordagem de seleção de variável maxent; VIF = abordagem do
fator de inflação da variância; BRT = impulsionando árvores de regressão; FI = índice de flutuação.

que são significativos e de alto desempenho (Cobos et al., 2019). Focamos nossa conjuntos de dados ambientais identificados heuristicamente com aqueles
análise nas variáveis ambientais utilizadas nos modelos ótimos, baseados nos conjuntos e parâmetros de dados ambientais exaustivamente
independentemente dos valores escolhidos para as outras duas configurações de identificados. Ou seja, uma vez que o pacote kuenm identificou o melhor modelo
parâmetros exploradas. globalmente e avaliou todos os possíveis modelos candidatos, e uma vez que as
abordagens heurísticas identificaram seus conjuntos de variáveis ambientais,
usamos os resultados da avaliação kuenm para identificar os melhores valores de
2.4. Análise de dados e comparações
parâmetro para os conjuntos de variáveis heuristicamente escolhidos, e produziu
modelos Maxent sob esses valores de parâmetro, com saídas brutas, para todos
Resumimos a coincidência e a não coincidência entre os conjuntos de variáveis
os modelos (a única exceção foiIxodes ricinus,para o qual o método VIF selecionou
ambientais escolhidos nas análises heurística e exaustiva de duas maneiras.
apenas uma variável - para esse caso, foram usadas as configurações padrão no
Primeiro, avaliamos a inclusão e exclusão de variáveis nas abordagens
Maxent). Para permitir comparações entre os modelos, escalamos os resultados
heurísticas em termos da proporção das variáveis 'corretas' não incluídas, e a
de cada método subtraindo a média de todos os valores e multiplicando os
razão entre o número de variáveis incluídas inadequadamente e o número de
resultados por 100.000. Em seguida, produzimos mapas de diferenças entre os
variáveis no conjunto ótimo de variáveis. Representando graficamente essas
mapas heurísticos e exaustivos, como forma de detectar overfitting (ou seja,
duas dimensões de coincidência e não-coincidência, pode-se avaliar
valores previstos muito baixos) e underfitting (ou seja, valores previstos muito
qualitativamente quão próximos os conjuntos de variáveis escolhidos
altos). Para representar graficamente o overfitting e underfitting, criamos
heuristicamente estavam daqueles escolhidos nas análises exaustivas.
histogramas de valores de pixels de mapas de diferenças entre as camadas
Em segundo lugar, comparamos os modelos produzidos em ENMs derivados de Maxent
heurística e exaustiva. Por fim, para as duas espécies virtuais, avaliamos
com base em conjuntos de parâmetros ótimos escolhidos em kuenm com base no

5
ME Cobos, et ai. Informática Ecológica 53 (2019) 100983

Figura 2.Exemplo de padrões geográficos de diferença de modelo entre o conjunto de variáveis escolhido por seis abordagens heurísticas (as duas abordagens de “importância
variável” identificaram as mesmas variáveis) paraAedes notoscriptus (Peterson e Campbell, 2015). As áreas azuis representam áreas nas quais a abordagem heurística previu muito
amplamente, enquanto as áreas vermelhas são aquelas para as quais a abordagem heurística subestimou a adequação. (Para interpretação das referências à cor nesta legenda da
figura, o leitor deve consultar a versão web deste artigo.)

o grau de coincidência e não coincidência entre o verdadeiro conjunto de 3. Resultados


variáveis com pesos diferentes de zero no verdadeiro nicho e as variáveis
selecionadas pelos métodos heurístico e exaustivo. As buscas exaustivas para cada um dos 12 casos de exemplo renderam
entre um e 61 “melhores” modelos – este último caso, o dePan trogloditasno
Parque Nacional do Sapo na Libéria, caracterizado em relação

6
ME Cobos, et ai. Informática Ecológica 53 (2019) 100983

Fig. 3.Histogramas de frequência resumindo os desvios de valores de adequação entre abordagens heurísticas e exaustivas para seleção de variáveis em 12 exemplos de modelos de nicho ecológico.
Os valores de adequação foram redimensionados subtraindo a média de todos os valores e multiplicando os resultados por 100.000 para permitir comparações entre os modelos.

índices de vegetação multitemporal, foi um outlier, pois o segundo maior número foram deixados de fora da lista heurística, e 10-30% das variáveis na
de melhores modelos foi quatro (Aedes notoscriptus, Peltophryne empusa; mesa 2 lista heurística foram incluídas mesmo que não estivessem na lista
, Tabela S1). As abordagens heurísticas invariavelmente identificaram diferentes exaustiva (Figura 1, Tabela S3).
conjuntos de variáveis ambientais – de fato, de 12 casos de exemplo × 7 Comparando os modelos baseados nos testes exaustivos com aqueles
abordagens heurísticas, as abordagens heurísticas escolheram o conjunto “certo” identificados heuristicamente, as áreas de overfitting e underfitting foram
de variáveis ambientais (ou seja, aquele selecionado também pela abordagem evidentes. PorAedes notoscriptus (Figura 2), medidas de importância variável e
exaustiva) em apenas três casos (canivetee flíndice de flutuação abordagens para modelos de overfit de abordagens jackknife no norte da Austrália; em contraste, a
MERS, e flíndice de flutuaçãopara a espécie virtual 1; Tabela 3, Tabela S2). Em seleção variável Maxent e o VIF aproximam-se do overfit no leste da Austrália, mas
todos os outros casos, a combinação ideal de variáveis ambientais não foi underfit no norte da Austrália (veja mapas de comparações semelhantes para
identificada pelas abordagens heurísticas - na maioria dos casos, > 20% das outras espécies em material suplementar). No geral, cada espécie apresentou
variáveis na lista exaustiva diferentes distribuições características de níveis de excesso e

7
ME Cobos, et ai. Informática Ecológica 53 (2019) 100983

Fig. 3. (contínuo)

sub-ajuste (Fig. 3), comAmblyomma americano,MER, ePan trogloditas 4. Discussão


mostrando a maior variação entre os conjuntos de variáveis
heuristicamente identificados. Na extensa e extensa literatura sobre metodologia para modelagem de
Para as espécies virtuais, nenhum dos métodos heurísticos ou exaustivos de seleção nicho ecológico e as ferramentas relacionadas à modelagem de distribuição
de variáveis identificou o conjunto exato de variáveis com pesos diferentes de zero de espécies, uma questão que tem recebido surpreendentemente pouca
para as espécies virtuais (o VIF identificou esse conjunto corretamente apenas para a atenção é a escolha das dimensões ambientais para análise. Embora outras
espécie virtual 1). O método exaustivo, no entanto, identificou modelos estatisticamente configurações de parâmetros tenham sido objeto de análises detalhadas (
significativos e de baixa omissão com conjuntos de variáveis correspondendo Anderson e Gonzalez, 2011;Radosavljevic e Anderson, 2014;Warren et al.,
exatamente àquelas com pesos diferentes de zero para as duas espécies virtuais. Esses 2014) ou de avanços metodológicos que facilitam a escolha do valor do
modelos, no entanto, não atenderam ao critério de complexidade (Δvalor AICc < 2), razão parâmetro (Mazzoni et al., 2015;Muscarella et al., 2014;Warren e Seifert,
pela qual não fizeram parte dos modelos selecionados durante as rotinas de calibração 2011), a escolha das variáveis ambientais continua sendo feita “pela arte”,
usando kuenm (verDiscussão). em grande parte. Ou seja, a escolha de quais variáveis ambientais é por
preferência pessoal, e a escolha da metodologia para redução de

8
ME Cobos, et ai. Informática Ecológica 53 (2019) 100983

dimensionalidade é através de vários métodos, com pouca orientação disponível com base no conhecimento da biologia e história natural das espécies.
sobre qual é o melhor. Os poucos estudos publicados nesse sentido (por exemplo, Certamente, incluir vários conjuntos de variáveis ambientais na calibração do
Guisan et al., 2002;Guisande et al., 2017;Jueterbock et al., 2016;Peterson e Cohoon, modelo permite explorar os efeitos de conjuntos específicos de variáveis e
1999) antecedem ou negligenciam o advento das abordagens de seleção de valores de parâmetros para aumentar o poder de previsão e reduzir a
modelos no campo e, portanto, estão bastante fora de sincronia com os métodos complexidade do modelo. Embora nossa abordagem exaustiva para seleção de
atuais no campo. variáveis seja atualmente implementada apenas em Maxent, abordagens
As análises que apresentamos aqui oferecem uma alternativa, na qual se semelhantes podem ser desenvolvidas para outros algoritmos.
inspeciona o desempenho de todas as combinações possíveis de variáveis
ambientais, em combinação com os diferentes conjuntos de valores para Reconhecimentos
outros parâmetros de interesse. Nossa exploração de abordagens
heurísticas mostra que nenhuma das heurísticas consegue identificar o Os autores agradecem ao grupo Ecological Niche Modeling da University
conjunto ótimo global de dimensões ambientais, de modo que defendemos of Kansas por fornecer conjuntos de dados e incentivo. Agradecimentos
o uso de buscas exaustivas. A metodologia é atraente na medida em que especiais a J. Soberón por sua ajuda na execução de modelos logísticos
avalia todas as combinações de parâmetros, embora seja complicada, pois a ponderados do tipo Maxent.
carga computacional aumenta drasticamente à medida que o número de
camadas ambientais é elevado - isso não equivale a uma suposição de que a Financiamento

distribuição real foi estimada, mas sim que o conjunto de modelos que
preveem com significância estatística e alto desempenho, e que pontuam Daniel Jiménez-García foi financiado pelo Fulbright Visiting Scholar
bem no critério de informação Akaike, podem ser identificados. Ou seja, com Program - Senior Scholar. Luis Osorio-Olvera foi parcialmente financiado
conjuntos razoáveis de valores potenciais de parâmetros como pelo CONACyT-FORDECyT 273646 e PAPIIT-UNAM IN116018 (2018).
multiplicador de regularização (14 valores) e tipos de resposta (29 valores),
somando um fator de 5, 10, 15 ou mais variáveis ambientais (todas as Apêndice A. Dados Suplementares
combinações de variáveis sendo 26, 1013 , e 32752, para 5, 10 e 15
variáveis, respectivamente) equivale a um grande número de modelos que Dados complementares a este artigo podem ser encontrados on-line em
precisam ser criados e avaliados, o que pode ser desafiador e até proibitivo https://doi.org/10.1016/j.ecoinf.2019.100983.
em alguns casos.
Uma estratégia possível seria usar uma passagem relativamente grosseira Referências
com menos valores de multiplicador de regularização e tipos de recursos, mas
incluindo todas as combinações das variáveis ambientais de interesse, seguidas Alkishe, AA, Peterson, AT, Samy, AM, 2017. Influências das mudanças climáticas no po-
de uma segunda passagem com testes de resolução mais fina em uma região distribuição geográfica potencial do carrapato vetor da doençaIxodes ricinus.PLoS One 12,
e0189092.https://doi.org/10.1371/journal.pone.0189092.
focal do espaço paramétrico. Por exemplo, uma primeira etapa testaria todas as Anderson, RP, Gonzalez, I., 2011. O ajuste específico da espécie aumenta a robustez ao sam-
combinações de variáveis e tipos de recursos com algum conjunto grosseiro de viés de pling em modelos de distribuição de espécies: uma implementação com Maxent. Eco
multiplicadores de regularização (por exemplo, 0,1, 0,5, 1, 2,5, 5), e a segunda Modelo. 222, 2796-2811.https://doi.org/10.1016/j.ecolmodel.2011.04.011. Anderson, RP,
Lew, D., Peterson, AT, 2003. Avaliando modelos preditivos de espécies'
etapa testaria mais multiplicadores de regularização em intervalos mais finos de
distribuições: critérios para a seleção de modelos ótimos. Eco Modelo. 162, 211-232.
0,1. Embora essa abordagem possa ser útil e atraente, ela pode ser confundida se https://doi.org/10.1016/S0304-3800(02)00349-6.
várias áreas disjuntas do espaço de parâmetros provarem ser igualmente boas em Araújo, MB, Guisan, A., 2006. Cinco (mais ou menos) desafios para modelagem de distribuição de espécies.
J. Biogeogr. 33, 1677-1688.https://doi.org/10.1111/j.1365-2699.2006.01584.x.
termos de análises de seleção de modelos.Cobos et al., 2019)—como tais situações
Atauchi, PJ, Peterson, AT, Flanagan, J., 2018. Modelos de distribuição de espécies para o Peru
de soluções múltiplas e não semelhantes foram observadas (Ramírez-Gil et al., Plantcutter melhora com a consideração de interações bióticas. J. Avian Biol. 49,
2018), essa abordagem de várias passagens deve ser usada com cautela. jav-01617.https://doi.org/10.1111/jav.01617.
Brauner, N., Shacham, M., 1998. Papel do alcance e precisão da variável independente
Talvez uma preocupação mais profunda com a abordagem exaustiva de
na regressão dos dados. AICHE J. 44, 603-611.https://doi.org/10.1002/aic.
seleção de modelos como exploramos aqui seja a qualidade e a confiabilidade das 690440311.
medidas de AICc que foram derivadas para aplicações de modelagem de nicho Cerasoli, F., Iannella, M., D'Alessandro, P., Biondi, M., 2017. Comparando pseudo-ausências
técnicas de geração em modelos Boosted Regression Trees para fins de conservação: um
ecológico (Warren e Seifert, 2011). Ou seja, os autores dessa derivação a
estudo de caso sobre anfíbios em uma área protegida. PLoS One 12, e0187589.https://doi.
ofereceram apenas como uma aproximação, e indicaram que sua aproximação org/10.1371/journal.pone.0187589.
AIC não incorporou bondade de ajuste, como uma medida AIC robusta em Cobos, ME, Peterson, AT, Barve, N., Osorio-Olvera, L., 2019. kuenm: um pacote R para
exercícios de modelagem de dados deveria, mas ofereceu uma opção mais desenvolvimento detalhado de modelos de nicho ecológico usando Maxent. PeerJ 7,
e6281. https://doi.org/10.7717/peerj.6281.
orientada para avaliar a capacidade de prever, como em exercícios algorítmicos. Duan, R.-Y., Kong, X.-Q., Huang, M.-Y., Wu, G.-L., Wang, Z.-G., 2015. SDMvspecies: a
Como consequência, em nosso recente desenvolvimento do pacote kuenm R, software para criação de espécies virtuais para modelagem de distribuição de espécies. Ecografia 38,
avaliamos os modelos candidatos em termos de significância estatística, 108-110.https://doi.org/10.1111/ecog.01080.
Dubois, DM, 1973. Um índice de flutuações, relacionado com diversidade e estabilidade de
desempenho preditivo e AICc, todos em conjunto (e nessa ordem), o que evita
ecossistemas: Aplicações no modelo Lotka-Volterra e na distribuição experimental
alguns dos problemas que observamos com o uso de AICc sozinho (Peterson et al., de espécies. In: Rapport de sythèse III, Program National Sur l'environment
2018). O desenvolvimento completo de uma medida AIC robusta para modelagem Physique et Biologique Mer. Comissão Interministérielle de La Politique
Scientifique. Liège, Projeto.
de nicho ecológico representa, portanto, uma prioridade significativa para o
Elith, J., Leathwick, JR, Hastie, T., 2008. Um guia de trabalho para árvores de regressão impulsionadas. J.
campo. Anim. Eco 77, 802-813.https://doi.org/10.1111/j.1365-2656.2008.01390.x. Fan, JY,
Em suma, apresentamos aqui uma abordagem detalhada do desafio de Zhao, NX, Li, M., Gao, WF, Wang, ML, Zhu, GP, 2018. Quais são os melhores
preditores do potencial invasivo de plantas daninhas? Avaliações de transferibilidade de previsões de
selecionar variáveis ambientais para modelagem de nicho ecológico. Nossa
modelos com base em diversos conjuntos de dados ambientais paraFlaveria bidentis.Erva Res. 58,
abordagem é, em termos mais amplos, de “força bruta”, na qual simplesmente 141-149.https://doi.org/10.1111/wre.12292.
inspecionamos todas as combinações possíveis das variáveis ambientais, em Fithian, W., Hastie, T., 2013. Equivalência de amostra finita em modelos estatísticos para presença-
apenas dados. Ana Aplic. Estado. 7, 1917-1939.https://doi.org/10.1214/13-AOAS667. Freeman, B.,
combinação com todas as combinações de outros parâmetros que precisam ser
Roehrdanz, PR, Peterson, AT, 2018. Modelagem de mamíferos ameaçados de extinção
explorados. Uma alteração prática, que incorporamos em nossas explorações, é distribuição de espécies e conectividade florestal em toda a floresta úmida de terras baixas
que primeiro se remove um de cada par de variáveis que apresenta altas da Alta Guiné da África Ocidental. Biodivers. Conserv.https://doi.org/10.1007/s10531-018-
correlações em valores - esses pares são efetivamente não independentes e, em 01684-6.
García-Roselló, E., Guisande, C., González-Dacosta, J., Heine, J., Pelayo-Villamil, P.,
altas correlações, são redundantes. Essa redução inicial ainda é carregada de Manjarrás-Hernández, A., Vaamonde, A., Granado-Lorencio, C., 2013. ModestR: uma
suposições, mas deve ter apenas implicações menores se o critério de correlação ferramenta de software para gerenciar e analisar bancos de dados de mapas de distribuição
for suficientemente alto; recomendamos que as decisões sobre qual variável de espécies. Ecografia 36, 1202-1207.https://doi.org/10.1111/j.1600-0587.2013.00374.x.
Guisan, A., Edwards, TC, Hastie, T., 2002. Linear generalizado e aditivo generalizado
manter fora desses pares correlacionados sejam

9
ME Cobos, et ai. Informática Ecológica 53 (2019) 100983

modelos em estudos de distribuição de espécies: definindo o cenário. Eco Modelo. Biogeografia 17, 135-144.https://doi.org/10.1111/j.1466-8238.2007.00347.x. Peterson, AT,
157, 89-100.https://doi.org/10.1016/S0304-3800(02)00204-1. Papeş,M., Soberón, J., 2008. Repensando a característica de operação do receptor
Guisande, C., Barreiro, A., Vaamonde, A., 2011. Tratamiento de Datos Con R. Statistica Y aplicações de análise em modelagem de nicho ecológico. Eco Modelo. 213, 63-72.https://
SPSS, Díaz de Santos, Madrid. doi.org/10.1016/j.ecolmodel.2007.11.008.
Guisande, C., García-Roselló, E., Heine, J., González-Dacosta, J., Vilas, LG, García Pérez, Peterson, AT, Cobos, ME, Jiménez-García, D., 2018. Principais desafios para a correlação
BJ, Lobo, JM, 2017. SPEDInstabR: algoritmo baseado em índice de flutuação para seleção de projeções de modelos de nicho ecológico para condições climáticas futuras. Ana NY Acad.
preditores em modelagem de distribuição de espécies. Eco Inf. 37, 18-23. Hijmans, RJ, 2019. Sci. 1429, 66-77.https://doi.org/10.1111/nyas.13873.
Raster: Análise e Modelagem de Dados Geográficos. Versão do pacote R Petitpierre, B., Broennimann, O., Kueffer, C., Daehler, C., Guisan, A., 2017. Seleção
2.9-5.https://CRAN.R-project.org/package=raster. preditores para maximizar a transferibilidade de modelos de distribuição de espécies: lições
Hijmans, RJ, Cameron, SE, Parra, JL, Jones, PG, Jarvis, A., 2005. de invasões de plantas intercontinentais. Globo. Eco Biogeografia 26, 275-287.https://
solução interpolou superfícies climáticas para áreas terrestres globais. Int. J. Climatol. doi.org/ 10.1111/geb.12530.
25, 1965-1978.https://doi.org/10.1002/joc.1276. Phillips, SJ, Anderson, RP, Schapire, RE, 2006. Modelagem de entropia máxima de espécies
Hijmans, RJ, Phillips, S., Leathwick, J., Elith, J., 2015. Dismo: Distribuição de Espécies distribuições geográficas. Eco Modelo. 190, 231-259.https://doi.org/10.1016/j.
Modelagem. Versão do Pacote R 1. pp. 0–12. ecomodel.2005.03.026.
Hosner, PA, Liu, H., Peterson, AT, Moyle, RG, 2015. Repensando a filogeografia R Core Team, 2018. R: Uma linguagem e ambiente para computação estatística. R
estrutura e refúgio histórico no tagarela de rufoCyanoderma ruficepsà luz de Fundação para Computação Estatística, Viena, Áustria.
amostragem genética ampla e reconstruções paleodistribucionais. atual Zool. 61, Radosavljevic, A., Anderson, RP, 2014. Fazendo melhores modelos Maxent de distribuição de espécies
901-909.https://doi.org/10.1093/czoolo/61.5.901. tributações: complexidade, overfitting e avaliação. J. Biogeogr. 41, 629-643.https://
Ingenloff, K., Hensz, CM, Anamza, T., Barve, V., Campbell, LP, Cooper, JC, Komp, E., doi.org/10.1111/jbi.12227.
Jimenez, L., Olson, KV, Osorio-Olvera, L., Owens, HL, Peterson, AT, Samy, AM, Simões, Raghavan, RK, Peterson, AT, Cobos, ME, Ganta, R., Foley, D., 2019. Atual e fu-
M., Soberón, J., 2017. Dinâmica de invasão previsível em populações norte- distribuição do Lone Star Tick,Amblyomma americanum (L.) (Acari: Ixodidae) na
americanas da Eurásia pomba de colarinhoStreptopelia decaocto.Proc. R. Soc. B 284, América do Norte. PLoS One 14, e0209082.https://doi.org/10.1371/journal.pone.
20171157.https://doi.org/10.1098/rspb.2017.1157. 0209082.
Jathar, G., Patil, D., Kalra, M., De Silva, T., Townsend Peterson, A., Irfan-Ullah, M., Ramírez-Gil, JG, Morales, JG, Peterson, AT, 2018. Geografia potencial e pro-
Rahmani, AR, Mehta, P., Kulkarni, J., 2015. Mapeando a distribuição potencial do produtividade de cultivos de abacate “Hass” na Colômbia estimada por modelagem de
Forest Owlet criticamente ameaçadoHeteroglaux blowittina Índia. J. Bombay Nat. nicho ecológico. Sci. Hortico. 237, 287-295.https://doi.org/10.1016/j.scienta.2018.04.021.
Hist. Soc. 112, 55.https://doi.org/10.17087/jbnhs/2015/v112i2/104924. Jueterbock, A., Reeves, T., Samy, AM, Peterson, AT, 2015. Geografia e ecologia do MERS-CoV no
Smolina, I., Coyer, JA, Hoarau, G., 2016. O destino das algas marinhas do Ártico Oriente Médio: análises de exposições de camelos relatadas e um mapa de risco preliminar.
Fucus distichussob as mudanças climáticas: uma abordagem de modelagem de nicho ecológico. Eco BMC Res. Notas 8.https://doi.org/10.1186/s13104-015-1789-1.
Evoluir 6, 1712-1724.https://doi.org/10.1002/ece3.2001. Velasco, JA, González-Salazar, C., 2019. O critério de informação de Akaike não deve ser um
Mazzoni, S., Halvorsen, R., Bakkestuen, V., 2015. MIAT: R-wrappers modulares para flexíveis “teste” de precisão de predição geográfica na modelagem de nicho ecológico. Eco
implementação de modelagem de distribuição MaxEnt. Eco Inf. 30, 215-221.https:// Inf. 51, 25-32.https://doi.org/10.1016/j.ecoinf.2019.02.005.
doi.org/10.1016/j.ecoinf.2015.07.001. Warren, DL, Seifert, SN, 2011. Modelagem de nicho ecológico em Maxent: a importância da
Muscarella, R., Galante, PJ, Soley-Guardia, M., Boria, RA, Kass, JM, Uriarte, M., complexidade do modelo e o desempenho dos critérios de seleção do modelo. Eco Aplic.
Anderson, RP, 2014. ENMeval: um pacote R para realizar avaliações espacialmente 21, 335-342.https://doi.org/10.1890/10-1171.1.
independentes e estimar a complexidade ideal do modelo para modelos de nicho ecológico Warren, DL, Glor, RE, Turelli, M., 2010. ENMTools: uma caixa de ferramentas para estudos comparativos
Maxent. Métodos Eco. Evoluir 5, 1198-1205.https://doi.org/10.1111/2041-210X. 12261. de modelos de nicho ambiental. Ecografia 33, 607-611.https://doi.org/10.1111/j.
1600-0587.2009.06142.x.
Peterson, AT, Campbell, LP, 2015. Distribuição potencial global do mosquitoAedes Warren, DL, Wright, AN, Seifert, SN, Shaffer, HB, 2014. Incorporando o modelo de com-
notoscriptus,uma nova espécie exótica nos Estados Unidos. J. Vector Eco. 40, 191-194. plexidade e viés de amostragem espacial em modelos de nicho ecológico de riscos de mudança climática
https://doi.org/10.1111/jvec.12151. enfrentados por 90 espécies de vertebrados da Califórnia de interesse. Mergulhadores. Distribuir 20, 334-343.
Peterson, AT, Cohoon, KP, 1999. Sensibilidade de algoritmos de predição de distribuição para https://doi.org/10.1111/ddi.12160.
integridade dos dados geográficos. Eco Modelo. 117, 159-164.https://doi.org/10.1016/ Wisz, MS, Hijmans, RJ, Li, J., Peterson, AT, Graham, CH, Guisan, A., 2008. Efeitos de
S0304-3800(99)00023-X. tamanho da amostra no desempenho de modelos de distribuição de espécies. Mergulhadores.
Peterson, AT, Nakazawa, Y., 2008. Conjuntos de dados ambientais são importantes no nicho ecológico Distribuir 14, 763-773.https://doi.org/10.1111/j.1472-4642.2008.00482.x.
Modelagem: um exemplo comSolenopsis invictaeSolenopsis richteri.Globo. Eco

10

You might also like