You are on page 1of 5

http://maisig.org.pt/Menu/Clusters.

htm

PADRÕES ESPACIAIS – CLUSTERS

A seguinte descrição é parte da ajuda incluída na ferramenta “Cluster Analyses” do software ArcGIS 9.3 da ESRI, disponibilizado nesta aplicação via “Web” e adaptado pelo NIDAMTE da Direcção-Geral de Administração Interna, em 2009.

• O resultado da análise de padrões espaciais (Clusters) e casos atípicos (Outliers) apresenta um indicador de associação/autocorrelação espacial Local de Moran (“Local Moran’s I”), o nível de significância observado (P-value), os valores do desvio padrão em relação à média (Z-score) e a tipologia de padrões (COType) para cada entidade do tema geográfico. • Esta função origina os seguintes resultados de saída com os seguintes nomes, a saber: L_Index, Z-score, P-value, e COType. • Os valores de Z-score e P-value são medidas de significância estatística que permitem aceitar ou rejeitar a hipótese nula, entidade por entidade num tema. Eles, na verdade, indicam se há similaridade aparente (ou dissimilaridade) nos valores de cada entidade e os seus vizinhos e se é maior do que seria de esperar numa distribuição aleatória. • O Z-score é baseado num processo de cálculo da distribuição aleatória da hipótese nula. Para obter mais informações sobre o Z-score, consulte: “Ver o que é o Z-score? Ver o que é o P-value?” • Numa entidade, um valor positivo e elevado de Z-score indica que as restantes entidades com proximidade geográfica têm valores semelhantes (ou valores elevados ou de baixo valor). O atributo COType indica se a entidade apresenta uma tipologia de cluster alta-alta (HH) para um nível de significância estatística (nível 0,05) de valores elevados e uma tipologia baixa-baixa (LL) para um nível de significância estatística (nível 0,05) de baixos valores. • Numa entidade, um valor negativo e baixo de Z-score indica um nível de significância estatística (nível 0,05) atípica. O atributo COType indica se a entidade apresenta valores elevados e proximidade geográfica com entidades com valores baixos, tipologia alta-baixa (HL), ou se a entidade apresenta valores baixos e proximidade geográfica com entidades com valores elevados, tipologia baixa-alta (LH). • Para uma entidade em linha ou polígono, há um cálculo geométrico real ao centróide dessa entidade. • O campo de entrada deve conter uma variedade de valores “não-negativos”. A matemática para essa estatística requer alguma variação na variável que se está a analisar; por exemplo, não pode ser resolvida se todos os valores de entrada forem iguais a 1 (um). Se o analista tiver uma base de dados de incidentes, e pretender analisar a intensidade dos incidentes, considere agregar os incidentes ou utilize a Integração com a ferramenta de Colecta de Eventos, antes de proceder à análise. • Sempre que utilizar temas geográficos (shapefiles), lembre-se que estes não podem armazenar valores nulos ou em branco. Ferramentas ou outros procedimentos que criam shapefiles com base numa tabela alfanumérica podem armazenar valores nulos ou interpretar estes como zero. Isto pode levar a resultados inesperados. • A Contextualização de relações espaciais utilizadas para a análise deve ser baseada na compreensão individual de interacções espaciais entre as entidades que estão a ser analisadas. • Opções para a contextualização da Distância Inversa (Inverse Distance): quando o valor de zero (0) entra para o parâmetro da “Distância de banda ou limiar de distância” (Distance Band or Threshold Distance), todas as entidades são consideradas vizinhas de todas as outras entidades; quando este parâmetro é deixado em branco, será

1 de 5

15/10/2013 20:51

org. Como Funciona a Análise de Padrões Espaciais e casos Atípicos: Índice Local de Moran por Anselin (Estatísticas Espaciais) Dando um conjunto de funcionalidades ponderadas. or Zone of Indifference) a quaisquer dois pontos que sejam coincidentes será dado um peso de 1 (um) de forma a evitar uma divisão por zero (0). os valores para distâncias menores que 1 (um) tornam-se instáveis. • Com a contextualização da distância inversa. a análise de Padrões e casos Atípicos identifica padrões de entidades com valores de magnitude similar. O Z-score e o P-value representam a significância estatística do índice calculado para cada valor. Esta operação assegura a não existência de entidades excluídas da análise. o P-value e um código que representa a tipologia de cluster/padrão para cada tipo de entidade. A ponderação de entidades separadas por menos de uma (1) unidade de distância (comum com o sistema de projecção de coordenadas geográficas).htm aplicado um limiar de distância predefinido. Inverse Distance Squared. • A análise sobre entidades com um sistema de projecção de coordenadas geográficas não é recomendada com quaisquer métodos de contextualização espacial baseados na distância inversa. Cálculos Os valores de P-value são aproximações numéricas da área sob a curva de uma distribuição conhecida. limitada pelo teste estatístico.pt/Menu/Clusters.http://maisig. a ferramenta calcula um valor de Índice Local de Moran. é dado um valor de 1 (um). o Z-score. • Quando a conceptualização espacial é um método de Distância Inversa (Inverse Distance. Para tal. “Ver o que é o Z-score? Ver o que é o P-value?” 2 de 5 15/10/2013 20:51 .

Z-score são medidas de desvio padrão. Volume 2. geografia política e demografia (entre outras). Ambas as estatísticas estão associadas a uma distribuição de padrão normal. Um valor negativo para “I” indica que a entidade está rodeada por entidades com diferentes valores. gestão dos recursos. “O que é o Z-score? O que é o P-value?” A maioria dos testes estatísticos começar por identificar uma hipótese nula. A tipologia de padrão espacial distingue-se entre uma significância estatística (nível 0. essencialmente afirma que não há padrão espacial entre as entidades. na área de estudo. As potenciais aplicações Podem ser aplicadas em economia. é interpretado como "2.5 desvios padrão em relação à média". se uma ferramenta dá um retorno de um Z-score positivo de 2. e um caso atípico onde um valor baixo é principalmente rodeado por valores elevados (LH). 27 (2): 93-115. Explicando de outra forma: o padrão esperado é apenas uma das muitas versões possíveis de uma completa aleatoriedade espacial. "Local Indicators of Spatial Association .ANSELIN.5.org. P-value são probabilidades. Esta distribuição diz respeito a desvios padrão com probabilidades que permitem uma significância e confiança que podem ser anexas a Z-score e P-value. A ESRI Guide to GIS Analysis. Andy. Essa entidade faz parte de um cluster/padrão.05) de padrão com valores elevados (HH).Mitchell. O P-value é a probabilidade de que o analista falsamente rejeitou a hipótese nula. fitogeografia. O índice Local de Moran só pode ser interpretado num contexto de cálculo do Z-score e do P-value “Ver o que é o Z-score? Ver o que é o P-value?”.http://maisig. Luc. ESRI Press. 3 de 5 15/10/2013 20:51 . . padrão de valores baixos (LL).pt/Menu/Clusters. Recursos adicionais: . Geographical Analysis. ou entre os valores associados às entidades.htm Interpretação Um valor positivo para o índice “I” indica que a entidade está rodeada por entidades com valores semelhantes. um caso atípico onde um valor elevado é rodeado principalmente por valores baixos (HL). 1995.LISA". Por exemplo. O Z-score é um teste de significância estatística que ajuda o analista a decidir se quer ou não rejeitar a hipótese nula. Essa entidade é um caso atípico. 2005. A hipótese nula para a ferramenta de análise de padrões.

http://maisig. Para rejeitar a hipótese nula.96 e +1.).. associados com valores muito baixos de P-value.4). Como exemplo.96 e +1. o analista deve fazer um julgamento subjectivo quanto ao grau de risco que está disposto a aceitar para estar errado.05. não podendo rejeitar a hipótese nula. As estatísticas inferenciais baseiam-se na teoria da probabilidade. é possível rejeitar a hipótese nula e prosseguir com a descoberta do que poderá estar a causar o padrão espacial de significância estatística. Índice Global de Moran. o padrão exibido é um padrão que poderia muito provavelmente ser uma versão de um padrão aleatório. Se o seu Z-score é entre -1..2 por exemplo). Este grau de risco é dado frequentemente em termos de valores críticos e / ou níveis de confiança. incluindo o tipo 4 de 5 15/10/2013 20:51 . A hipótese nula Muitas das estatísticas da caixa de ferramentas de estatísticas espaciais são técnicas de análise de padrões espaciais inferenciais (ou seja. pode perguntar: "Quais são as hipóteses de que os resultados de saída da minha sondagem (talvez mostrando o candidato “A” derrotando o candidato “B” por uma pequena margem) irá reflectir a preferência dos resultados finais?" Mas com muitas estatísticas espaciais. Quando executar uma análise de padrões por entidades que produz valores baixos de P-value e quer valores muito altos ou muito baixos (negativos) de Z-score. Probabilidade é uma medida de hipótese.htm Valores muito altos ou muito baixos (negativos) de Z-score. o P-value será maior do que 0. poderá estar a ver algo incomum e geralmente muito interessante.org.5 ou +5. para a ferramenta de análise de pontos / locais quentes “Hot Spot Analysis”. Por exemplo. isto indica que é muito improvável que o padrão observado é alguma versão do padrão teórico da aleatoriedade espacial representada pela hipótese nula. A ideia-chave aqui é que os valores que se apresentam no meio da distribuição normal (valores de Z-score de +0.96. Índice Local de Moran. Índice de Gini). Quando o valor absoluto do Z-score é elevado (no topo da distribuição normal) e as probabilidades são pequenas. Normalmente. Para dar um exemplo: os valores críticos de Z-score quando se utiliza um nível de confiança de 95% são de -1.19 ou -1. com a estatística tradicional (não-espacial / alfanumérica). subjacente a todos os testes estatísticos (directa ou indirectamente) são cálculos de probabilidade que avaliam o papel do acaso sobre os resultados da análise. representam o resultado esperado (a norma… geralmente desinteressante. o padrão apresentado é provavelmente muito incomum para ser apenas mais uma versão da aleatoriedade e o P-value será reduzido para reflectir essa situação. encontram-se na cauda da distribuição normal.96 desvios-padrão. O P-value associado a um nível de confiança de 95% é de 0.pt/Menu/Clusters. Neste caso. o analista trabalha com uma amostra aleatória e tenta determinar a probabilidade da sua amostra de dados ser uma boa representação da população em geral (é reflectivo).05. "pouco usual" tanto quer dizer um local quente ou um local frio com significância estatística. Se o Z-score ficar fora desse intervalo (por exemplo -2.

Aleatoriedade da hipótese nula postula que a observação do padrão espacial dos dados representa um dos muitos (n) possíveis arranjos espaciais. Catmog 47. 1986 Para qualquer esclarecimento contacte através do número +351 21 394 71 02 ou através do seguinte endereço electrónico: NIDAMTE@dgai. The ESRI Guide to GIS Analysis.F.Todos os direitos reservados Avisos Legais 5 de 5 15/10/2013 20:51 . M. Se pudesse retirar os valores dos seus dados e colocá-los nas entidades da sua área de estudo. já não voltará a ter uma estimativa. A normalização da hipótese nula postula que os valores observados derivam de um grande infinito. muitas possibilidades de uma amostragem aleatória. muitas possibilidades de versões completas de aleatoriedade espacial. Volume 2. a maior parte do tempo iria ser produzido um padrão que não seria significativamente diferente do padrão observado (os dados reais).htm de estatísticas de autocorrelação espacial listadas acima. Geo Books. A aleatoriedade da hipótese afirma que se o analista pudesse fazer esta operação sistematicamente e vezes sem conta (retirá-los e colocá-los). os atributos de cada secção e subsecção estatística. Então o que se pode fazer no caso de ter todos os valores de dados para uma área de estudo? Poderá avaliar as probabilidades de postular. Statistics in Geography. Os valores dos dados são fixos. é a normalização da hipótese nula. A normalização da hipótese nula afirma que os valores representam uma amostra das muitas possibilidades de valores. Se o analista pudesse colocar os dados observados numa curva normal e em seguida seleccionasse aleatoriamente valores para colocar na área de estudo. A normalização da hipótese nula afirma que os dados e a sua organização são uma das muitas. que os seus dados espaciais. Você tem um acontecimento / uma ocorrência. Se for caso disso. • Mitchell. Spatial Autocorrelation. muitas. através da hipótese nula. não faz mais sentido falar de "semelhança" ou "probabilidades". são na realidade. Blackwell. 1985. por exemplo) para toda a população. parte de uma grande população.org. normalmente distribuídos através de alguns valores da população num processo de amostragem aleatória. e assim por diante). David. 2005. A aleatoriedade da hipótese nula afirma que os dados em análise são uma das muitas.http://maisig. Consequentemente.pt 2011 © DGAI / NIDAMTE . acidentalmente. muitas. De vez em quando.mai. Recursos adicionais: • Ebdon. a maior parte do tempo iria produzir um padrão e uma distribuição de valores que não seriam significativamente diferentes do padrão observado / distribuição (os dados reais).pt/Menu/Clusters. Uma alternativa comum à hipótese nula. não implementada na caixa de ferramentas de estatísticas espaciais. ESRI Press. • Goodchild. Quando faz um cálculo estatístico (a média. Andy. Nem os dados.gov. teria possivelmente um arranjo espacial. Com uma amostra diferente obtém-se valores diferentes. nem os seus valores apresentam um arranjo espacial fixo. muitas vezes trabalha-se com todos os dados disponíveis para a área de estudo (todos os crimes. as ferramentas da caixa de ferramentas de estatísticas espaciais utilizam a aleatoriedade da hipótese nula como base para testar a significância estatística.. todas os casos de doenças. poderá enviar todos os valores mais elevados para uma área específica da sua área de estudo. mas as probabilidades de tal acontecer são muito reduzidas. mas ainda assim se espera que os valores sejam representativos de uma maior distribuição. A normalização da hipótese nula só é adequada quando os valores dos dados apresentam uma distribuição normal. apenas pode variar o seu arranjo espacial.