Esta resposta descreve um método objetivo para medir discrepâncias arbitrárias entre dois conjuntos de dados espaciais. Essas discrepâncias podem incluir mudanças de posição, mudanças de forma e recursos presentes em um conjunto de dados, mas não em outro. Essa resposta não fornece meios para determinar qual é "melhor", porque isso depende de muito mais do que apenas os dados e depende particularmente de para que os dados serão usados.
fundo
Uma boa base para um grande conjunto de tais medidas depende da transformação da distância euclidiana de cada conjunto de dados. Isso visualiza cada conjunto de dados como representando uma coleção de pontos no plano. Vamos chamar essas coleções de B para os recursos azuis e R para os recursos vermelhos.
Para qualquer ponto x no plano, a distância Euclidiana transformar de um conjunto de pontos A calcula a maior limite inferior das distâncias entre x e A . Podemos pensar esta transformação como a criação de uma "superfície", cuja altura x é igual a menor distância x para A . Assim, esta superfície tem vales em todos os pontos de um , em que a sua altura é igual a zero, e sobe na proporção de 1: 1 declive longe de um . É claro que a transformação de distância, por sua vez, determina A (ou tecnicamente seu fechamento métrico , que para os conjuntos de dados GIS é o mesmo que A) como o conjunto de todos os pontos a uma altura de zero. Assim, a transformação de distância captura completamente todas as informações espaciais de A que o GIS é capaz de representar.
Esta figura mostra as transformações de distância de B (à esquerda) e R (à direita) em pseudo-relevo.
Comparando dois conjuntos de dados
Para comparar B e R , sobreponha cada um à transformação de distância da outra:
Os valores da distância são mostrados como cores graduadas de azuis (próximo de 0) a vermelhos.
O mapa da esquerda, por exemplo, mostra os pontos de B e cores-los de acordo com suas distâncias R . Os papéis de B e R são trocados no mapa certo.
Isso já ajuda a fazer comparações: cada mapa mostra os pontos de um conjunto de dados e, pelo uso de cores, enfatiza os pontos que estão longe de qualquer ponto no outro conjunto de dados. Observe que os dois mapas são necessários para a comparação, porque cada um mostra pontos que não estão no outro.
Em mapas detalhados, a cor pode ser difícil de ver; portanto, podemos optar por desfocá-la um pouco para apresentação ou avaliação visual:
Nota: as cores não são comparáveis entre os dois mapas: dentro de cada mapa, elas são dimensionadas para mostrar toda a gama de distâncias nesse mapa.
Análise estatística das diferenças
A beleza dessa abordagem está no que pode ser feito no pós-processamento. Usando uma varredura para representar a distância transformada e suas sobreposições, podemos obter facilmente estatísticas - locais e globais - para medir as discrepâncias. Por exemplo, podemos nos concentrar em todas as distâncias maiores do que um pequeno limiar para explorar sua distribuição de frequência:
Neste histograma, barras azuis são para os recursos azuis, barras vermelhas para os recursos vermelhos. (Observe a escala logarítmica no eixo horizontal.) Este histograma mostra os dados sobrepostos originais, não os dados desfocados derivados. Ele selecionou apenas as distâncias maiores que três pixels na imagem original.
Esses histogramas mostram que é muito mais provável que os traços azuis fiquem longe dos traços vermelhos do que vice-versa : as barras azuis são mais altas que as vermelhas e se estendem a distâncias maiores (à direita). Todo o arsenal de estatísticas descritivas está agora disponível para quantificar as diferenças entre os dois conjuntos de dados. Essas estatísticas podem ser aplicadas a toda a região de interesse ou "em janela" sobre ela para explorar como os dois conjuntos de dados diferem de acordo com o local.
Implementação
A maioria dos GIS raster fornece uma transformação de distância euclidiana (como EuclideanDistance no ArcGIS e r.grow.distance no GRASS), e todas suportam a sobreposição simples (mascaramento) necessária para fazer essa análise. O desfoque, se desejado, pode ser feito com uma média de vizinhança ou convolução do kernel (que inclui o "desfoque gaussiano" disponível em todos os softwares de processamento de imagem). A maioria dos GISes que não fornecem suporte adequado para análise estatística completa de dados raster, embora, mas eles são bons em exportar esses dados em formatos legíveis por software estatístico e matemático, como R
ou Mathematica (que fez todas as figuras aqui).