Como comparo dois mapas para determinar qual é o melhor?

Estou tentando fazer uma comparação objetiva de dois mapas diferentes para a mesma região. No momento, estou lutando com a definição de critérios que me permitam fazer uma avaliação desapaixonada.

Alguém tem alguma idéia de como fazer isso ou como devo abordar o problema?

Como você pode ver, nenhum mapa é superior, algumas lacunas no conjunto azul, outras no vermelho.

insira a descrição da imagem aqui

cartography data-quality

— Styp
fonte

A questão está muito mal definida? O que você quer dizer com qualidade? Existem pressupostos sobre integridade, precisão, geometria ...? Existe um terceiro conjunto de dados de referência com o qual comparar?

— precisa saber é

Apenas um pensamento, por que não compará-los usando imagens aéreas de alta resolução? Talvez até os converta em KML e avalie sua precisão no Google Earth.

— Aaron

@ Martin, você está pedindo um método para destacar as diferenças geométricas das duas camadas?

— artwork21

Há muita literatura sobre o assunto. Alguns documentos para você começar: underdark.wordpress.com/projects/…

— underdark

Essa pergunta realmente não tem muito a ver com cartografia ou mapas, mas com a qualidade dos dados? Talvez você possa reformular sua pergunta e fornecer mais contexto no lado da qualidade dos dados.

— precisa saber é o seguinte

Respostas:

Esta resposta descreve um método objetivo para medir discrepâncias arbitrárias entre dois conjuntos de dados espaciais. Essas discrepâncias podem incluir mudanças de posição, mudanças de forma e recursos presentes em um conjunto de dados, mas não em outro. Essa resposta não fornece meios para determinar qual é "melhor", porque isso depende de muito mais do que apenas os dados e depende particularmente de para que os dados serão usados.

fundo

Uma boa base para um grande conjunto de tais medidas depende da transformação da distância euclidiana de cada conjunto de dados. Isso visualiza cada conjunto de dados como representando uma coleção de pontos no plano. Vamos chamar essas coleções de B para os recursos azuis e R para os recursos vermelhos.

Para qualquer ponto x no plano, a distância Euclidiana transformar de um conjunto de pontos A calcula a maior limite inferior das distâncias entre x e A . Podemos pensar esta transformação como a criação de uma "superfície", cuja altura x é igual a menor distância x para A . Assim, esta superfície tem vales em todos os pontos de um , em que a sua altura é igual a zero, e sobe na proporção de 1: 1 declive longe de um . É claro que a transformação de distância, por sua vez, determina A (ou tecnicamente seu fechamento métrico , que para os conjuntos de dados GIS é o mesmo que A) como o conjunto de todos os pontos a uma altura de zero. Assim, a transformação de distância captura completamente todas as informações espaciais de A que o GIS é capaz de representar.

figura 1

Esta figura mostra as transformações de distância de B (à esquerda) e R (à direita) em pseudo-relevo.

Comparando dois conjuntos de dados

Para comparar B e R , sobreponha cada um à transformação de distância da outra:

Figura 2

Os valores da distância são mostrados como cores graduadas de azuis (próximo de 0) a vermelhos.

O mapa da esquerda, por exemplo, mostra os pontos de B e cores-los de acordo com suas distâncias R . Os papéis de B e R são trocados no mapa certo.

Isso já ajuda a fazer comparações: cada mapa mostra os pontos de um conjunto de dados e, pelo uso de cores, enfatiza os pontos que estão longe de qualquer ponto no outro conjunto de dados. Observe que os dois mapas são necessários para a comparação, porque cada um mostra pontos que não estão no outro.

Em mapas detalhados, a cor pode ser difícil de ver; portanto, podemos optar por desfocá-la um pouco para apresentação ou avaliação visual:

Figura 3

Nota: as cores não são comparáveis entre os dois mapas: dentro de cada mapa, elas são dimensionadas para mostrar toda a gama de distâncias nesse mapa.

Análise estatística das diferenças

A beleza dessa abordagem está no que pode ser feito no pós-processamento. Usando uma varredura para representar a distância transformada e suas sobreposições, podemos obter facilmente estatísticas - locais e globais - para medir as discrepâncias. Por exemplo, podemos nos concentrar em todas as distâncias maiores do que um pequeno limiar para explorar sua distribuição de frequência:

Figura 4

Neste histograma, barras azuis são para os recursos azuis, barras vermelhas para os recursos vermelhos. (Observe a escala logarítmica no eixo horizontal.) Este histograma mostra os dados sobrepostos originais, não os dados desfocados derivados. Ele selecionou apenas as distâncias maiores que três pixels na imagem original.

Esses histogramas mostram que é muito mais provável que os traços azuis fiquem longe dos traços vermelhos do que vice-versa : as barras azuis são mais altas que as vermelhas e se estendem a distâncias maiores (à direita). Todo o arsenal de estatísticas descritivas está agora disponível para quantificar as diferenças entre os dois conjuntos de dados. Essas estatísticas podem ser aplicadas a toda a região de interesse ou "em janela" sobre ela para explorar como os dois conjuntos de dados diferem de acordo com o local.

Implementação

A maioria dos GIS raster fornece uma transformação de distância euclidiana (como EuclideanDistance no ArcGIS e r.grow.distance no GRASS), e todas suportam a sobreposição simples (mascaramento) necessária para fazer essa análise. O desfoque, se desejado, pode ser feito com uma média de vizinhança ou convolução do kernel (que inclui o "desfoque gaussiano" disponível em todos os softwares de processamento de imagem). A maioria dos GISes que não fornecem suporte adequado para análise estatística completa de dados raster, embora, mas eles são bons em exportar esses dados em formatos legíveis por software estatístico e matemático, como Rou Mathematica (que fez todas as figuras aqui).

— whuber
fonte

Como sempre, sua resposta é uma leitura fascinante, e eu consigo encontrar coisas novas para aprender e pensar. Você também poderia me dizer como criou o tipo de gráfico 'desenhado à mão'?

— Devdatta Tengshe

@Devdatta O histograma foi criado no Mathematica após o processamento com uma modificação do código em mathematica.stackexchange.com/questions/11350/xkcd-style-graphs . Exemplos adicionais desses gráficos estão em stats.stackexchange.com/questions/49123/… e stats.stackexchange.com/questions/48973/… e stats.stackexchange.com/questions/48467/… .

— whuber

Como é um problema de validação de geometria, carregue as imagens atuais e veja se você pode validar as ruas como existentes ou como presentes. Provavelmente, um conjunto de dados é mais recente e / ou mais completo. Descubra qual conjunto de dados tem a maior precisão horizontal e quais foram coletados mais recentemente e por qual processo. É uma diferença entre os traços de tigre, osm, gis e gps? As imagens são suas amigas aqui, pelo menos imagens precisas como a HAIP da safra recente. O critério pode ser, integridade, cobertura, precisão, exatidão, moeda.

— Lewis
fonte

Eu acho que seguindo os comentários e respostas acima (talvez esse também deva ser um comentário, e não uma resposta), mas eu usaria o mapeamento que tenho disponível para validar os arquivos por comparação visual. Escolha os recursos onde há dados plotados precisos disponíveis, como as redes rodoviárias (na Inglaterra, Escócia e País de Gales estão disponíveis gratuitamente no SO).

Seguindo a sugestão de usar o Google Earth e as imagens. Use o plugin openlayers para carregar imagens de satélite em segundo plano e comparar novamente.

Muitos mapas precisos gratuitos estão disponíveis para serem usados como base de comparação.

— Ger
fonte

Infelizmente, comecei a fazer essa comparação com base no fato de que o OSM e outros mapas de código aberto não são realmente tão precisos quanto parecemos pensar. Mas a entrada no uso de imagens de satélite é uma pista a seguir!

— Styp