Medindo a diferença de desempenho entre Mesclar e Anexar no ArcGIS Desktop?


12

Frequentemente, me encontro em uma situação em que não me importo se minha ferramenta produz ou não uma nova classe de recurso, mas me importo quanto tempo leva para combinar todos os meus grandes conjuntos de dados. Demora mais tempo para produzir uma nova classe de recurso usando a ferramenta Mesclar em vez da ferramenta Anexar ou Merge e Anexar são essencialmente os mesmos em termos de desempenho?


2
Algumas evidências anedóticas: Eu sempre achei o Merge mais rápido, especialmente quando lidava com grandes quantidades de recursos.
Devdatta Tengshe

mas Anexar funciona melhor quando você tem domínios e subtipos predefinidos.
Mapperz

Respostas:


6

A mesclagem utiliza geometria e atributos e combina (mescla) todo o conjunto de dados em um novo conjunto de dados do recurso. insira a descrição da imagem aqui

Anexar é uma boa maneira de associar dados extras a um conjunto de dados existente - ele pode ter opções para controlar os subtipos de recursos que estão sendo anexados.

http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000055000000

A principal diferença é

Se o Tipo de Esquema TEST for especificado, o esquema (definições de campo) dos conjuntos de dados de entrada deve corresponder ao do conjunto de dados de destino para que os recursos sejam anexados. Se o Tipo de Esquema NO_TEST for especificado, o esquema do conjunto de dados de entrada (definições de campo) não precisará corresponder ao conjunto de dados de destino. No entanto, quaisquer campos dos conjuntos de dados de entrada que não correspondam aos campos do conjunto de dados de destino não serão mapeados para o conjunto de dados de destino, a menos que o mapeamento seja definido explicitamente no controle Mapa de Campo.

subtipo (Opcional) Uma descrição de subtipo para atribuir esse subtipo a todos os novos dados anexados ao conjunto de dados de destino.

http://resources.arcgis.com/en/help/main/10.1/index.html#//001700000050000000

insira a descrição da imagem aqui

Você pode estar interessado no 'Processamento lado a lado de grandes conjuntos de dados'

http://resources.arcgis.com/en/help/main/10.1/index.html#//01m10000000r000000


1
Estou ciente das diferenças entre as ferramentas, mas estou me perguntando se essas diferenças levam a uma diferença significativa no tempo de processamento. Normalmente, uso NO_TEST ao usar a ferramenta de acréscimo, pois asseguro que minhas definições de campo correspondam antes de acrescentar / mesclar.
MTerry

5

Tome essas respostas com base nas próprias ferramentas e não em uma referência real:

A ferramenta de mesclagem cria uma nova classe de recurso, que leva tempo por si só, antes de reunir os dois conjuntos de dados.

A ferramenta de acréscimo com a opção TEST pressupõe que ambos os conjuntos de dados tenham os mesmos campos (nomes de campos) e os agrupam sem precisar criar uma nova classe de recurso (soa mais rápido).

A ferramenta de acréscimo com a opção NO TEST permite que o mapeamento de campo seja combinado como classes de recursos que podem ter nomes de campos diferentes. Isso requer alguns testes condicionais nos bastidores, o que levaria mais tempo.

À medida que o tamanho do conjunto de dados aumenta, a quantidade de tempo que leva para criar um novo fc parece insignificante. A única maneira de saber com certeza seria fazer alguns benchmarks com seus grandes conjuntos de dados e postar as respostas aqui!

Eu suspeito que a diferença não é muito, é mais o que você deseja da ferramenta no final (mapeamento de campo vs. nova classe de recurso vs. nenhuma nova classe de recurso)


0

Acabei de executar todas as três variantes. Eu sempre combinei os mesmos 63 shapefiles. Cada shapefile contém cerca de 63000 pontos criados a partir de uma operação RasterToPoint. Todos os shapefiles têm a mesma tabela de atributos.

As diferentes variantes precisavam dos seguintes tempos para compilar:

  • Mesclagem: 13 mins 57 segs
  • Anexar ao teste: 8 min. 34 seg.
  • Anexar com NO_TEST: 9 minutos e 12 segundos

Parece que Anexar com TESTE como parâmetro de entrada é o mais rápido. Obviamente, a escolha de qual Anexo usar não depende da velocidade, mas dos arquivos de entrada, conforme explicado acima.

Espero que seja útil.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.