Um banco de dados de (população, área, forma) pode ser usado para mapear a densidade populacional atribuindo um valor constante de população / área a cada forma (que é um polígono, como um bloco de recenseamento, área, município, estado, qualquer que seja). No entanto, as populações geralmente não são distribuídas uniformemente dentro de seus polígonos. O mapeamento dasimétrico é o processo de refinar essas estimativas de densidade por meio de dados auxiliares. É um problema importante nas ciências sociais, como indica esta revisão recente .
Suponha, então, que tenhamos disponível um mapa auxiliar da cobertura do solo (ou qualquer outro fator discreto). No caso mais simples, podemos usar áreas obviamente inabitáveis, como corpos d'água, para delinear onde a população não está e, consequentemente, atribuir toda a população às demais áreas. De maneira mais geral, cada unidade do Censo é esculpida em partes com áreas de superfície , . Nosso conjunto de dados é aumentado para uma lista de tuplas
onde é a população (assumida medida sem erro) na unidade j e - embora este não seja estritamente o caso - podemos assumir que cada x_ {ji} também é exatamente medido. Nesses termos, o objetivo é particionar cada y_ {j} em uma soma
onde cada e estima a população dentro da unidade reside na classe de cobertura do solo . As estimativas precisam ser imparciais. Essa partição refina o mapa de densidade populacional atribuindo a densidade à interseção do polígono do censo e a classe de cobertura da terra . z j i j i z j i / x j i j th i th
Esse problema difere das configurações de regressão padrão de maneiras destacadas:
- O particionamento de cada deve ser exato.
- Os componentes de cada partição devem ser não negativos.
- Não existe (por suposição) nenhum erro em nenhum dado: toda a população conta e todas as áreas estão corretas. x j i
Existem muitas abordagens para uma solução, como o método de " mapeamento dasimétrico inteligente ", mas todas as que eu já li têm elementos ad hoc e um potencial óbvio de viés. Estou procurando respostas que sugeram métodos estatísticos criativos e tratáveis por computador. A aplicação imediata refere-se a uma coleção de c. - Unidades censitárias com uma média de 40 pessoas cada (embora uma fração considerável tenha 0 pessoas) e cerca de uma dúzia de classes de cobertura da terra. 10 6