O I de Moran , uma medida de autocorrelação espacial, não é uma estatística particularmente robusta (pode ser sensível a distribuições distorcidas dos atributos de dados espaciais).
Quais são algumas técnicas mais robustas para medir a autocorrelação espacial? Estou particularmente interessado em soluções prontamente disponíveis / implementáveis em uma linguagem de script como R. Se as soluções se aplicarem a circunstâncias / distribuições de dados exclusivas, especifique-as na sua resposta.
EDIT : Estou expandindo a pergunta com alguns exemplos (em resposta a comentários / respostas à pergunta original)
Foi sugerido que as técnicas de permutação (onde uma distribuição de amostragem de Moran I é gerada usando um procedimento de Monte Carlo) oferecem uma solução robusta. Meu entendimento é que esse teste elimina a necessidade de fazer suposições sobre a distribuição I de Moran (dado que a estatística do teste pode ser influenciada pela estrutura espacial do conjunto de dados), mas não consigo ver como a técnica de permutação corrige não-normalmente dados de atributo distribuído . Ofereço dois exemplos: um que demonstra a influência de dados distorcidos na estatística I local de Moran, o outro na I global de Moran - mesmo sob testes de permutação.
Vou usar Zhang et al. 's (2008) analisa como o primeiro exemplo. Em seu artigo, eles mostram a influência da distribuição de dados de atributos no I local de Moran usando testes de permutação (9999 simulações). Reproduzi os resultados do ponto de acesso dos autores para concentrações de chumbo (Pb) (no nível de confiança de 5%) usando os dados originais (painel esquerdo) e uma transformação de log dos mesmos dados (painel direito) no GeoDa. Também são apresentados gráficos de caixas das concentrações de Pb original e transformada em log. Aqui, o número de pontos de acesso significativos quase dobra quando os dados são transformados; este exemplo mostra que a estatística local é sensível à atribuição de distribuição de dados - mesmo ao usar técnicas de Monte Carlo!
O segundo exemplo (dados simulados) demonstra a influência que os dados distorcidos podem ter no I de Moran global , mesmo ao usar testes de permutação. Um exemplo, em R , segue:
library(spdep)
library(maptools)
NC <- readShapePoly(system.file("etc/shapes/sids.shp", package="spdep")[1],ID="FIPSNO", proj4string=CRS("+proj=longlat +ellps=clrk66"))
rn <- sapply(slot(NC, "polygons"), function(x) slot(x, "ID"))
NB <- read.gal(system.file("etc/weights/ncCR85.gal", package="spdep")[1], region.id=rn)
n <- length(NB)
set.seed(4956)
x.norm <- rnorm(n)
rho <- 0.3 # autoregressive parameter
W <- nb2listw(NB) # Generate spatial weights
# Generate autocorrelated datasets (one normally distributed the other skewed)
x.norm.auto <- invIrW(W, rho) %*% x.norm # Generate autocorrelated values
x.skew.auto <- exp(x.norm.auto) # Transform orginal data to create a 'skewed' version
# Run permutation tests
MCI.norm <- moran.mc(x.norm.auto, listw=W, nsim=9999)
MCI.skew <- moran.mc(x.skew.auto, listw=W, nsim=9999)
# Display p-values
MCI.norm$p.value;MCI.skew$p.value
Observe a diferença nos valores-P. Os dados distorcidos indicam que não há agrupamento no nível de significância de 5% (p = 0,167), enquanto os dados normalmente distribuídos indicam que existe (p = 0,013).
Chaosheng Zhang, Lin Luo, Weilin Xu, Valerie Ledwith, Uso de I e GIS locais de Moran para identificar pontos críticos de poluição do Pb em solos urbanos de Galway, Irlanda, Science of The Total Environment, Volume 398, Ed. 1-3, 15 de julho de 2008 , Páginas 212-221