O teste de Mantel é amplamente utilizado em estudos biológicos para examinar a correlação entre a distribuição espacial dos animais (posição no espaço) com, por exemplo, sua relação genética, taxa de agressão ou algum outro atributo. Muitos periódicos bons estão usando ( PNAS, Comportamento Animal, Ecologia Molecular ... ).
Eu fabriquei alguns padrões que podem ocorrer na natureza, mas o teste de Mantel parece ser bastante inútil para detectá-los. Por outro lado, os de I de Moran obtiveram melhores resultados (consulte os valores de p em cada gráfico) .
Por que os cientistas não usam o eu de Moran? Existe algum motivo oculto que eu não vejo? E se houver algum motivo, como posso saber (como as hipóteses devem ser construídas de maneira diferente) usar adequadamente o teste de Mantel ou de Moran? Um exemplo da vida real será útil.
Imagine esta situação: existe um pomar (17 x 17 árvores) com um corvo em cada árvore. Níveis de "ruído" para cada corvo estão disponíveis e você deseja saber se a distribuição espacial dos corvos é determinada pelo ruído que eles produzem.
Existem (pelo menos) 5 possibilidades:
"Aves de uma pluma voam juntas." Quanto mais os corvos são semelhantes, menor a distância geográfica entre eles (cluster único) .
"Aves de uma pluma voam juntas." Novamente, quanto mais semelhantes forem os corvos, menor será a distância geográfica entre eles (vários aglomerados), mas um aglomerado de corvos barulhentos não tem conhecimento sobre a existência do segundo aglomerado (caso contrário, eles se fundiriam em um grande aglomerado).
"Tendência monotônica."
"Os opostos se atraem." Corvos semelhantes não podem se suportar.
"Padrão aleatório". O nível de ruído não tem efeito significativo na distribuição espacial.
Para cada caso, criei um gráfico de pontos e usei o teste de Mantel para calcular uma correlação (não é surpresa que seus resultados não sejam significativos, eu nunca tentaria encontrar associação linear entre esses padrões de pontos).
Dados de exemplo: (compactado possível)
r.gen <- seq(-100,100,5)
r.val <- sample(r.gen, 289, replace=TRUE)
z10 <- rep(0, times=10)
z11 <- rep(0, times=11)
r5 <- c(5,15,25,15,5)
r71 <- c(5,20,40,50,40,20,5)
r72 <- c(15,40,60,75,60,40,15)
r73 <- c(25,50,75,100,75,50,25)
rbPal <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289,
replace=TRUE))
# adding colors
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]
Criando matriz de distâncias geográficas (para I de Moran é invertida):
point.dists <- dist(cbind(my.data$x, my.data$y))
point.dists.inv <- 1/point.dists
point.dists.inv <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0
Criação de plotagem:
X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))
library(ape)
for (i in 3:7) {
my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="",
ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
text(4.5, -2.25, paste("Mantel's test", "\n z.stat =", round(my.res$z.stat,
2), "\n p.value =", round(my.res$p, 3)))
my.res <- Moran.I(my.data[ ,i], point.dists.inv)
text(12.5, -2.25, paste("Moran's I", "\n observed =", round(my.res$observed,
3), "\n expected =",round(my.res$expected,3), "\n std.dev =",
round(my.res$sd,3), "\n p.value =", round(my.res$p.value, 3)))
}
par(mar=c(5,4,4,2)+0.1)
for (i in 3:7) {
plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="geographical distance",
ylab="behavioural distance")
}
Nos exemplos do site de ajuda estatística da UCLA, os dois testes são usados exatamente nos mesmos dados e exatamente na mesma hipótese, o que não ajuda muito (cf. Teste de Mantel , I de Moran ).
Resposta ao IM Você escreveu:
... [Mantel] testa se corvos silenciosos estão localizados perto de outros corvos silenciosos, enquanto corvos barulhentos têm vizinhos barulhentos.
Eu acho que essa hipótese NÃO poderia ser testada pelo teste de Mantel . Em ambas as parcelas, a hipótese é válida. Mas se você supor que um cluster de corvos não barulhentos pode não ter conhecimento sobre a existência de um segundo cluster de corvos não barulhentos - o teste de Mantels é novamente inútil. Essa separação deve ser muito provável por natureza (principalmente quando você está realizando coleta de dados em maior escala).