Introdução e Resumo
A Lei de Tobler da Geografia afirma
Tudo está relacionado a tudo o mais, mas coisas próximas são mais relacionadas que coisas distantes.
Kriging adota um modelo daqueles relacionamentos em que
"Coisas" são valores numéricos em locais na superfície da Terra (ou no espaço), geralmente representados como um plano euclidiano.
Estes valores numéricos são assumidos como realizações de variáveis aleatórias.
"Relacionado" é expresso em termos das médias e covariâncias dessas variáveis aleatórias.
(Uma coleção de variáveis aleatórias associadas a pontos no espaço é chamada de "processo estocástico".) O variograma fornece as informações necessárias para calcular essas covariâncias.
O que é Kriging
Kriging especificamente é a previsão de coisas em lugares onde elas não foram observadas. Para tornar o processo de previsão matematicamente tratável, Kriging limita as possíveis fórmulas a serem funções lineares dos valores observados. Isso torna o problema finito para determinar quais devem ser os coeficientes. Isso pode ser encontrado exigindo que o procedimento de previsão tenha certas propriedades. Intuitivamente, uma propriedade excelente é que as diferenças entre o preditor e o valor verdadeiro (mas desconhecido) tendem a ser pequenas: ou seja, o preditor deve ser preciso . Outra propriedade altamente elogiada, mas mais questionável, é que, em média, o preditor deve ser igual ao valor real: deve ser preciso .
(A razão pela qual insistir na precisão perfeita é questionável - mas não necessariamente ruim - é que geralmente torna qualquer procedimento estatístico menos preciso: ou seja, mais variável. Ao atirar em um alvo, você prefere espalhar os acertos uniformemente ao redor do alvo. raro e raramente atingindo o centro ou você aceitaria resultados focados logo ao lado, mas não exatamente, do centro? O primeiro é preciso, mas impreciso, enquanto o segundo é impreciso, mas preciso.)
Essas suposições e critérios - que meios e covariâncias são maneiras apropriadas de quantificar a relação, que uma previsão linear funcionará e que o preditor deve ser o mais preciso possível, sujeito a ser perfeitamente preciso - levam a um sistema de equações que possui um solução única, desde que as covariâncias tenham sido especificadas de maneira consistente . O preditor resultante é, assim, chamado de "BLUP": o melhor preditor imparcial linear.
Onde o Variograma entra
Para encontrar essas equações, é necessário operacionalizar o programa descrito. Isso é feito anotando as covariâncias entre o preditor e as observações consideradas variáveis aleatórias. A álgebra de covariâncias faz com que as covariâncias entre os valores observados também entrem nas equações de Kriging.
Nesse ponto, chegamos a um beco sem saída, porque essas covariâncias são quase sempre desconhecidas. Afinal, na maioria das aplicações, observamos apenas uma realização de cada uma das variáveis aleatórias: nosso conjunto de dados, que constitui apenas um número em cada local distinto. Digite o variograma: essa função matemática nos diz qual deve ser a covariância entre dois valores. É restrito a garantir que essas covariâncias sejam "consistentes" (no sentido de que nunca fornecerá um conjunto de covariâncias matematicamente impossíveis: nem todas as coleções de medidas numéricas de "parentesco" formarão matrizes reais de covariância ). É por isso que um variograma é essencial para Kriging.
Referências
Como a pergunta imediata foi respondida, vou parar por aqui. Os leitores interessados podem aprender como os variogramas são estimados e interpretados consultando bons textos, como Geoestatística de Mineração de Journel & Huijbregts (1978) ou Geoestatística Aplicada de Isaaks & Srivastava (1989). (Note-se que o processo de estimação introduz dois objetos chamado "variogramas": um empírico variograma derivada de dados e um modelo de variograma que é colocado a ele Todas as referências a "variograma" nesta resposta são para o modelo A chamada para.. vgm
Na questão retorna uma representação por computador de um variograma de modelo.) Para uma abordagem mais moderna na qual a estimativa de variograma e o Kriging são combinados adequadamente, consulte Diggle &Geoestatística baseada em modelo (2007) (que também é um manual estendido para os R
pacotes GeoR
e GeoRglm
).
Comentários
Aliás, esteja você usando o Kriging para previsão ou algum outro algoritmo, a caracterização quantitativa da relação fornecida pelo variograma é útil para avaliar qualquer procedimento de previsão. Observe que todos os métodos de interpolação espacial são preditores desse ponto de vista - e muitos deles são preditores lineares, como IDW (Distância Inversa Ponderada). O variograma pode ser usado para avaliar o valor médio e a dispersão (desvio padrão) de qualquer um dos métodos de interpolação. Assim, tem aplicabilidade muito além do seu uso no Kriging.
gstat
pacote R dos mesmos dados de uso.