Suponha que é um vetor que se supõe ter uma distribuição multivariada de média desconhecida e matriz de variância-covariância conhecida . Observamos nesta distribuição e desejamos prever partir desta informação usando um preditor linear imparcial: (μ,μ,…,μ)Σ ( z 1 , z 2 , … , z n ) z 0( Z0 0, Z1 1, … , Zn)( μ , μ , … , μ )Σ( z1 1, z2, … , Zn) z0 0
- Linear significa que a previsão deve assumir a forma para que os coeficientes sejam determinados. Esses coeficientes podem depender, no máximo, do que é conhecido antecipadamente: as entradas de .λiΣz0 0^= λ1 1z1 1+ λ2z2+ ⋯ + λnznλEuΣ
Esse preditor também pode ser considerado uma variável aleatória .Z0 0^= λ1 1Z1 1+ λ2Z2+ ⋯ + λnZn
- Imparcial significa que a expectativa de é igual à sua (desconhecida) média . μZ0 0^μ
Escrever as coisas fornece algumas informações sobre os coeficientes:
μ= E[ Z0 0^]=E[λ1Z1+λ2Z2+⋯+λnZn]=λ1E[Z1]+λ2E[Z2]+⋯+λnE[Zn]=λ1μ+⋯+λnμ=(λ1+⋯+λn)μ.
A segunda linha é devido à linearidade da expectativa e todo o resto é álgebra simples. Como esse procedimento deve funcionar independentemente do valor de , evidentemente os coeficientes precisam somar à unidade. Escrevendo os coeficientes na notação vetorial , isso pode ser escrito com .λ = ( λ i ) ′ 1 λ = 1μλ=(λi)′1λ=1
Entre o conjunto de todos esses preditores lineares imparciais, buscamos um que se desvie o mínimo possível do valor real , medido no quadrado médio da sala. Novamente, isso é uma computação. Baseia-se na bilinearidade e simetria da covariância, cuja aplicação é responsável pelos somatórios da segunda linha:
E[(Z0^−Z0)2]=E[(λ1Z1+λ2Z2+⋯+λnZn−Z0)2]=∑i=1n∑j=1nλiλjvar[Zi,Zj]−2∑i=1nλivar[Zi,Z0]+var[Z0,Z0]=∑i=1n∑j=1nλiλjΣi,j−2∑i=1nλiΣ0,i+Σ0,0.
De onde os coeficientes podem ser obtidos minimizando esta forma quadrática sujeita à restrição (linear) . Isso é facilmente resolvido usando o método dos multiplicadores de Lagrange, produzindo um sistema linear de equações, as "equações de Kriging".1λ=1
Na aplicação, é um processo estocástico espacial ("campo aleatório"). Isso significa que, para qualquer conjunto determinado de locais fixos (não aleatórios) , o vetor de valores de nesses locais é aleatório com algum tipo de distribuição multivariada. Escreva e aplique a análise anterior, assumindo que os meios do processo em todos os locais são os mesmos e assumindo a matriz de covariância dos valores do processo nesses locais é conhecido com certeza.Zx0,…,xnZ( Z( x0 0) , … , Z( xn) ))ZEu= Z( xEu)n + 1xEun + 1
Vamos interpretar isso. Sob as premissas (incluindo média constante e covariância conhecida), os coeficientes determinam a variação mínima atingível por qualquer estimador linear. Vamos chamar essa variação de ("OK" é para "krigagem comum"). Depende apenas da matriz . Ele nos diz que, se formos amostrar repetidamente de e usar esses coeficientes para prever os valores valores restantes a cada vez,σ2O KΣ( Z0 0, … , Zn)z0 0
Em média, nossas previsões seriam corretas.
Normalmente, nossas previsões de se desviaram de dos valores reais de .z0 0σO Kz0 0
Muito mais precisa ser dito antes que isso possa ser aplicado a situações práticas, como estimar uma superfície a partir de dados pontuais: precisamos de suposições adicionais sobre como as características estatísticas do processo espacial variam de um local para outro e de uma realização para outra (embora , na prática, geralmente apenas uma realização estará disponível). Mas essa exposição deve ser suficiente para acompanhar como a busca por um "melhor" preditor linear imparcial ("BLUP") leva diretamente a um sistema de equações lineares.
A propósito, krigar como normalmente praticado não é exatamente o mesmo que estimativa de mínimos quadrados, porque é estimado em um procedimento preliminar (conhecido como "variografia") usando os mesmos dados. Isso é contrário às premissas dessa derivação, que assumiram que era conhecido (e a fortiori independente dos dados). Assim, desde o início, o kriging possui algumas falhas conceituais e estatísticas incorporadas. Os praticantes atenciosos sempre estiveram cientes disso e encontraram várias maneiras criativas de (tentar) justificar as inconsistências. (Ter muitos dados pode realmente ajudar.) Agora existem procedimentos para estimar simultaneamenteΣΣΣe prever uma coleção de valores em locais desconhecidos. Eles exigem suposições um pouco mais fortes (normalidade multivariada) para realizar esse feito.