Atualmente, estou trabalhando em uma maneira de transformar dois valores de teste de fósforo diferentes um no outro.
fundo
Existem muitos métodos (de extração) para medir o fósforo disponível na planta no solo. Países diferentes aplicam métodos diferentes; portanto, para comparar a fertilidade P entre países, é necessário calcular o valor do teste P x com base no valor do teste P ye vice-versa. Portanto, resposta e covariável são intercambiáveis.
Quantidade de P no extrator 1 = P_CAL em [mg / 100g de solo]
Quantidade de P no extrator 2 = P_DL em [mg / 100g de solo]
Para estabelecer essa "equação de transformação", o conteúdo de P de 136 amostras de solo foi analisado com extrato de CAL e DL. Parâmetros adicionais como pH do solo, carbono orgânico total, nitrogênio total, argila e carbonato também foram medidos. O objetivo é derivar um modelo de regressão simples. Em uma segunda etapa, também um modelo múltiplo.
Para fornecer uma visão geral dos dados, mostro dois gráficos de dispersão com uma linha de regressão linear simples (OLS).
Questões:
No meu entender, a definição de regressão é adequada se a variável resone (y) e explicativa (x) tiverem erros (de medição) e forem intercambiáveis. A regressão de Deming assume que a taxa de variação é conhecida. Como não tenho detalhes sobre a precisão das medições de extração de P, existe outra maneira de determinar a razão de variância? Qual variação significa aqui? Presumo que NÃO é calculado var(DL_P)/var(CAL_P)
?
Q1: Como determino a taxa de variação para definir a regressão?
Um caso especial de deming regressão é a regressão ortogonal. Pressupõe razão de variância = 1.
P2: Existe uma maneira de diagnosticar se a suposição δ = 1 está "aproximadamente" correta ou se a suposição (falsa) acarreta erros de previsão elevados?
Se eu assumir δ = 1, a regressão ortogonal fornece a seguinte saída (arredondada)
library(MethComp)
deming <- Deming(y=P_CAL, x=P_DL, vr=1)
Interceptação: 0,75; Inclinação: 0,71; sigma P_DL: 3,17; sigma P_CAL: 3.17
A plotagem da linha de regressão de deming nas plotagens acima mostra que a regressão de deming é muito próxima da regressão a) CAL-P = f (DL-P), mas muito diferente de b) DL-P = f (CAL-P) equação.
Q3: é correto que, na regressão ortogonal, CAL-P = f (DL-P) e DL-P = f (CAL-P) sejam expressos com a mesma equação? Caso contrário, como derivar equações corretas para ambos? Do que sinto falta aqui?
Devido às propriedades de ambas as soluções de extração, os valores de DL-P tendem a ser cerca de 25% mais altos que os valores de CAL-P, portanto, CAL-P = f (DL-P) deve ter uma inclinação maior que DL-P = f (CAL -P). No entanto, isso não é expresso na deposição de regressão quando há apenas uma inclinação. O que me deixa com minha pergunta final.
Q4: a análise da regressão é uma abordagem válida para o meu propósito?