Estou procurando pelo algoritmo de regressão linear mais adequado para dados cuja variável independente (x) possui um erro de medição constante e a variável dependente (y) possui um erro dependente do sinal.
A imagem acima ilustra minha pergunta.
Estou procurando pelo algoritmo de regressão linear mais adequado para dados cuja variável independente (x) possui um erro de medição constante e a variável dependente (y) possui um erro dependente do sinal.
A imagem acima ilustra minha pergunta.
Respostas:
Erro de medição na variável dependente
Dado um modelo linear geral com homosckedastic, não autocorrelacionado e não correlacionado com as variáveis independentes, deixe denotar a variável "verdadeira" e sua medida observável. O erro de medição é definido como sua diferença Assim, o modelo estimado é: Como são observado, podemos estimar o modelo por OLS. Se o erro de medição em for estatisticamente independente de cada variável explicativa, então
um estimador de mínimos quadrados ponderados (por exemplo, Kutner et al. , §11.1; Verbeek , §4.3.1-3);
o estimador OLS, que ainda é imparcial e consistente, e erros padrão consistentes com heterocedasticidade, ou simplesmente erros padrão Wite ( Verbeek , §4.3.4).
Erro de medição na variável independente
Dado o mesmo modelo linear que acima, deixe denotar o valor "true" e sua medida observável. O erro de medição é agora: Existem duas situações principais ( Wooldridge , §4.4.2).
: o erro de medição não está correlacionado com a medida observada e, portanto, deve ser correlacionado com a variável não observada ; escrevendo e conectando-o a (1): pois e ambos não são correlacionados com cada , incluindo , apenas a medição aumenta a variação do erro e não viola nenhuma das suposições do OLS;
x k y x 1 , … , x k : o erro de medição não está correlacionado com a variável não observada e, portanto, deve ser correlacionado com a medida observada ; essa correlação causa prolongamentos e a regressão OLS de em geralmente fornece estimadores tendenciosos e inconsistentes.
Tanto quanto posso adivinhar, olhando para seu gráfico (erros centrados nos valores "verdadeiros" da variável independente)), o primeiro cenário pode ser aplicado.