Preciso resolver um problema complicado de regressão no disco da unidade. A pergunta original atraiu alguns comentários interessantes, mas infelizmente nenhuma resposta. Enquanto isso, aprendi algo mais sobre esse problema, portanto tentarei dividir o problema original em subproblemas e verifico se desta vez tenho mais sorte.
Tenho 40 sensores de temperatura regularmente espaçados em um anel estreito dentro do disco da unidade:
Esses sensores adquirem temperatura no tempo. No entanto, como a variação do tempo é muito menor que a variação do espaço, vamos simplificar o problema ignorando a variabilidade do tempo e supor que cada sensor me dê apenas uma média de tempo. Isso significa que tenho 40 amostras (uma para cada sensor) e não tenho amostras repetidas.
Gostaria de construir uma superfície de regressão partir dos dados do sensor. A regressão tem dois objetivos:
- Preciso estimar um perfil médio de temperatura radial . Com a regressão linear, eu já estimo uma superfície que é a superfície média da temperatura, portanto, só preciso integrar minha superfície em relação a , certo? Se eu usar polinômios para regressão, essa etapa deve ser um pedaço de bolo.θ
- Preciso estimar um perfil de temperatura radial , de modo que, em cada posição radial, .P ( T ( ρ ) < T 95 ( ρ ) ) = 0,95
Dados esses dois objetivos, qual técnica devo usar para a regressão no disco da unidade? Obviamente, os Processos Gaussianos são comumente usados para regressão espacial. No entanto, a definição de um bom kernel para o disco da unidade não é trivial, portanto, gostaria de manter as coisas simples e usar polinômios, a menos que você sinta que é uma estratégia perdida. Eu li sobre os polinômios da Zernike . Os polinômios de Zernike parecem ser apropriados para a regressão sobre o disco da unidade, pois são periódicos em .
Depois que o modelo é escolhido, preciso escolher um procedimento de estimativa. Como esse é um problema de regressão espacial, erros em locais diferentes devem ser correlacionados. Os Mínimos Quadrados Ordinários assumem erros não correlacionados, portanto, acho que Mínimos Quadrados Generalizados seriam mais apropriados. O GLS parece uma técnica estatística relativamente comum, uma vez que existe uma gls
função na distribuição R padrão. No entanto, nunca usei o GLS e tenho dúvidas. Por exemplo, como faço para estimar a matriz de covariância? Um exemplo elaborado, mesmo com apenas alguns sensores, seria ótimo.
PS: Eu escolhi usar os polinômios Zernike e o GLS, porque me parece a coisa lógica a fazer aqui. No entanto, não sou especialista e, se você achar que estou indo na direção errada, fique à vontade para usar uma abordagem completamente diferente.