Eu tenho alguns dados em [0,1] que gostaria de analisar com uma regressão beta. Obviamente, algo precisa ser feito para acomodar os valores 0,1. Não gosto de modificar dados para ajustar-se a um modelo. Também não acredito que a inflação zero e 1 seja uma boa ideia, porque acredito que, neste caso, deve-se considerar os 0 como valores positivos muito pequenos (mas não quero dizer exatamente qual valor é apropriado.) Eu acredito que seria escolher valores pequenos como .001 e .999 e ajustar o modelo usando o dist cumulativo para o beta.Portanto, para observações y_i, a probabilidade de log LL_iwould
if y_i < .001 LL+=log(cumd_beta(.001))
else if y_i>.999 LL+=log(1.0-cum_beta(.999))
else LL+=log(beta_density(y_i))
O que eu mais gosto nesse modelo é que, se o modelo de regressão beta é válido, ele também é válido, mas remove um pouco da sensibilidade aos valores extremos. No entanto, essa parece ser uma abordagem tão natural que me pergunto por que não encontro referências óbvias na literatura. Então, minha pergunta é, em vez de modificar os dados, por que não modificar o modelo. A modificação dos dados influencia os resultados (com base na suposição de que o modelo original é válido), enquanto a modificação do modelo iniciando os valores extremos não influencia os resultados.
Talvez haja um problema que estou ignorando?