Estou usando o pacote quantreg para criar um modelo de regressão usando o percentil 99 dos meus valores em um conjunto de dados. Com base nos conselhos de uma pergunta anterior sobre o stackoverflow que fiz, usei a seguinte estrutura de código.
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
que mostro plotados em cima dos meus dados. Eu plotei isso usando ggplot2, com um valor alfa para os pontos. Eu acho que a cauda da minha distribuição não está sendo considerada suficientemente na minha análise. Talvez isso se deva ao fato de que existem pontos individuais que estão sendo ignorados pela medida do tipo percentil.
Um dos comentários sugeriu que
A vinheta do pacote inclui seções sobre regressão quantil não linear e também modelos com splines de suavização etc.
Com base na minha pergunta anterior, assumi uma relação logarítmica, mas não tenho certeza se isso está correto. Eu pensei que poderia extrair todos os pontos no intervalo do percentil 99 e depois examiná-los separadamente, mas não tenho certeza de como fazer isso ou se essa é uma boa abordagem. Gostaria de receber algum conselho sobre como melhorar a identificação desse relacionamento.