No contexto de previsão, a remoção de valores discrepantes é muito perigosa. Por exemplo, você está prevendo vendas de uma mercearia. Digamos que houve uma explosão de gás no prédio vizinho, o que fez com que você fechasse a loja por alguns dias. Foi a única vez que a loja foi fechada em 10 anos. Assim, você obtém a série temporal, detecta o outlier, remove-o e projeta. Você silenciosamente assumiu que nada disso acontecerá no futuro. No sentido prático, você comprimiu sua variação observada, e as variações do coeficiente diminuíram. Portanto, se você mostrar as faixas de confiança para a sua previsão, elas serão mais estreitas do que teriam sido se você não removesse o outlier.
Obviamente, você pode manter a discrepância e prosseguir como de costume, mas essa também não é uma boa abordagem. A razão é que esse erro externo distorcerá os coeficientes.
Eu acho que uma abordagem melhor nesse caso é permitir uma distribuição de erro com caudas gordas, talvez uma distribuição estável. Nesse caso, seu erro externo não distorcerá muito os coeficientes. Eles ficarão próximos dos coeficientes com um outlier removido. No entanto, o outlier será exibido na distribuição de erros, a variação do erro. Essencialmente, você terá faixas de confiança de previsão mais amplas.
As faixas de confiança transmitem uma informação muito importante. Se você está prevendo que as vendas serão de US $ 1.000.000 este mês, mas há 5% de chance de serem US $ 10.000, isso afeta suas decisões sobre gastos, gerenciamento de caixa etc.