Desculpas se esta é uma pergunta muito básica.
Se tivermos dados que normalmente não são distribuídos (por exemplo, enviesados, o teste Shapiro-Wilk é significativo) e recorrermos a métodos baseados em classificação (por exemplo, teste Wilcoxon Signed Rank), então precisamos nos preocupar com discrepâncias?
Imagine, por exemplo, plotar os dados usando um boxplot e uma minoria de pontos de dados são marcados como outliers. Devemos transformar esses pontos? Ou removê-los? Parece-me que muitos livros didáticos falam sobre como lidar com discrepantes, mas apenas porque exercem uma grande influência sobre parâmetros como média e desvio padrão. No entanto, quando usamos um teste baseado em classificação, eles já serão 'transformados' para serem o próximo valor na classificação e, portanto, não exercerão grande influência no teste. Eu não vi isso declarado explicitamente em um livro de estatísticas até agora, então pensei em fazer a pergunta aqui.
Precisamos nos preocupar com discrepâncias ao usar testes baseados em classificação?