O comentário de @Jerome Baum está no local. Para trazer a citação de Gelman aqui:
A detecção de outlier pode ser uma coisa boa. O problema é que os não estatísticos parecem gostar da palavra "outlier" sem tentar pensar no processo que cria o outlier, também alguns livros têm regras que parecem estúpidas para estatísticos como eu, regras como rotular algo como um outlier se mais do que um número de SDs da mediana, ou o que seja. O conceito de discrepante é útil, mas acho que requer contexto - se você rotula algo como discrepante, deseja tentar entender por que pensa isso.
Para adicionar um pouco mais, que tal primeiro definir outlier . Tente fazer isso rigorosamente sem se referir a algo visual como "parece que está longe de outros pontos". Na verdade, é bem difícil.
Eu diria que um outlier é um ponto altamente improvável, dado um modelo de como os pontos são gerados. Na maioria das situações, as pessoas não têm um modelo de como os pontos são gerados ou, se o fazem, são tão simplificados que podem estar errados a maior parte do tempo. Assim, como Andrew diz, as pessoas farão coisas como assumir que algum tipo de processo gaussiano está gerando pontos e, portanto, se um ponto for mais do que um certo número de SDs da média, é um erro. Matematicamente conveniente, não tão íntegro.
E nem chegamos a entender o que as pessoas fazem com discrepantes depois de identificadas. A maioria das pessoas quer jogar fora esses pontos inconvenientes, por exemplo. Em muitos casos, são os discrepantes que levam a descobertas e descobertas, e não os não discrepantes!
Há muita ad-hoc'ery na detecção de outlier, como praticado por não estatísticos, e Andrew se sente desconfortável com isso.