Desde que seus dados venham de uma distribuição conhecida com propriedades conhecidas, é possível definir rigorosamente um outlier como um evento que é muito improvável que tenha sido gerado pelo processo observado (se você considerar "muito improvável" não rigoroso, então todo teste de hipótese é).
No entanto, essa abordagem é problemática em dois níveis: assume que os dados provêm de uma distribuição conhecida com propriedades conhecidas e traz o risco de que os outliers sejam vistos como pontos de dados que foram contrabandeados para o conjunto de dados por algumas fadas mágicas.
Na ausência de fadas de dados mágicos, todos os dados vêm de seu experimento e, portanto, não é possível ter discrepâncias, apenas resultados estranhos. Isso pode resultar de erros de gravação (por exemplo, uma casa de 400.000 quartos por 4 dólares), problemas sistemáticos de medição (o algoritmo de análise de imagem relata grandes áreas se o objeto estiver muito próximo da borda) problemas experimentais (às vezes, cristais precipitam da solução, que emitem um sinal muito alto) ou recursos do seu sistema (às vezes uma célula pode se dividir em três em vez de duas), mas também podem ser o resultado de um mecanismo que ninguém nunca considerou porque é raro e você está pesquisando, o que significa que algumas das coisas que você faz simplesmente ainda não são conhecidas.
Idealmente, dedique um tempo para investigar todos os erros extremos e remova-os do seu conjunto de dados depois de entender por que ele não se encaixa no seu modelo. Isso é demorado e subjetivo, pois as razões são altamente dependentes do experimento, mas a alternativa é pior: se você não entende de onde vieram os outliers, pode escolher entre deixar que os outliers atrapalhem seus resultados, ou definir uma abordagem "matematicamente rigorosa" para ocultar sua falta de entendimento. Em outras palavras, ao buscar o "rigor matemático", você escolhe entre não obter um efeito significativo e não entrar no céu.
EDITAR
Se tudo o que você tem é uma lista de números sem saber de onde eles vêm, você não tem como saber se algum ponto de dados é um erro externo, porque você sempre pode assumir uma distribuição em que todos os dados são internos.