Eu tenho alguns dados multivariados de beleza versus idades. As idades variam de 20 a 40 anos em intervalos de 2 (20, 22, 24 ... 40) e, para cada registro de dados, recebem uma idade e uma classificação de beleza de 1 a 5. Quando faço boxplots desses dados (idades no eixo X, classificações de beleza no eixo Y), há alguns valores discrepantes plotados fora dos bigodes de cada caixa.
Quero remover esses outliers do próprio quadro de dados, mas não tenho certeza de como R calcula outliers para seus gráficos de caixa. Abaixo está um exemplo de como meus dados podem ser.
boxplot
função retorna os outliers (entre outras estatísticas) de forma invisível. Tentefoo <- boxplot(...); foo
ler?boxplot
para entender a saída.