Estou interessado na definição de quartil que geralmente é usada quando você está em estatística básica. Eu tenho um livro do tipo Stat 101 e apenas fornece uma definição intuitiva. "Cerca de um quarto dos dados cai no ou no primeiro quartil ..." Mas, dá um exemplo em que calcula Q1, Q2 e Q3 para o conjunto de dados
5, 7, 9, 10, 11, 13, 14, 15, 16, 17, 18, 18, 20, 21, 37
Como existem 15 dados, ele escolhe 15 como a mediana, Q2. Em seguida, divide os dados restantes em duas metades, de 5 a 14 e de 16 a 37. Cada um deles contém 7 dados e encontram a mediana de cada um desses conjuntos, 10 e 18, como Q1 e Q3, respectivamente. É assim que eu próprio calcularia.
Eu olhei para o artigo da Wikipedia e dá dois métodos. Alguém concorda com o exposto acima e diz que você também pode incluir a mediana 15 em ambos os conjuntos (mas você não incluiria a mediana se fosse a média dos dois números do meio no caso de um número par de pontos de dados). Tudo isso faz sentido para mim.
Mas, verifiquei o Excel para ver como o Excel calcula. Estou usando o Excel 2010, que possui 3 funções diferentes. O quartil estava disponível em 2007 e versões anteriores. Parece que eles querem que você pare de usar isso em 2010, mas ainda está disponível. Quartile.Inc é novo, mas concorda exatamente com Quartile, tanto quanto eu posso dizer. E há o Quartile.Exc também. Ambos os dois últimos são novos em 2010, acredito. Dessa vez, tentei usar os números inteiros 1, 2, 3, ..., 10. Espero que o Excel dê mediana de 5,5, Q1 de 3 e Q3 de 8. O método do livro de estatísticas também como os dois métodos da Wikipedia dariam essas respostas, já que a mediana é a média dos dois números do meio. Excel dá
quartile number, Quartile.Inc, Quartile.Exc
1, 3.25, 2.75
2, 5.5, 5.5
3, 7.75, 8.25
Nenhuma delas concorda com o que eu falei anteriormente.
As descrições no arquivo de ajuda para o Excel são:
Quartile.Inc - Retorna o quartil de um conjunto de dados, com base em valores de percentil de 0..1, inclusive.
Quartile.Exc - Retorna o quartil do conjunto de dados, com base em valores de percentil de 0..1, exclusivos.
Alguém pode me ajudar a entender essa definição que o Excel está usando?