Estou confuso com o seguinte e não consegui descobrir a resposta em nenhum outro lugar.
Estou tentando aprender R ao fazer algumas estatísticas e, como exercício, tento verificar novamente os resultados das funções R incorporadas, fazendo-as também 'à mão', por assim dizer, na R. , para o teste de Kruskal-Wallis, continuo obtendo resultados diferentes e não consigo entender o porquê.
Por exemplo, estou vendo os seguintes dados distribuídos em um exercício
activity <- c(2, 4, 3, 2, 3, 3, 4, 0, 4, 3, 4, 0, 0, 1, 3, 1, 2, 0, 3, 1, 0, 3, 4, 0, 1, 2, 2, 2, 3, 2)
group <- c(rep("A", 11), rep("B", 10), rep("C", 9))
group <- factor(group)
data.raw <- data.frame(activity, group)
E eu quero analisar a atividade por grupo. Primeiro, eu executo um teste de Kruskal-Wallis usando a função R integrada
kruskal.test(activity ~ group, data = data.raw)
O que retorna .
Para verificar novamente, tento fazer o mesmo 'à mão' em R, com o seguinte código (sem dúvida, indefeso)
rank <- rank(activity)
data.rank <- data.frame(rank, group)
rank.sum <- aggregate(rank ~ group, data = data.rank, sum)
x <- rank.sum[1,2]^2 / 11 + rank.sum[2,2]^2 / 10 + rank.sum[3,2]^2 / 9
H <- (12 / (length(activity) * (length(activity) + 1))) * x - 3 * (length(activity) + 1)
H
O que deve refletir a seguinte fórmula:
Onde é o número total de observações, é o número de grupos, é o número de observações no ésimo grupo e é a soma das classificações do ésimo grupo.g n i i R i i
E agora recebo , o que, aumentando a minha confusão, também é a resposta dada para o exercício em questão. Eu tentei isso para alguns conjuntos de dados diferentes e tenho a tendência de obter um valor um pouco mais alto para usando a função incorporada.H
Eu tentei procurar descobrir o que estou fazendo de errado ou não entendendo, mas sem sucesso. Alguém pode me ajudar a entender por que a kruskal.test
função embutida retorna um valor diferente daquele que recebo explicando as coisas?